共查询到20条相似文献,搜索用时 78 毫秒
1.
2.
汉语自动分词实用系统CASS的设计和实现 总被引:9,自引:1,他引:8
近年来, 汉语自动分词成力中文信息处理的一大热门课题, 其研究进展令人关注。本文主旨, 是通过介绍CASS系统的设计和实现, 阐述汉语自动分词实用系统的一般性原理, 包括系统的总体结构、自动分词算法和分词词典的实现、各种多义切分字段的识别和处理, 等等。CASS系统由总控程序、自动分词程序、设施管理程序、分词词典和知识库等五大部分组成。自动分词算法程序选用正向增字最大匹配法ASM(+1,+1,+1)实现, 该算法的嵌套调用, 可以识别出各种多义切分字段, 包括任意多重的交集型多义字段。这个算法经过相应的运行控制, 可以实现其它各种分词方法。 相似文献
3.
4.
一、神经网络的基本特征和信息处理能力 神经网络是一个具有高度非线性的超大规模连续时间动力系统,其最主要特征为连续时间非线性动力学、网络的全局作用、大规模并行分布处理及高度的鲁棒性和学习联想能力。同时它又具有一般非线性动力系统的共性,即不可预测性、吸引性、耗散性、非平衡性、不可逆性、高维性、广泛联结性与自适应性等。因此它实际上是一个超大规模非线性连续时间自适应信息处理系统。 相似文献
5.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。 相似文献
6.
汉语自动分词技术的现状及发展趋势 总被引:11,自引:0,他引:11
一、汉语自动分词的提出与困难 汉语自动分词是80年代初期中文信息处理领域提出的重大课题,分为书面汉语分词和口词分词,前者指对键盘输入或以光电识别输入计算机的汉语进行处 相似文献
7.
8.
9.
神经网络专家系统集成式汉语自动分词技术 总被引:2,自引:0,他引:2
一、神经网络专家系统分词方法的基本构想 神经网络专家系统(NNES)是以人工神经网络为核心建造的一种集成式智能系统,它与传统的人工智能的关系不是简单取代而是互为补充辨证统一的关系,它不仅可以实现专家系统的基本功能,模仿人类专家的逻辑思维方式进行推理决策和问题求解;还具有学习能力、自适应能力、并行推理和联想记忆能力。 一个神经网络专家系统可以定义为一个四元组 NNES=(KB,NN,EX,SM) 相似文献
10.
11.
中文分词算法在搜索引擎应用中的研究 总被引:14,自引:1,他引:14
欧振猛 《计算机工程与应用》2000,36(8):80-82,84
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文自动分词。该文重点讨论中文自动分词算法。算法采用基于自动建立词库的最佳匹配方法来进行中文分词,同时采用基于改进型马尔可夫N元语言模型的统计处理方法来处理分词中出现的歧义问题,从而提高精度。 相似文献
12.
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分。该文尝试找到一种简单的、基于“固结词串”实例的机器学习方法解决分词歧义问题。实验结果表明,该方法可以简单有效的解决原有的分词歧义问题,并且不会产生更多新的歧义切分。 相似文献
13.
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于统计的二元分词方法应用于中文文本分类,并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,实现了在事先没有词表的情况下,通过统计构造单字及二字词词表,从而对文本进行分词,然后再进行文本的分类。 相似文献
14.
15.
中文分词作为机器翻译、文本分类、主题词提取以及信息检索的基础环节,近年来得到了广泛的关注。搜索引擎技术的广泛应用和中文信息处理的发展,使得全文检索和中文分词技术的研究逐渐深入,涌现出了众多优秀的中文分词算法。本文结合中文分词算法的研究现状,分析了分词技术与搜索引擎的信息检索相结合需要解决的关键技术问题,并讨论了中文分词技术在搜索引擎中的应用。 相似文献
16.
中文自动分词是计算机中文信息处理中的难题.介绍一种基于数据驱动的中文分词方法,开发了基于该方法的分词系统,此系统在北大<人民日报>标注语料库中进行封闭测试,取得较好的效果.系统包含了一个新词识别器、一个基本分词算法和实现单字构词、词缀构词以及一致性检验的程序. 相似文献
17.
18.
19.
20.
基于图切割的图像自动分割方法 总被引:1,自引:0,他引:1
针对图切割在图像分割中的研究主要集中于交互式图像分割,提出一种基于图切割,对彩色图像和灰度图像均可进行自动分割的方法。通过对图像进行初始化,建立能量函数的数据项、光滑项,图切割求解及迭代执行等步骤自动实现图像的分割,既无需用户人工交互进行约束,也无需对图像建模及对数据分布进行估计,可以较快速度获得良好的分割结果。通过实验对彩色图像和灰度图像进行自动分割,实验结果验证该方法的有效性。 相似文献