首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
书面汉语自动分词方法和分词模型   总被引:1,自引:0,他引:1  
  相似文献   

2.
回顾了书面汉语自然分词的研究历史,提出了一种新的汉语分词设想——综合匹配法,并且给出了处理流程。  相似文献   

3.
书面汉语自动分词的研究   总被引:2,自引:0,他引:2  
  相似文献   

4.
书面汉语自动分词系统—CDWS   总被引:46,自引:7,他引:46  
本文在大量统计的基础上, 论证了计算机自动分词是可行的。CDWS The Mordern Printed Chinese Distinguishing Word System)是作者设计的一个有较高切分精度、可实用的现代书面汉语自动分词系统, 它采用了词尾字构词检错技术及若干有效的纠错知识, 配置了知识库和临时词典, 显著的降低了错误切分率。  相似文献   

5.
书面汉语自动分词专家系统的实现   总被引:8,自引:0,他引:8  
本文介绍了书面汉语自动分词专家系统的实现方法, 着重分析了该专家系统中知识库的组织与实现, 以及所用的推理机制与自动分词过程。最后给出了实验结果, 该结果表明自动分词专家系统的性能机为优异(其切分精度远远高于一般的自动分词系统)。  相似文献   

6.
书面汉语自动分词专家系统设计原理   总被引:18,自引:3,他引:18  
本文深入地分析了歧义切分字段产生的根源和性质, 把歧义字段从性质上划分为四类, 并给出了消除每一类歧义切分字段的有效方法。在对歧义字段进行统计分析的基础上提出了切分精度的“四级指标体系”, 并论证了专家系统方法是实现自动分词系统的最佳方素。  相似文献   

7.
8.
书面汉语自动分词技术与实现   总被引:1,自引:0,他引:1  
本文首先综述了书面汉语自动分词的若干方法及研究进展,并在此基础上,提出了一种基于知识的多遍扫描联想分词法,它提高了分词效率,比较成功的解决了汉语分词的歧义问题。该方法是一种实用的分词方法,是省长辅助DSS人机界面研究的子课题。该方法已在PC/XT机上用C语言实现。  相似文献   

9.
汉语自动分词算法综述   总被引:5,自引:0,他引:5  
本文对目前已有的各种中文自动分词的算法、采用的模型、数据结构等方面进行了分析、比较,探讨了它们的优缺点,并指出了今后的研究方向。  相似文献   

10.
快速书面汉语自动分词系统及其算法设计   总被引:12,自引:1,他引:11  
本文针对机械分词,提出词典组织结构、改进的二分法检索、直接匹配算法,以及后缀分词算法。运用这些技术,正逆向切分可共用一部词典,并显著提高分词速度。  相似文献   

11.
书面汉语自动分词是目前中文信息处理的一个公认难题,利用人工智能技术构造汉语自动分词专家系统可以说是一个方向。本文分析了歧义字段的产生根源,提出了将深部知识结构(DKS)技术用于自动分词专家系统的设想,并叙述了Aspect的分类及DKS推理,目的是试图探讨出一种新的书面汉语自动分词专家系统的实现方法。  相似文献   

12.
提出一种新的书面汉语自动分词算法-增强型最大匹配法,并用此方法实现一个具学习功能的书而汉语实分词系统,系统运行实验表明该分词算法比较好地解决汉语分词的岐义问题,并且有比较高的分词效率。  相似文献   

13.
14.
汉语自动分词方法   总被引:26,自引:0,他引:26       下载免费PDF全文
本文给出了为汉语自动分词而提出了机械匹配法,特征词库法,约束矩法,语法2分析法和理解切法。  相似文献   

15.
书面汉语自动分词的“生成——测试”方法   总被引:6,自引:0,他引:6  
词链现象是书面汉语自动分词的困难所在, 本文针对词链现象的复杂性, 提出了一种“生成—测试”分词法。这种方法以知识为基袖, 它通过词典的动态化、分词知识的分布化、分词系统和句法语义系统的协同工作等手段实现了词链的有效切分和汉语句子切分与理解(生成格结构)的并行。“生成—测试”方法反映了人的分词和理解过程。  相似文献   

16.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。  相似文献   

17.
汉语计算机自动分词知识   总被引:20,自引:3,他引:17  
汉语分词是汉语言计算机处理的一项不可缺少的工作。使用自动分词知识可以进一步提高自动切分精度, 满足高标准的需求。本文在[1][2][3]的研究基础上, 介绍了一些行之有效的自动分词知识。根据对48092 个汉字的语言材料统计结果表明统计材料分社会科学和自然科学两部分, 这些自动分词知识可以处理左右的歧义切分字段。  相似文献   

18.
汉语自动分词技术研究   总被引:1,自引:0,他引:1  
汉语自动分词是中文信息处理的基本问题.从分词的基本理论出发,对近年来中文分词研究的现状进行介绍,指出了能够大幅度提高未登录词识别性能的分词方法将是未来汉语自动分词技术的发展趋势,分析了分词中存在的两个困难及其解决方法.  相似文献   

19.
论汉语自动分词方法   总被引:37,自引:2,他引:37  
文章简单考查了目前中文信息处理领域中已有的几种主要的汉语自动分词方法, 提出自动分词方法的结构模型ASM(d,a,m),对各种分词方法的时间复杂度进行计算, 对于时间复杂度对分词速度的影响, 以及分词方法对分词精度的影响也进行了分析;同时指出并论证在自动分词中设立“ 切分标志”是没有意义的。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号