共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
3.
4.
5.
书面汉语自动分词综述 总被引:9,自引:0,他引:9
梁南元 《计算机应用与软件》1987,(3)
汉语分词是汉语言处理有别于拼音文字语言处理的特点之一。本文回顾了汉语自动分词的研究历史;对现有的四种计算机自动分词方法进行了评介;介绍了当前的研究现状和存在的困难。 相似文献
6.
7.
书面汉语自动分词专家系统的实现 总被引:8,自引:0,他引:8
本文介绍了书面汉语自动分词专家系统的实现方法, 着重分析了该专家系统中知识库的组织与实现, 以及所用的推理机制与自动分词过程。最后给出了实验结果, 该结果表明自动分词专家系统的性能机为优异(其切分精度远远高于一般的自动分词系统)。 相似文献
8.
书面汉语自动分词系统—CDWS 总被引:46,自引:7,他引:46
本文在大量统计的基础上, 论证了计算机自动分词是可行的。CDWS The Mordern Printed Chinese Distinguishing Word System)是作者设计的一个有较高切分精度、可实用的现代书面汉语自动分词系统, 它采用了词尾字构词检错技术及若干有效的纠错知识, 配置了知识库和临时词典, 显著的降低了错误切分率。 相似文献
9.
书面汉语自动分词技术与实现 总被引:1,自引:0,他引:1
本文首先综述了书面汉语自动分词的若干方法及研究进展,并在此基础上,提出了一种基于知识的多遍扫描联想分词法,它提高了分词效率,比较成功的解决了汉语分词的歧义问题。该方法是一种实用的分词方法,是省长辅助DSS人机界面研究的子课题。该方法已在PC/XT机上用C语言实现。 相似文献
10.
11.
12.
提出一种新的书面汉语自动分词算法-增强型最大匹配法,并用此方法实现一个具学习功能的书而汉语实分词系统,系统运行实验表明该分词算法比较好地解决汉语分词的岐义问题,并且有比较高的分词效率。 相似文献
13.
14.
快速书面汉语自动分词系统及其算法设计 总被引:12,自引:1,他引:11
本文针对机械分词,提出词典组织结构、改进的二分法检索、直接匹配算法,以及后缀分词算法。运用这些技术,正逆向切分可共用一部词典,并显著提高分词速度。 相似文献
15.
书面汉语自动分词是目前中文信息处理的一个公认难题,利用人工智能技术构造汉语自动分词专家系统可以说是一个方向。本文分析了歧义字段的产生根源,提出了将深部知识结构(DKS)技术用于自动分词专家系统的设想,并叙述了Aspect的分类及DKS推理,目的是试图探讨出一种新的书面汉语自动分词专家系统的实现方法。 相似文献
16.
1引言 计算机自动分词是现代汉语处理的重要组成部分,也是最基础的工作.汉语处理的后续工作,如词性标注、句法分析、语义分析、篇章理解以及机器翻译等,都以自动分词后的文本作为处理的起点.要想最终实现高质量的篇章理解和机器翻译系统,自动分词质量的高低至关重要. 相似文献
17.
近年来已有多种自动分词软件问世,而且这方面的研究和应用正在不断深入。但尚无评价此类软件的标准、模型和方法进行质量控制。本人曾对此做过研究,并在此基础上给出了自动分词软件质量更优化的评价方法。 相似文献
18.
书面汉语的全切分分词算法模型 总被引:11,自引:1,他引:10
本文首先讨论了全切分研究的问题,然后从一般性出发提出了全切分的求解公式、切分树、全切分DAG(无环有向)图和全切分的抽象算法模型,在此基础上特别指出了全切分普遍存在的重复切分问题.进而,本文针对串行全切分分词算法和剪技的方法进行了研究,给出了串行全切分分词方法的算法模型. 相似文献
19.
本文阐述了自动分词技术的理论与技术创新点,提出了一个适用于中英文WWW搜索引擎的分词器的实现,它具有高速的特点,同时具有较好的切分精度。该分词技术能对外提供基于全文和关键字检索的接口,并采用一系列的策略来提高切分速度,优化结构。它已应用于“中英文WWW搜索引擎系统”中,应用效果较好。 相似文献
20.
汉语计算机自动分词知识 总被引:20,自引:3,他引:17
汉语分词是汉语言计算机处理的一项不可缺少的工作。使用自动分词知识可以进一步提高自动切分精度, 满足高标准的需求。本文在[1][2][3]的研究基础上, 介绍了一些行之有效的自动分词知识。根据对48092 个汉字的语言材料统计结果表明统计材料分社会科学和自然科学两部分, 这些自动分词知识可以处理左右的歧义切分字段。 相似文献