首页 | 本学科首页   官方微博 | 高级检索  
     

一种计算汉字串之间相关程度的新方法
引用本文:曹娟,周经野. 一种计算汉字串之间相关程度的新方法[J]. 中文信息学报, 2004, 18(4): 56-60
作者姓名:曹娟  周经野
作者单位:湘潭大学信息工程学院
摘    要:本文提出了一种能更准确的反映两个汉字串之间相关程度的新概念——黏结度,并给出了其计算方法。该方法把需要计算相关程度的汉字串放在一个大环境中进行讨论,通过加入上下文信息来提高分词的准确度;另外,该方法在引用汉字词频时,增加了对动态词频的考虑,可以自动识别未登陆的专业词汇。文中同时给出了黏结度在分词领域中的应用实例。通过与前人提出的相关信息的方法相比较,这种计算方法能够解决分词中一些难于解决的问题并提高分词的精确度。

关 键 词:计算机应用  中文信息处理  黏结度  相关信息  分词  
文章编号:1003-0077(2004)04-0055-05
修稿时间:2004-01-11

A New Method for Calculating Relativity of Chinese Strings
CAO Juan,ZHOU Jing ye. A New Method for Calculating Relativity of Chinese Strings[J]. Journal of Chinese Information Processing, 2004, 18(4): 56-60
Authors:CAO Juan  ZHOU Jing ye
Affiliation:The College of Information Engineering of Xiangtan University
Abstract:In this paper we put forward a new concept , the degree of cohering of Chinese strings , and it's computation. It's value reflects how close the two strings are interrelated. This method completely considered the environment of the Chinese strings and the local-use-frequency of the words. Its definition and the examples of applying it in word segmentation are presented。Compared with the method of mutual information the predecessors had put forward , this method can solve some difficult problems in word segmentation and improves the precision.
Keywords:computer application  Chinese information processing  the degree of cohering  the mutual information  word segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号