首页 | 本学科首页   官方微博 | 高级检索  
     

蒙古文停用词和英文停用词比较研究
引用本文:巩政,关高娃.蒙古文停用词和英文停用词比较研究[J].中文信息学报,2011,25(4):35-39.
作者姓名:巩政  关高娃
作者单位:内蒙古大学 计算机学院,内蒙古 呼和浩特 010021
基金项目:内蒙古自治区自然科学基金资助项目(2009MS0903); 内蒙古大学科技创新团队建设计划(智能与蒙古文信息处理)资助
摘    要:该文采用联合熵算法(Union Entropy,UE)初步确定了蒙古文停用词,接着从初步确定的蒙古文停用词中去掉蒙古文实体名词及同形异义词,再通过对英文停用词和蒙古文停用词的词性比较,确定了蒙古文停用词表。最后用蒙古文停用词表和英文停用词表进行了文档信息检索的对比实验。实验结果表明,用该文所述方法确定的蒙古文停用词表进行蒙古文文档检索,比用英文停用词翻译成蒙古文进行蒙古文文档检索的准确率更高。

关 键 词:蒙古文停用词  蒙古文信息检索  英文停用词  

A Comparative Study on Between Mongolian Stop Words and English Stop Words
GONG Zheng,GUAN Gaowa.A Comparative Study on Between Mongolian Stop Words and English Stop Words[J].Journal of Chinese Information Processing,2011,25(4):35-39.
Authors:GONG Zheng  GUAN Gaowa
Affiliation:College of Computer Science, Inner Mongolia University,Hohhot, Inner Mongolia 010021,China
Abstract:In this paper,we initially set the Mongolian stop words with the union entropy algorithm(union entropy,UE),and then remove Mongolian entities nouns and homographs from Mongolian stop words.finally we compare the parts of speech of English stop words and Mongolian stop wordsto determine the Mongolian stopword list.We test the Mongolian stopword list and the English stopword list on document information retrieval task.The results show that the method used in this paper to determine the Mongolian stopword list...
Keywords:Mongolian stop word  Mongolian information retrieval  English stop word  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号