首页 | 本学科首页   官方微博 | 高级检索  
     

蒙古文信息检索系统的设计与实现
引用本文:温子潇,包飞龙,高光来,王勇和,苏向东.蒙古文信息检索系统的设计与实现[J].中文信息学报,2018,32(7):44.
作者姓名:温子潇  包飞龙  高光来  王勇和  苏向东
作者单位:内蒙古大学 计算机学院,内蒙古 呼和浩特 010021
基金项目:国家自然科学基金(61563040);内蒙古自然科学基金重大项目(2016ZD06);内蒙古自然科学基金(2017BS0601)
摘    要:该文针对传统蒙古文与西里尔蒙古文设计开发了一个功能完备的信息检索系统。在网页抓取方面,采用MD5算法对爬虫进行了改进,提升了爬虫的速度。在预处理阶段,对蒙古文文档进行了编码转换、词缀切分转换等操作。在检索方面,使用向量空间模型实现了对蒙古文文档的检索。在该文系统中加入了西里尔蒙古文到传统蒙古文转换和更新统计等模块,最终搭建了一个可以达到应用要求的蒙古文信息检索系统。

关 键 词:蒙古文  网络爬虫  信息检索系统  

Design and Implementation of Mongolian Information Retrieval System
WEN Zixiao,BAO Feilong,GAO Guanglai,WANG Yonghe,SU Xiangdong.Design and Implementation of Mongolian Information Retrieval System[J].Journal of Chinese Information Processing,2018,32(7):44.
Authors:WEN Zixiao  BAO Feilong  GAO Guanglai  WANG Yonghe  SU Xiangdong
Affiliation:College of Computer Science, Inner Mongolia University, Hohhot, Inner Mongolia 010021, China
Abstract:This paper presents a well-functioned information retrieval system for both traditional Mongolian and Cyrillic Mongolian. In the network crawling, MD5 algorithm is applied to improve the crawler performance. In the preprocessing, Mongolian documents are porcessed for code conversion, affix analysis and proofreading. The retrieval module is built upon the Vector Space Model. In addition, the Cyrillic Mongolian to the traditional Mongolian conversion module is developed to meet the application requirements.
Keywords:Mongolian  Web crawler  information retrieval system  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号