首页 | 本学科首页   官方微博 | 高级检索  
     

基于小世界模型的复合关键词提取方法研究
引用本文:马力,焦李成,白琳,周雅夫,董洛兵.基于小世界模型的复合关键词提取方法研究[J].中文信息学报,2009,23(3):121-129.
作者姓名:马力  焦李成  白琳  周雅夫  董洛兵
作者单位:1. 西安电子科技大学 智能信息处理研究所 陕西 西安 710071;
2. 西安邮电学院 信息中心 陕西 西安 710061;
3. 西安电子科技大学 图书馆 陕西 西安 710071
基金项目:国家自然科学基金,陕西省自然科学基金,陕西省教育厅科研计划项目 
摘    要:该文提出了一种新的基于小世界网络特性的关键词提取算法。首先,利用K最邻近耦合图构成方式,将文档表示成为词语网络。引入词语聚类系数变化量和平均最短路径变化量来度量词语的重要性,选择重要性大的词语组成候选关键词集。利用侯选关键词集词语位置关系和汉语词性搭配关系,提取出复合关键词。 实验结果表明该方法是可行和有效的,获取复合关键词比一般关键词所表达的含义更便于人们对文本的理解。

关 键 词:计算机应用  中文信息处理  小世界网络  词语网络    平均最短路径变化量  聚类系数变化量  复合关键词
  

Research on a Compound Keywords Detection Method Based on Small World Model
MA Li,JIAO Licheng,BAI Lin,ZHOU Yafu,DONG Luobing.Research on a Compound Keywords Detection Method Based on Small World Model[J].Journal of Chinese Information Processing,2009,23(3):121-129.
Authors:MA Li  JIAO Licheng  BAI Lin  ZHOU Yafu  DONG Luobing
Affiliation:1.Institute of Intelligence Information Processing;Xidian University;Xi'an;Shanxi 710071;China;2.Information center;Xi'an Institute of Post and Telecommunications;Shanxi 710061;3.Library;China
Abstract:In this paper,a new algorithm is proposed for extracting compound Keywords from the Chinese document by the small world network.Using k-nearest-neighbor coupled graph,a Chinese document is first represented as a network: the node represent the term,and the edge represent the co-occurrence of terms.Then,two variables,clustering coefficient increment and average path length increment,are introduced to measure term's importance and to generate the candidate keyword set.With factors such as co-operation between...
Keywords:computer application  Chinese information processing  small world network  term network graph  average shortest path length increment  average clustering coefficient increment  compound keywords  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号