首页 | 本学科首页   官方微博 | 高级检索  
     

微博自动标引关键技术的研究
引用本文:程传鹏,夏敏捷.微博自动标引关键技术的研究[J].计算机工程与应用,2011,47(34):137-140.
作者姓名:程传鹏  夏敏捷
作者单位:中原工学院 计算机学院,郑州 450007
基金项目:河南省教育厅自然科学项目(No.2008B520046); 河南省政府决策项目(No.b580)
摘    要:针对微博文本的特点,提出了一种自动识别微博标引词的方法。根据微博文本中的名词或动词之间语义相似度构造图的邻接矩阵,在图的邻接矩阵基础上利用Pagerank算法思想来计算词语的重要度,选择重要度较大的一些词作为标引词。实验结果表明,较传统的自动标引方法,提出的自动标引方法简单实用、准确率较高。

关 键 词:微博  自动标引  邻接矩阵  Pagerank算法  重要度  
修稿时间: 

Study on key technology of automatic indexing of MicroBlog
CHENG Chuanpeng,XIA Minjie.Study on key technology of automatic indexing of MicroBlog[J].Computer Engineering and Applications,2011,47(34):137-140.
Authors:CHENG Chuanpeng  XIA Minjie
Affiliation:School of Computer Science,Zhongyuan Institute of Technology,Zhengzhou 450007,China
Abstract:In view of the feature of MicroBlog text,this paper improves a method to automatic distinguish indexing words in MicroBlog.The adjacency matrix is constructed according to semantic similarity of nouns or verbs,the importance of words is computed according to theory of Pagerank based on adjacency matrix.Some more important word is considered to be indexing words.The experiments show that the method is easy and practical compared with traditional method.
Keywords:MicroBlog  automatic indexing  adjacency matrix  Pagerank  importance
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号