首页 | 本学科首页   官方微博 | 高级检索  
     

基于维基百科的短文本语义扩展方法研究
引用本文:韩冬雷,金花,朱亚涛,刘金刚. 基于维基百科的短文本语义扩展方法研究[J]. 计算机应用与软件, 2014, 0(10)
作者姓名:韩冬雷  金花  朱亚涛  刘金刚
作者单位:1. 首都师范大学计算机科学联合研究院 北京 100048
2. 河北农业大学信息科学与技术学院 河北 保定071001
3. 河北农业大学信息科学与技术学院 河北 保定071001; 中国科学院计算技术研究所 北京 100190
4. 首都师范大学计算机科学联合研究院 北京 100048; 中国科学院计算技术研究所 北京 100190
基金项目:国家自然科学基金项目(60903139);国家自然科学基金面上项目(61173008);河北省高等学校科学技术研究青年基金项目(Z2012142);河北农业大学理工基金项目(LG20120604)。
摘    要:面对短文本信息内容稀疏、上下文语境提取困难的挑战,基于维基百科的结构化信息特征,提出一种利用NMF算法来扩展短文本语义的方法。通过自动识别与短文本信息语义特征相关的维基百科概念来丰富它的内容,从而有效提高短文本信息数据挖掘和分析的效果。实验结果表明与已有方法相比,应用此方法可以进一步提高短文本信息语义扩展的效率和准确率。

关 键 词:短文本  非负矩阵分解  锚文本  语义相似度

SEMANTIC EXTENSION OF SHORT-TEXT BASED ON WIKIPEDIA
Han Donglei,Jin Hua,Zhu Yatao,Liu Jingang. SEMANTIC EXTENSION OF SHORT-TEXT BASED ON WIKIPEDIA[J]. Computer Applications and Software, 2014, 0(10)
Authors:Han Donglei  Jin Hua  Zhu Yatao  Liu Jingang
Abstract:
Keywords:Short-text  Non-negative matrix factorisation (NMF)  Anchor text  Semantic relatedness
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号