首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于WordNet的短文本语义相似性算法
引用本文:翟延冬,王康平,张东娜,黄岚,周春光. 一种基于WordNet的短文本语义相似性算法[J]. 电子学报, 2012, 40(3): 617-620. DOI: 10.3969/j.issn.0372-2112.2012.03.035
作者姓名:翟延冬  王康平  张东娜  黄岚  周春光
作者单位:1. 吉林大学计算机科学与技术学院,吉林长春,130012
2. 吉林大学计算机科学与技术学院,吉林长春130012;吉林大学符号计算与知识工程教育部重点实验室,吉林长春130012
基金项目:国家自然科学基金项目资助(No.61175023,No.60903097)
摘    要: 短文本语义相似性计算在文献检索、信息抽取、文本挖掘等方面应用日益广泛.本文提出了一种短文本语义相似性计算算法ST-CW.此算法使用WordNet和Brown文集来计算文本中的概念相似性,在此基础上提出了一个新的方法综合考虑概念、句法等信息来计算短文本的语义相似性.在R&;B及Miller数据集上进行实验,实验结果验证了算法的有效性.

关 键 词:短文本语义相似性  WordNet  基于文集的方法
收稿时间:2011-04-19

An Algorithm for Semantic Similarity of Short Text Based on WordNet
ZHAI Yan-dong , WANG Kang-ping , ZHANG Dong-na , HUNAG Lan , ZHOU Chun-guang. An Algorithm for Semantic Similarity of Short Text Based on WordNet[J]. Acta Electronica Sinica, 2012, 40(3): 617-620. DOI: 10.3969/j.issn.0372-2112.2012.03.035
Authors:ZHAI Yan-dong    WANG Kang-ping    ZHANG Dong-na    HUNAG Lan    ZHOU Chun-guang
Affiliation:1,2(1.College of Computer Science and Technology,Jilin University,Changchun,Jilin 130012,China;2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun,Jilin130012,China)
Abstract:The algorithm for semantic similarity of short text is used widely in document retrieval,information extraction and text mining.An algorithm for semantic similarity of short text named ST-CW is presented.The algorithm calculates semantic similarity of concept based on WordNet and The Brown Corpus,and then a formula is presented which refers to both concept similarity and syntactic information in short text.The evaluations are conducted on R&B and Miller dataset.
Keywords:semantic similarity of short text  WordNet  corpus-based method
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号