首页 | 本学科首页   官方微博 | 高级检索  
     

基于SVM的中文报道关系识别方法研究
引用本文:王强,张永奎. 基于SVM的中文报道关系识别方法研究[J]. 计算机工程与应用, 2008, 44(33): 141-143. DOI: 10.3778/j.issn.1002-8331.2008.33.044
作者姓名:王强  张永奎
作者单位:山西大学,计算机与信息技术学院,太原,030006;计算智能与中文信息处理省部共建教育部重点实验室,太原,030006
基金项目:国家自然科学基金,山西省自然科学基金,山西省回国留学人员基金
摘    要:针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。

关 键 词:报道关系识别  话题检测与跟踪  多向量表示模型
收稿时间:2008-07-02
修稿时间:2008-9-26 

Research on Chinese story link detection based on SVM
WANG Qiang,ZHANG Yong-kui. Research on Chinese story link detection based on SVM[J]. Computer Engineering and Applications, 2008, 44(33): 141-143. DOI: 10.3778/j.issn.1002-8331.2008.33.044
Authors:WANG Qiang  ZHANG Yong-kui
Affiliation:1.Department of Computer and Information Technology,Shanxi University,Taiyuan 030006,China 2.Key Lab of Ministry of Education for Computation Intelligence and Chinese Information Processing,Taiyuan 030006,China
Abstract:Via analyzing the characteristic of news in the Web,construct the feature vector using features from five entity categories:persons,time,location,organizations,and content.Using story time and entity relatedness for temporal or place vector when calculating their similarity and cosine similarity for others.All the features together with the entity relatedness are integrated by Support Vector Machine(SVM).Experimental results show that this method can improve system performance effectively.
Keywords:story link detection  topic detection and tracking  multi-vector mode
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号