首页 | 本学科首页   官方微博 | 高级检索  
     

话题内相关文本的内容计算
引用本文:刘冬明,杨尔弘.话题内相关文本的内容计算[J].中文信息学报,2015,29(5):98-104.
作者姓名:刘冬明  杨尔弘
作者单位:1.中北大学,山西 太原 030051;2. 北京语言大学,北京 100083
基金项目:国家语委“十二五”科研规划项目(YB125-43)
摘    要:信息的暴涨给文本处理带来了更多的挑战。话题检测能够把大量的信息以话题为单位有效地组织起来,然而最终用户有可能并不需要涉及某一话题的所有文本,而是仅仅关心该话题的具体内容。在我们根据相关文本智能表达话题内容推送给用户之前,自动从相关文本中挑选符合用户需求的文本是一个非常有意义的工作。本文致力于相同话题文本之间的内容比较,目的是有效地选出满足需求的文本。我们通过对话题进行重新定义,并根据此定义设定了话题和文本的表示方法,给出了基于该表示方法的话题和文本之间的内容比较计算方法。最后,通过实验说明了这一系列方法的有效性。


关 键 词:话题定义  文本表示    话题检测  文本内容计算  

On Text Content Computing within an Topic
LIU Dongming,YANG Erhong.On Text Content Computing within an Topic[J].Journal of Chinese Information Processing,2015,29(5):98-104.
Authors:LIU Dongming  YANG Erhong
Affiliation:1. North University of China, Taiyuan, Shanxi 030051, China;
2. Beijing Language and Culture University, Beijing 100083, China
Abstract:The topic detection can effectively organize the vast information into topics with the unit of text, but end users do not need all the texts on a topic. Instead, they may just demand certain specific content of the topic. To achieve the intelligent push of the relevant content in a topic to the user, it is essential to select the corresponding part of the texts according to the needs of users. This paper compares the contents between the texts in a topic and effectively selects the texts which meets the needs of the user. We redefine the topic and represent the topic and the text according to this definition. Then we design a computation method between the texts and topic based on this representation. Finally, the experiment demonstrates the effectiveness of this approach.
Keywords:topic definition  textual representation  topic detection  text content computing  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号