首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于同义词消除的文本过滤方法
引用本文:杭娟,张冬茉. 一种基于同义词消除的文本过滤方法[J]. 计算机工程与应用, 2006, 42(19): 180-182
作者姓名:杭娟  张冬茉
作者单位:上海交通大学计算机科学与工程系,上海,200030;上海交通大学计算机科学与工程系,上海,200030
摘    要:传统的向量空间过滤模型通常是提取字、词、短语等作为特征项,这样做的缺点是没有考虑文本的语义信息。文章提出了利用知网对向量空间模型的文本向量进行同义词消除的过滤方法。该方法比传统的单纯基于关键词匹配的方法更精确地体现了文本之间的相似度,提高了过滤性能,同时也降低了向量空间的维数,减少了计算量,提高了过滤的效率,实验结果表明基于该文的过滤方法确实提高了系统的性能。

关 键 词:文本过滤  向量空间  用户模板  知网  同义词消除
文章编号:1002-8331-(2006)19-0180-03
收稿时间:2005-11-01
修稿时间:2005-11-01

A Text Filtering Method Based on Synonym Elimination
Hang Juan,Zhang Dongmo. A Text Filtering Method Based on Synonym Elimination[J]. Computer Engineering and Applications, 2006, 42(19): 180-182
Authors:Hang Juan  Zhang Dongmo
Abstract:The traditional VSM(Vector Space Model) system often selects words as the feature,and one of its shortness is the lack of semantic information in document representation.In this paper,we present a kind of filtering method which selects all of the synonyms of each feature in the document vector and replace them as one of them based on HowNet.This method approves the system's efficiency and precision,and the result of the experiment also proves its availability.
Keywords:text filtering   vector space   user profile   HowNet  synonym elimination
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号