首页 | 本学科首页   官方微博 | 高级检索  
     

基于多策略的文档信息过滤技术的应用研究
引用本文:杨陟卓,韩燮.基于多策略的文档信息过滤技术的应用研究[J].计算机工程与设计,2009,30(5).
作者姓名:杨陟卓  韩燮
作者单位:中北大学电子与计算机科学技术学院,山西,太原,030051
摘    要:为了提高文本信息检索的查准率和缩短检索时间,提出了一种基于多策略的文档过滤算法.该算法根据潜在词性特征初步生成候选词,采用基于标题的特征词发现扩充候选词,使用改进的TFIDF对候选词的特征进行加权合成,去除不符合条件词,求出用户需求向量和待过滤文档向量的相似度,将相似度大于一定阈值的文档提供给用户.从实验参数确定、策略对结果的影响两方面论证了文档信息过滤算法的可行性.实验结果表明,基于多策略的文档信息过滤算法能够提高信息检索的查准率,改善信息检索的质量.

关 键 词:信息检索  信息过滤  文本特征抽取  空间向量模型

Application research of text information filtering based on multi-strategy
YANG Zhi-zhuo,HAN Xie.Application research of text information filtering based on multi-strategy[J].Computer Engineering and Design,2009,30(5).
Authors:YANG Zhi-zhuo  HAN Xie
Abstract:
Keywords:TFIDF
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号