首页 | 本学科首页   官方微博 | 高级检索  
     

文本分割算法对中文信息过滤影响研究
引用本文:朱寰,阮彤,于庆喜. 文本分割算法对中文信息过滤影响研究[J]. 计算机工程与应用, 2002, 38(13): 62-65
作者姓名:朱寰  阮彤  于庆喜
作者单位:1. 中国科学院软件研究所软件工程技术中心,北京,100080
2. 烟台市公安局信息处,烟台,264000
基金项目:国家自然科学重点基金(编号:69833030),973国家重点基础研究发展规划项目基金(编号:G1999035807)
摘    要:因特网上的信息以前所未有的速度剧烈膨胀,促使对信息过滤的研究成为热点。该本文比较了在基于中文的信息过滤中,不同的文本分割方法、机械分词方法、以及特征抽取阈值对信息过滤的结果的影响,对中文信息过滤使用合适的特征抽取方法提供了指导,得出了使用N元方法可与机械分词方法相比较的结论。

关 键 词:信息过滤  特征抽取  文本分割
文章编号:1002-8331-(2002)13-0062-04
修稿时间:2002-01-01

Studies on Text Segment Algorithms'''' Influence on Chinese-based Information Filtering
Zhu Huan Ruan Tong Yu Qingxi. Studies on Text Segment Algorithms'''' Influence on Chinese-based Information Filtering[J]. Computer Engineering and Applications, 2002, 38(13): 62-65
Authors:Zhu Huan Ruan Tong Yu Qingxi
Affiliation:Zhu Huan 1 Ruan Tong 1 Yu Qingxi 21
Abstract:The information on Internet has a dramatic rapid growth,so it has bec om e a hot topic for people to study the information filtering(IF).This paper c ompares the influence with Chinese -based IF,using different text segment al gorithms ,simple segment algorithms and feature selection algorithms.It give s a guidance to make use of appropriate feature selection method in IF based on Chinese,and it draws a conclusion that N-grams method is comparable to simpl e segment method in Chinese-based IF.
Keywords:Information filtering  featur e selection  text segment  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号