首页 | 本学科首页   官方微博 | 高级检索  
     

网页过滤中文本内容的抽取技术研究
引用本文:赵坤.网页过滤中文本内容的抽取技术研究[J].硅谷,2010(8):64-64.
作者姓名:赵坤
作者单位:沈阳市金融学校,辽宁,沈阳,110034
摘    要:研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。

关 键 词:网页过滤  文本分类  文本抽取
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号