网页过滤中文本内容的抽取技术研究 |
| |
引用本文: | 赵坤.网页过滤中文本内容的抽取技术研究[J].硅谷,2010(8):64-64. |
| |
作者姓名: | 赵坤 |
| |
作者单位: | 沈阳市金融学校,辽宁,沈阳,110034 |
| |
摘 要: | 研究基于文本内容的网页过滤技术,网页过滤的成效依赖于网页分类的精度,网页分类的准确与否依赖于网页文本内容抽取的效果,即通过分析网页内容,得到网页中的能够代表网页语义的文本信息。提出一种在同一网站中寻找相似网页的算法,它可以克服其他网页内容抽取方法中存在的弱点。
|
关 键 词: | 网页过滤 文本分类 文本抽取 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|