基于BP神经网络的文档聚类研究 |
| |
引用本文: | 田萱,刘希玉,孟强.基于BP神经网络的文档聚类研究[J].计算机科学,2002,29(8):93-95. |
| |
作者姓名: | 田萱 刘希玉 孟强 |
| |
作者单位: | 山东师范大学信息管理学院,济南,250014 |
| |
摘 要: | 1.引言近年来,随着互联网的迅速发展,基于Web的数据挖掘技术受到越来越多的关注,经常用在文本挖掘和信息检索等多个领域的聚类(Clustering)技术也成为人们研究的热点。对一组实际或抽象的元素进行处理,把相似的元素归为同类的过程称之为聚类。对文本信息,如科技文献、Web文档等的聚类,称之为文档聚类(Document Clustering)。最初,文档聚类常用于提高信息检索系统的查准率和查全率(recall),或用来寻找与一篇文档最为相似的文档。现在,人们利用文档聚类来获得一组满足用户要求的文档集合并按用户需求对其进行排序。另外在Internet上,文本聚类也可用来自动产生文档的层次聚类,从而实现对Web文档的分类。
|
关 键 词: | Internet BP神经网络 文档聚类 数据挖掘 信息检索系统 查准率 查全率 |
Research on Document Clustering Based on BP Neural Net |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|
点击此处可从《计算机科学》下载全文 |
|