首页 | 本学科首页   官方微博 | 高级检索  
     

基于非结构化数据挖掘结构模型的Web文本聚类算法
引用本文:胡健, 杨炳儒, 宋泽锋, 钱榕. 基于非结构化数据挖掘结构模型的Web文本聚类算法[J]. 工程科学学报, 2008, 30(2): 217-220. DOI: 10.13374/j.issn1001-053x.2008.02.022
作者姓名:胡健  杨炳儒  宋泽锋  钱榕
作者单位:江西理工大学信息工程学院,赣州,341000;北京科技大学信息工程学院,北京,100083
基金项目:国家自然科学基金;教育部科学技术研究项目
摘    要:在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.

关 键 词:Web文本挖掘  文本聚类  聚类评价  非结构化数据挖掘结构模型
收稿时间:2006-10-29
修稿时间:2006-12-16

Web text clustering algorithm based on the nonstructural data mining model
HU Jian, YANG Bingru, SONG Zefeng, QIAN Rong. Web text clustering algorithm based on the nonstructural data mining model[J]. Chinese Journal of Engineering, 2008, 30(2): 217-220. DOI: 10.13374/j.issn1001-053x.2008.02.022
Authors:HU Jian  YANG Bingru  SONG Zefeng  QIAN Rong
Abstract:Under the background of the nonstructural data mining model, a Web text clustering mining algorithm based on the discovery feature sub-space model (DFSSM), W, TCDFSSM algorithm, was proposed, which can distinguish the most meaningful features from the concept space without any evaluation function. The WTCDFSSM algorithm was applied in the modern long-distance education net. The result shows that it can automatically congregate the text information of education field, which is collected from education sites on Internet, help people to browse the important information quickly by information navigation mechanism and acquire useful knowledge.
Keywords:Web text mining  text clustering  clustering evaluation  non-structured data mining structure model
本文献已被 万方数据 等数据库收录!
点击此处可从《工程科学学报》浏览原始摘要信息
点击此处可从《工程科学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号