共查询到17条相似文献,搜索用时 78 毫秒
1.
文章首先探讨了Web挖掘的地位,基于WEB的文本挖掘是WEB挖掘的重要组成部分。文章重点对文本特征提取、文本分类、文本聚类等WEB文本挖掘关键实现技术做了介绍,最后讨论了Web文本挖掘的价值。 相似文献
2.
3.
Web文本挖掘及特征选择 总被引:11,自引:0,他引:11
文章介绍了Web挖掘的有关理论,从Web文本挖掘的定义,Web文本挖掘任务的功能等方面加以阐述,然后重点分析了Web文本挖掘,文本的特征表示,特征选择,将多维文本分析与文本挖掘这两种技术有机地结合起来,快速,有效地挖掘Web上的HTML文档,最后,概述了Web文本挖掘的用途和前景。 相似文献
4.
5.
陶程仁 《数字社区&智能家居》2004,(26)
本文从实际应用角度探讨了WEB文本挖掘系统的设计实现问题,文章首先分析了WEB文本挖掘的实现流程,并在此基础上对应用较为广泛的WEB文本挖掘聚类算法进行了对比分析,并采用SOM聚类算法作为系统的实现算法,在本文最后一部分,文章对SOM聚类算法的具体实现进行了深入的阐述分析。 相似文献
6.
陶程仁 《数字社区&智能家居》2004,(9):67-69
本文从实际应用角度探讨了WEB文本挖掘系统的设计实现问题,文章首先分析了WEB文本挖掘的实现流程,并在此基础上对应用较为广泛的WEB文本挖掘聚类算法进行了对比分析,并采用SOM聚类算法作为系统的实现算法,在本文最后一部分,文章对SOM聚类算法的具体实现进行了深入的阐述分析. 相似文献
7.
8.
Web文本挖掘三种技术的比较 总被引:2,自引:0,他引:2
文章介绍了Web挖掘的有关理论,从Web文本挖掘的定义、Web文本挖掘任务、功能等方面加以阐述,然后重点比较了Web文本挖掘的三种技术(朴素贝叶斯方法(NaiveBayes)、K-最近邻接参照分类算法(K-NearestNeighbor)、学习一阶规则算法(FirstOrderInductiveLearner))的分类效果。最后,概述了Web文本挖掘的用途和前景。 相似文献
9.
10.
简要介绍Web挖掘的概念、分类及其功能,重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等。最后对Web文本挖掘的应用领域作了展望。 相似文献
11.
Oracle Text是一种创建文本搜索和文档分类应用的技术。本文提出了一种基于该技术实现中文网页自动分类系统的解决方案。实验结果表明该方案准确有效,具有较好的性能,满足中文网页自动分类的需求。 相似文献
12.
13.
14.
Text mining techniques include categorization of text, summarization, topic detection, concept extraction, search and retrieval, document clustering, etc. Each of these techniques can be used in finding some non-trivial information from a collection of documents. Text mining can also be employed to detect a document’s main topic/theme which is useful in creating taxonomy from the document collection. Areas of applications for text mining include publishing, media, telecommunications, marketing, research, healthcare, medicine, etc. Text mining has also been applied on many applications on the World Wide Web for developing recommendation systems. We propose here a set of criteria to evaluate the effectiveness of text mining techniques in an attempt to facilitate the selection of appropriate technique. 相似文献
15.
文本挖掘及其关键技术与方法 总被引:29,自引:0,他引:29
从1969年美国国防部的计算机网络ARPANET起步,至今已有32年历史的Internet,已经发展成为包含多种信息资源、站点遍布全球的巨大信息服务系统,为其用户提供了极具价值的、巨大的数据资料。在数字图书馆和Internet上,在线可获得的信息量呈指数级增长,导致了信息爆炸。WWW以超文本的形式呈现给用户,一个网页里包含了多种不同的数据类型,其中最主要的信息源就是文本数据。文本表达了大量的、丰富的信息,同时包含了许多未被所有者发现的潜在知 相似文献
16.
基于WEB文本数据挖掘的研究 总被引:8,自引:0,他引:8
万维网是一个巨大的、分布广泛和全球性的信息服务中心,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其他信息服务。Web文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程。 相似文献
17.
Web文本挖掘是Web数据挖掘的一个重要研究领域.文本挖掘的主要方法是文本分类和聚类.本文主要讨论了在文本挖掘中文本的表示,以及文本聚类的算法描述. 相似文献