首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
Web文本挖掘中数据预处理技术研究   总被引:3,自引:0,他引:3  
数据预处理是将原始的Web文档转化为适合进行数据挖掘的中间表示形式,在Web文本挖掘过程中起着至关重要的作用.介绍Web文本挖掘的概念及Web文本挖掘的一般流程,对Web文本挖掘中的特征表示、中文分词、特征选择等数据预处理关键技术进行详尽的分析.  相似文献   

2.
Web文本信息的特征获取算法   总被引:17,自引:0,他引:17  
Internet的发展为人们提供了大量的信息资源,Web文本挖掘是从非结构化的文本中发展潜在的、有价值知识的一种有效技术,本文以矢量空间模型为Web文本的表示方法,提出了一个基于遗传算法的Web文本特征抽取算法,进一步提高了Web文本诉处理效率,为文本的分类、聚类以及其它处理提供了简炼的特征表示方法,实验证明,该种处理方法有效地降低了文本特征矢量的维数。  相似文献   

3.
Web文本挖掘技术   总被引:4,自引:0,他引:4  
介绍Web数据挖掘中的核心技术——Web文本挖掘的种类、特点、任务及方法。着重讨论了文本特征的提取、文本分类和群集的算法过程和技术要点。  相似文献   

4.
Web文本挖掘技术   总被引:3,自引:0,他引:3  
介绍Web数据挖掘中的核心技术—Web文本挖掘的种类、特点、任务及方法。着重讨论了文本特征的提取、文本分类和群集的算法过程和技术要点。  相似文献   

5.
Web文本挖掘     
简要介绍Web挖掘的概念、分类及其功能,重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等。最后对Web文本挖掘的应用领域作了展望。  相似文献   

6.
Web内容挖掘技术研究   总被引:14,自引:4,他引:10  
简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。  相似文献   

7.
Web文本挖掘中的特征选取方法研究   总被引:11,自引:0,他引:11  
和亚丽  陈立潮 《计算机工程》2005,31(5):181-182,190
研究了Web文本挖掘中的高维特征选取问题,对常见的评估函数法、主成分分析法、模拟退火法等特征选取和降维算法进行了理论分析与性能比较,通过实验对各种算法的优劣性及适用性进行了讨论。旨在通过降维处理来解决高维空间的文本挖掘问题。  相似文献   

8.
Web文本挖掘三种技术的比较   总被引:2,自引:0,他引:2  
文章介绍了Web挖掘的有关理论,从Web文本挖掘的定义、Web文本挖掘任务、功能等方面加以阐述,然后重点比较了Web文本挖掘的三种技术(朴素贝叶斯方法(NaiveBayes)、K-最近邻接参照分类算法(K-NearestNeighbor)、学习一阶规则算法(FirstOrderInductiveLearner))的分类效果。最后,概述了Web文本挖掘的用途和前景。  相似文献   

9.
文章详细研究了Web文本挖掘的定义及类型,重点分析了Web文本挖掘算法,总结了文本挖掘的应用,提出了今后工作的重点。  相似文献   

10.
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的有效技术,Web文本挖掘已倍受关注。文中提出了利用概念格来抽取隐含在文本中潜在的概念关系,将文本挖掘中文档与关键词之间的关系通过概念格结构呈现出来。  相似文献   

11.
Web数据挖掘   总被引:30,自引:4,他引:26  
王实  高文 《计算机科学》2000,27(4):28-31
Web Mining is an important branch in Data Mining.It attracts more research interest for rapidly developing Internet. Web Mining includes(1)Web Content Mining;(g)Web Usage Mining;(3) Web structure Mining.In this paper we define Web Mining and present an overview of the various research issues,techniques and development efforts.  相似文献   

12.
基于语义的Web挖掘   总被引:5,自引:0,他引:5  
基于语义的Web挖掘是使用从现有Web数据中抽取的语义或直接使用Web数据中已有的语义结构来帮助Web挖掘。它有效地结合了语义网和Web挖掘两个领域的研究成果,既可以通过开发新的语义结构来帮助Web挖掘,又可以利用挖掘结果促进语义网的创建。本文介绍了基于语义的Web挖掘的基本思想和研究现状,分析了语义网和Web挖掘相结合的优势,并详细论述了国际上关于利用数据挖掘技术创建语义网,利用语义挖掘Web数据和直接挖掘语义网三个方面的研究工作。  相似文献   

13.
介绍了一种Web挖掘的分类,包括Web内容挖掘、Web结构挖掘和Web使用挖掘。讨论了Web使用挖掘过程的三个步骤,即数据获取与数据预处理、模式发现和模式分析,详细分析了每一个步骤中所使用的技术。指出了目前Web使用挖掘研究存在的不足,给出了Web使用挖掘未来的研究方向。  相似文献   

14.
Web使用挖掘的应用研究   总被引:6,自引:0,他引:6  
Some effective and efficient knowledge patterns will be gained through searching, integrating, mining and analyzing on the Web. These useful knowledge patterns can help us to build so efficient Web site that WWW can ser-vice people well. In this paper we point out Web Usage Mining process influenced by Web site structure and content,and introduce the application of Web Usage mining in E-commerce. In the end a example of Web Usage Mining is given.  相似文献   

15.
Web挖掘指使用数据挖掘技术在万维网数据中发现潜在的、有用的信息。文章通过对Web挖掘在远程教育中的应用进行分析.提出一种基于Web挖掘的远程教学服务系统模型,着重介绍了Web挖掘的基本过程。  相似文献   

16.
Web挖掘指使用数据挖掘技术在万维网数据中发现潜在的、有用的信息。文章通过对Web挖掘在远程教育中的应用进行分析,提出一种基于Web挖掘的远程教学服务系统模型,着重介绍了Web挖掘的基本过程。  相似文献   

17.
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。Web挖掘可以快速有效地从互联网上获取所需要的信息。该文从Web数据挖掘的基本概念出发,结合Web数据的特点介绍了Web数据挖掘的类型、过程和技术,并对Web挖掘的应用前景进行了展望。  相似文献   

18.
基于主题的Web文档聚类研究   总被引:9,自引:3,他引:9  
网络资源的不断膨胀和新旧信息的迅速更迭,使传统的手工分检的方法难以适应对海量电子数据的管理需要。Web文档聚类可以快速地将文档进行自动归类,并能够发现新的信息资源。针对Web文档数据的复杂性,本文提出了通过二次特征提取和聚类的方法,将Web文档按照主题进行自动聚类。在主题特征被有效提取的同时,实现了较高质量的Web文档聚类。  相似文献   

19.
精准地抽取新闻网页的内容,是提高Web新闻分析等应用系统工作质量的关键技术之一.由于缺少Web新闻出版的标准,存在大量不同的出版格式,并且Web本身是一种具有高度异构性的大数据载体,导致Web新闻内容抽取成为一个开放性问题.经大量实例分析发现,新闻网页内容与其上的标签路径存在潜在的关联性.因此,设计了标签路径特征系,以从不同视角区分网页内容和噪音.在特征相似性分析的基础上,提出了一种基于组合特征选择的特征融合策略,并设计了基于融合特征的Web新闻内容抽取方法CEPF.CEPF是一种快速的通用、无需训练的在线Web新闻内容抽取算法,可抽取多种来源、多种风格、多种语言的Web新闻网页.在CleanEval等测试数据集上的实验结果表明,CEPF方法优于CETR等抽取方法.  相似文献   

20.
随着互联网技术的高速发展,Web数据挖掘由于其自身独特的优点,在现代电子商务中的地位越来越重要。该文重点介绍了Web挖掘的有关概念和分类,论述了电子商务中Web挖掘的主要过程和方法,阐述了Web数据挖掘在现代电子商务中的具体应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号