首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
web数据挖掘探讨   总被引:1,自引:0,他引:1  
web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。本文介绍了web数据挖掘的含义,重点讨论了web数据挖掘的类型以各种类型的web数据挖掘的基本过程以及它们所使用的一些相关技术,最后指出了网络信息挖掘的应用前景。  相似文献   

2.
Web使用挖掘技术研究   总被引:28,自引:0,他引:28  
简要介绍了WEB挖掘的基本概念及其分类,讨论了web使用挖掘的有关理论及其应用。重点分析了Web使用挖掘的主要研究对象和研究方法,包括:挖掘的数据对象、数据的采集、数据预处理、模式发现、模式分析及其相关技术。展望了Web使用挖掘的未来研究方向。  相似文献   

3.
信息时代的到来,伴随着海量数据的不断出现,web挖掘为当今海量数据处理提供了强有力的技术手段。介绍了Web挖掘的概念.给出了Web挖掘的三种分类,并针对内容挖掘、结构挖掘、使用挖掘论述了Web挖掘在搜索引擎、电子商务、疾病防治等方面的应用。提出了Web挖掘存在的问题,最后展望了Web挖掘的未来努力方向。  相似文献   

4.
匿名用户的网络浏览特征挖掘   总被引:2,自引:1,他引:2  
在网络使用挖掘(web usage mining)中,分析用户的行为模式是一个关键的问题,尤其对于匿名用户特征挖掘更有实际意义,首先介绍如何从网络使用数据(web usage data)中提取出会话(session)信息,接着讨论会话的特征抽取和特征空间(feature space)的表达方式,并以此为基础提出了一种建立在会话特征信息上的戒名用户的网络浏览特征挖掘方法算法,这种算法在提高精确性的基础上减少了计算耗费,可以较好地解决路径的变长,方向性和动态聚集等问题。  相似文献   

5.
随着电子商务的发展状大,缺乏个性化服务成为制约电子商务发展的关键问题。基于web数据挖掘的电子商务挖掘系统可以满足电子商务未来发展趋势的需要。该文以一组数据为实例阐述了基于web数据挖掘的协同过滤挖掘算法是如何进行数据表示、近邻查询以及挖掘产生这三个阶段的有效实施的。  相似文献   

6.
基于XML的web文本挖掘方法与模型研究   总被引:2,自引:2,他引:0  
Internet的快速发展和大量非结构化数据的出现,给传统的数据挖掘工具带来了极大的挑战。XML(可扩展标记语言)技术一方面继承了HTML的灵活性和简单性,另一方面又具有强制结构的完整性和标签的自定义性,已经成为web挖掘的一个重要方向。本文在介绍XML语言基本特点的基础上,针对web上大量异构数据的特点,探讨了基于多叉树的HTML到XML的转换方法,实现web上文本的规范化,并将其用于提出的基于XML的web文本挖掘模型,提高web文本挖掘的有效性。  相似文献   

7.
为了对infemet上的半结构化数据进行分析,发现其内在的关联模式,论文提出了基于小波理论的web挖掘模型,该模型支持web挖掘的全过程。Web挖掘模型由数据采集器、预处理器、数据约简、挖掘综合器、挖掘方法库和系统维护六部分组成。该模型应用小波聚类分析方法,实现了对经过预处理的Web数据进行约筒的功能。去除了一些冗余的无意义的数据,优化了系统的性能,提高了web挖掘质量。  相似文献   

8.
信息时代的到来,伴随着海量数据的不断出现,web挖掘为当今海量数据处理提供了强有力的技术手段。介绍了Web挖掘的概念,给出了Web挖掘的三种分类,并针对内容挖掘、结构挖掘、使用挖掘论述了Web挖掘在搜索引擎、电子商务、疾病防治等方面的应用。提出了Web挖掘存在的问题,最后展望了Web挖掘的未来努力方向。  相似文献   

9.
基于危险理论的web文本挖掘研究   总被引:1,自引:0,他引:1  
李士勇  梁家荣  唐志刚 《微计算机信息》2007,23(30):170-171,189
web挖掘是处理Internet环境下数据挖掘的一个重要方向,本文在比较研究传统web挖掘方法的基础上提出了一种基于危险理论的web挖掘新方法,该方法具有很强的自适应性和更新能力,为web挖掘领域提供了一种新的研究思路.  相似文献   

10.
基于web的数据挖掘是一个结合数据挖掘和WWW的热门研究主题,它是现代科学技术相互渗透与融合的必然结果。本文阐述了Web数据挖掘的定义、分类和过程,并对Web数据挖掘的应用与发展前景进行了探讨。  相似文献   

11.
数据挖掘在Web智能化中应用研究   总被引:3,自引:9,他引:3  
分析了Web信息的特点和目前开发利用的局限,提出在Web上采用数据挖掘技术即Web挖掘,促进web智能化的观点。全面阐述了Web挖掘在Web智能化中的几个重要应用。指出Web挖掘是Web技术中一个重要的研究领域,是发现蕴藏在web上知识、区分权威链接、理解用户访问模式和网页语义结构的关键,它使充分利用Web大量的真正有价值的信息成为可能,为智能化Web奠定了基础。  相似文献   

12.
面向电子商务的Web挖掘技术及其应用研究   总被引:3,自引:0,他引:3  
电子商务过程中企业和组织面临一系列网络信息的获取问题,对解决这些问题的Web内容挖掘、Web结构挖掘、Web使用挖掘技术进行了综述,并介绍了Web挖掘技术在智能搜索引擎、企业危机管理、客户关系管理及个性化服务系统中的应用。  相似文献   

13.
Web上的数据量急剧膨胀使得进行Web数据挖掘成为数据挖掘技术研究的热点.而XML能够为Web挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.介绍了XML的和Web文本挖掘的概念,提出了一种基于XML的Web文本挖掘模型,剖析了该模型的各个组成部分,给出了该模型的特点.  相似文献   

14.
互联网上的数据规模大、种类多、变化快,而且越来越复杂。通过数据挖掘和分析,可以获取有潜在价值的信息。但是,传统的数据挖掘系统在数据存储和计算性能上存在瓶颈。通过使用云计算技术,设计了一个基于Hadoop架构的网页日志数据挖掘和分析平台来解决这个问题。同时,为了提高挖掘效率,为大规模网页日志挖掘实现了Apriori算法的并行化,并使用该平台验证了该行算法的效率。  相似文献   

15.
基于Web的文本挖掘   总被引:22,自引:1,他引:22  
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它包含了丰富的信息资源。在茫茫的信息海洋如何快速有效地获取所需要的信息,一直是困绕着网上用户的难题。而Web挖掘可以从这个信息海洋中提取出所需要的有用知识,在一定程度上解决了用户的困绕。该文主要介绍了Web挖掘基本情况,并在此基础上对基于Web的文本挖掘进行了分析研究;给出了一个基于Web的文本挖掘的结构模型图。同时,在Web挖掘和数据挖掘研究的基础上,提出了一个智能化、个性化的现代远程教育系统结构模型。它比传统的远程教育系统具有更大的发展前景。  相似文献   

16.
基于XML的Web数据挖掘模型的设计   总被引:4,自引:0,他引:4  
目前很多网站都是用HTML构建的,要真正做到高效准确的挖掘数据非常困难,XML的出现为基于Web的数据挖掘带来了便利.在研究Web数据挖掘技术的基础上,利用XML数据抽取技术将半结构化数据映射为结构化数据,建立了一个具有基本挖掘功能的面向多种Web数据的挖掘系统模型Web_mining.最后将Agent技术引入数据挖掘,提出了一种基于Agent技术的体系结构,用来实现大容量的数据在分布式存放情况下的数据挖掘,并对基于Web的数据挖掘技术进行深入的研究和探讨.  相似文献   

17.
结合使用挖掘和内容挖掘的web推荐服务   总被引:10,自引:1,他引:9  
随着Internet的基础结构不断扩大和其所含信息的持续增长,Internet用户越来越感觉容易在WWW服务中“资源迷向”。提高用户访问效率的方法有页面预取技术,站点动态重构技术和web个性化推荐技术等。现有的大多数web个性化推荐技术主要是基于用户使用记录的数据挖掘方法,没有或很少考虑结合页面内容—这才是用户真正感兴趣的。该文提出一种结合用户使用挖掘和内容挖掘的web推荐服务,该推荐服务根据频繁最大前向访问路径,提出含有导航页和内容页的频繁访问路径图概念,根据滑动窗口内的最近用户访问页面内容和候选推荐集中页面内容相关性,来向用户提供个性化推荐服务。经推荐质量分析,这种方法具有较好的推荐优化能力。  相似文献   

18.
朱德利 《计算机工程与设计》2006,27(23):4447-4449,4460
XML适合于解决Web数据挖掘中数据库环境异构和信息的半结构化等难题。Web结构挖掘是整个Web信息挖掘的重要组成部分。用XML来完成Web结构信息的预处理是将Web结构信息规范化并转化为XML数据,并以此明确网站的文件构成、组织方式、内容构成和内容的超链关系。提出基于XML的Web结构挖掘系统的实现过程,解决了XML文件通过标准接口读入到挖掘程序的关键技术。  相似文献   

19.
随着Internet技术的高速发展,如何从海量的Web信息中快速而有效地获得所需信息也就成为一项重要课题,而数据挖掘技术是解决这一难题的有效办法。其中数据挖掘中的聚类方法是用来发现数据分布的一项重要方法。本文首先阐述了Web挖掘的有关理论,然后针对Web挖掘中的分层聚类法进行了较为详细的论述,最后使用该算法并结合改进的特征权值计算方法和文本相似度的计算方法,建立了训练文本库。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号