首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
为了满足站点上更多用户的需求,基于一种整合Web内容挖掘和使用挖掘的个性化推荐算法,在内容挖掘和使用挖掘的预处理阶段,针对XML文档标签化以及内容动态性的特征,提出了一种新的主题权重以及会话有效性衡量的方法,实验证明该方法的推荐值更具准确性和有效性.  相似文献   

2.
论述了Web上的数据挖掘技术并作了分析和比较,对Web数据挖掘技术的应用也作了分析和展望.  相似文献   

3.
本文首先介绍了Web挖掘的基本概念和分类,通过对Web使用挖掘的分析,从而挖掘出有意义的模式、规则,来帮助管理者决策。  相似文献   

4.
由于web文本挖掘信息量大,且缺乏结构化、组织的规整性,目前几乎多数的互联网查询工具都面临匹配的查准率低、给出的查询结果大量冗余,但是查全率却不高的问题。就Web文本挖掘的相关问题进行分析,在分析web挖掘和其研究方向的基础上,重点对于web文本挖掘进行探讨。  相似文献   

5.
基于关联规则的Web日志挖掘算法   总被引:1,自引:0,他引:1  
分析了经典的基于关联规则的Apriori挖掘算法,对该算法在Web日志挖掘中存在的不足进行了讨论。针对这些不足,对该算法进行了改进,并介绍了算法的具体实现。经实验测试,改进后的算法具有更好的效率。  相似文献   

6.
Web日志挖掘技术的研究与应用   总被引:1,自引:0,他引:1  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

7.
Web日志挖掘预处理研究   总被引:2,自引:0,他引:2  
Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段.  相似文献   

8.
Web日志中时态约束浏览模式挖掘算法研究   总被引:1,自引:0,他引:1  
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.  相似文献   

9.
传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析.  相似文献   

10.
随着信息的海量化,如何获取用户所需已经日益突显出其重要性.Web文本挖掘可对Web上大量文档集合的内容进行总结、分类、聚类、分析以便于利用.介绍了Web文本挖掘的定义、特点,重点分析了其相关的几种关键技术-文本特征表示、特征子选取、文本分类、文本聚类,并对其发展作以展望.  相似文献   

11.
Web挖掘是数据挖掘的新方向之一,其应用领域非常广泛。将基于商务网站的Web数据挖掘工具应用于网站的客户关系管理中,可发现许多客户获取、客户保持等方面的有用信息,有效地使用这些信息可促进商务网站的发展。  相似文献   

12.
基于Web使用挖掘的电子商务个性化服务研究   总被引:3,自引:1,他引:3  
基于国内外最新研究成果对电子商务中个性化服务的Web使用挖掘进行了深入研究。介绍了个性化服务系统的内涵,提出了Web使用挖掘的基本过程和关键技术,围绕模式识别,研究了其中的一些关键的数据挖掘技术与算法。最后针对电子商务的个性化服务提出了基于Web使用挖掘的体系结构,并对其工作流程进行了简略的介绍。  相似文献   

13.
服装行业与国民经济及人民的生活消费密切相关,发展迅速.服装工作者为了把握时尚、紧跟国际潮流,需要利用信息获取技术,从数据海洋中获取服装知识,故有必要采用互联网时代的新技术——Web挖掘技术.Web数据挖掘技术如何应用到服装领域在国内外尚属空白,本文论述了数据挖掘和Web挖掘的概念并给出了挖掘技术在服装领域可能的研究方向,对服装专业的教学、科研和服装设计生产单位有一定的指导意义.  相似文献   

14.
网络使用挖掘是利用数据挖掘技术从网络用户浏览行为中发现各种信息.这些访问请求信息一般被保存在服务器的访问日志中.网络使用挖掘的第一阶段是数据预处理阶段,在数据预处理阶段,首先从服务器日志中过滤出有关信息.之后将属于同一个用户的访问请求合并为一组用户会话.最后将面向时间和面向导航相结合的启发式进行会话构造.在传统的启发式会话构造方法中加入网站拓扑信息,以达到提高会话构造准确性的目的.  相似文献   

15.
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性.  相似文献   

16.
基于电子商务的Web挖掘技术研究   总被引:6,自引:0,他引:6  
Web挖掘是数据挖掘与Web领域相结合的产物.本文首先讨论了Web数据挖掘的基本知识,然后在此基础上深入分析了Web挖掘技术在电子商务领域中的具体应用.  相似文献   

17.
基于XML的Web中文文本挖掘系统设计   总被引:1,自引:0,他引:1  
语料本的挖掘和本语料库的建设对语言学研究具有重要意义,因此语料本的挖掘和本语料库的建设就越来越值得探讨。但由于Web上本的半结构化特征和异构本源的问题,在Web上的本挖掘具有很多困难。本提出了将XML技术与Web挖掘技术相结合,根据研究的个人需求定制个性化的Web中本挖掘系统框架和实现方案,并给出了面向法律领域的Web本挖掘系统Laws Miner的实例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号