首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
Web日志挖掘的应用   总被引:1,自引:0,他引:1  
李亚哲  杜亚普 《硅谷》2011,(5):136-136
通过利用数据挖掘技术对web日志挖掘,找到用户访问路径、频度、内容、时间等相关信息,发现用户兴趣爱好,改善站点结构、页面内容和外观,提高用户访问兴趣,从而提高网站的可用性。  相似文献   

2.
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、用户识别、会话识别、路径补充、格式化数据。  相似文献   

3.
刘薇 《中国科技博览》2011,(13):282-282
目前,随着网络技术的迅速发展,Web服务的应用越来越多,Web服务日志资源也越来越多,如何分析和利用这些海量的数据已成为研究热点。近年来,国内外学者围绕Web服务交互挖掘技术展开了广泛的研究,取得了显著的成果。  相似文献   

4.
Internet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文就Web挖掘技术的概念、分类、研究现状及其相关实现技术做了详细的阐述,并在此基础上指出其发展方向和趋势。  相似文献   

5.
Web数据挖掘的技术研究   总被引:1,自引:0,他引:1  
Internet应用的普及使得数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用.本文就Web挖掘技术的概念、分类、研究现状及其相关实现技术做了详细的阐述,并在此基础上指出其发展方向和趋势.  相似文献   

6.
张禹 《硅谷》2009,(19)
描述Web结构挖掘中的链接排序算法PageRank与HITS,并讨论两种算法的优劣,同时,介绍目前针对两种算法的缺陷而形成的改进思想。  相似文献   

7.
黄晓伟  章慧云 《硅谷》2008,(22):56-56
关联规则挖掘是指寻找大量数据项集之间有趣的关联或相关关系.是数据挖掘研究的一个重要课题.由于大量数据不停地被收集和存储,因此如何有效地从数据库中挖掘出关联规则获得了研究人员的广泛关注.从Web日志中挖掘用户所访问的页面之间的关联规则,能有效改善网站的结构.提高网站性能和质量,为智能化网站提供有效的依据.  相似文献   

8.
孟丛 《硅谷》2009,(8):44-44
Web数据挖掘是数据挖掘技术在Web信息集合上的应用,Web数据具有本身的特点,Web数据挖掘可以分为三类,各自有其相关技术,Web数据挖掘技术有着广泛的应用,而且随着Internet的不断发展,必将有着更加开阔的应用前景。  相似文献   

9.
随着Web应用的高速发展和广泛普及,在Web服务器上收集大量的Web日志,这些日志记录Web用户对Web页面的每一次访问的过程,是一种宝贵的信息财富。主要介绍数据挖掘技术的应用。  相似文献   

10.
基于Web的用户行为模式挖掘研究   总被引:1,自引:0,他引:1  
邓悦  赵井文 《硅谷》2009,(10):34-34
随着互联网的飞速发展,互联网和人们日常的生活、工作、学习等各方面的结合越来越紧密,Web用户行为模式挖掘能更好的使互联网服务于用户(通过Web个性化服务等方式)。目前,Web用户行为模式挖掘仍然是一个新兴的研究领域,从模式挖掘结构体系、模式挖掘过程,模式挖掘应用等方面对Web用户行为模式挖掘中关键问题的研究进行探讨。  相似文献   

11.
大数据时代迅速增长的商业数据和信息之间的内在联系,备受电子商务经营者的普遍关注。本文基于商业数据和信息之间的关联,较深入地探讨了Web数据挖掘技术相关理论及其在电子商务中的具体应用。  相似文献   

12.
胡俊 《硅谷》2010,(21):175-175
随着数据库技术的发展,高效的数据挖掘算法有助于人们重新认识数据、理解数据。基于FP-树的关联规则挖掘算法FP-growth是当前应用最广的一种挖掘频繁项目集的算法。本文简要描述了该算法的几种主要发展方向。  相似文献   

13.
对Web内容挖掘与Web上的信息搜索内涵进行阐述,并对基于文本的Web内容挖掘及Web上的信息搜索方法进行一些研究和探讨。  相似文献   

14.
随着Internet的发展,Web数据挖掘有着越来越广泛的应用,Web数据挖掘是数据挖掘技术在Web信息集合上的应用。本文阐述了Web数据挖掘的定义、特点和分类,并对Web数据挖掘中使用的技术及应用前景进行了探讨。  相似文献   

15.
Web应用程序难以创建有效的测试用例,如使其既能满足测试的需求,又能测试Web应用程序的多用户交互会话。针对上述问题,采用从Web日志数据中得到域数据创建测试用例的方法,从Web日志中获取用户行为数据和用户会话数据。提出一种基于用户行为和用户会话的测试新方法,通过实验验证该方法在功能覆盖和故障检测方面的有效性。  相似文献   

16.
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法, 挖掘效率是比较低的, 而且只能得到频繁访问路径. 本文在研究访问路径性质的基础上给出了一种能从普通 Web 日志中挖掘出连续频繁访问路径的算法. 设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息. 同时采用分区搜索的方式, 为每个频繁节点构造一棵后缀树, 通过遍历该后缀树挖掘出连续频繁访问路径. 采用这种方法进行挖掘, 无需生成候选集, 而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径.  相似文献   

17.
为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种基于Web的双语词汇相关度的消歧方法,通过构造不同queries并利用搜索引擎抽取返回页面的page counts,最后利用点式互信息来计算词汇间的相关度并用于消歧决策。该方法最好性能(P_(mar)=0.464)超过了国际语义评测Semeval-2007的Task #5上可比较的最好无指导系统TorMd。  相似文献   

18.
针对生物网络中频繁子图的挖掘问题,提出了一种基于FP-树结构的MaxFP算法.此算法以代谢路径作为研究对象,在适合于生物网络图简化模型的基础上,采用一种不产生候选集的改进FP-growth算法挖掘生物网络中的闭合频繁子图.此算法考虑了基于频繁项目集的算法应用于网络的缺陷,根据生物网络的特点对FP-growth算法进行了改进.实验证明,提出的MaxFP算法比基于Apriori的频繁模式挖掘算法运行速度快,不仅能挖掘出最大的频繁子图,且能找到更多具有生物意义的频繁子图.  相似文献   

19.
随着电子商务的发展,Web挖掘进入了一个新的应用领域.文章介绍了Web挖掘技术在电子商务中的具体应用,运用Web挖掘技术对Web数据进行挖掘,了解客户的行为,从而调整站点结构、市场策略等,使电子商务活动具有针对性.  相似文献   

20.
提出了一种从模板网站中利用网络上的冗余内容提取结构化数据的方法。该算法从一些原始网站提取记录来填充种子数据库。然后,在每一个新的站点标识值,为了配合不同跨站点交涉的属性值,我们进行了相似性度量。同时为了过滤掉噪声,我们在那些基于模板的网站发现并应用了该属性的实际值。另外借助SOGOU和NICTCLAS中文分词等第三方接口来准确计算词频,使文字分析更适合人们常用的习惯。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号