共查询到20条相似文献,搜索用时 46 毫秒
1.
介绍一个基于关联规则数据挖掘Web日志分析的实现方法,提出通过对Apriori算法的改进,提高其挖掘效率,根据其结果,达到理解用户行为和改善Web结构的目的. 相似文献
2.
分析了经典的Web日志挖掘算法Apriori的特点,使其具有更高的效率。 相似文献
3.
.基于规则提取量的Web日志关联规则挖掘方法* 总被引:2,自引:0,他引:2
引入规则提取量的度量标准,提出一种基于免疫多克隆遗传策略的Web日志关联规则挖掘方法。该算法在遗传算法的基础上引入免疫多克隆算子,有效地克服了遗传算法容易陷入局部最优的缺点,具有更强的全局与局部搜索能力。实验结果表明,该算法能高效地解决Web日志关联规则挖掘问题。 相似文献
4.
HU Jing-fang 《数字社区&智能家居》2008,(16)
本文旨在研究基于Web环境下利用关联规则对Web日志挖掘的数据分析系统。把关联规则的概念引入到Web日志挖掘中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。然后在Apriori挖掘算法思想的基础上,对其改造,给出了适合挖掘用户访问频繁路径的类Apriori算法。最后设计开发了一个Web日志数据分析系统。此系统主要包含三个功能模块:数据预处理模块、智能分析模块和基本分析模块 相似文献
5.
胡静芳 《数字社区&智能家居》2008,(6):1190-1191
本文旨在研究基于Web环境下利用关联规则对Web日志挖掘的数据分析系统。把关联规则的概念引入到web日志挖掘中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。然后在砷riori挖掘算法思想的基础上,对其改造,给出了适合挖掘用户访问频繁路径的类Apriori算法。最后设计开发了一个Web日志数据分析系统。此系统主要包含三个功能模块:数据预处理模块、智能分析模块和基本分析模块 相似文献
6.
Web日志挖掘是提高Web应用系统效率的有效手段。将Web日志通过预处理形成决策表,运用Roughset理论中的区分矩阵方法进行属性约简,从而获得简洁有效的关联规则,进行用户行为的预测研究。实验效果良好。 相似文献
7.
基于Web日志的隐私保护关联规则挖掘方法 总被引:1,自引:0,他引:1
电子商务网站用户的每次购物会话信息会被记录在Web服务器的日志中,分析这些日志并挖掘出购物篮商品问的强关联规则,可以主动为Web终端用户提供商品推荐,优化网站服务质量.鉴于原始用户会话信息及挖掘结果的隐私保护问题,提出了一种新的数据随机干扰处理方法,即结合列置换的伪列随机化回答方法,先对原始日志信息进行变化和隐藏,然后以此为基础,给出了一种基于住逻辑与操作的高效频繁项集生成算法,进而实现了原始信息及挖掘结果均获得隐私保护的网上购物篮问题的关联规则挖掘.实验结果表明,本方法具有很好的隐私保护性、高效准确性以及适用推广性. 相似文献
8.
分析Web日志数据的特点,把时态约束应用到Web日志数据挖掘中可以获得更好的效率。文章从概化的角度给出了一个基于Web日志的时态关联规则挖掘算法,并用一段用户会话事务数据为例,介绍了具体挖掘过程。 相似文献
9.
10.
11.
基于分布式的Web log挖掘模型 总被引:1,自引:0,他引:1
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。 相似文献
12.
本文将互关联后继树(Inter-Related Suffix Tree,IRST)模型应用于Web日志事务挖掘,构造Web日志事务集的互关联后继树结构,从中挖掘频繁路径。通过实验证明了基于IRST的Web日志挖掘系统有优秀的性能。 相似文献
13.
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设计基于三元互关联后继树的频繁路径挖掘算法,挖掘Web日志中的频繁路径。通过实验证明了基于三元互关联后继树和改进后的模型的出色插入查询性能。 相似文献
14.
基于商空间理论,根据页面特性,首先将每个访问页面映射为页面特性向量,进一步处理得到内容增强型Web事务集合.对内容增强型事务集合按照属性进行基本信息粒的划分,通过对基本粒子集合的引用,在粒子连接及剪枝时减少扫描项目集所在的对象集合,提高算法的运行效率,从而更好地处理海量数据,算法适用于支持度较小、复杂度较高的数据集. 相似文献
15.
信任评估是可信软件中的核心问题.针对Web服务信任的不确定性和主观性特点,引进模糊理论,给出了一种Web服务信任的综合评估方法,同时,以例子说明了这种方法的应用.最后,描述了评估模型的实现. 相似文献
16.
一种基于粗集理论的分类规则挖掘的实现方法 总被引:8,自引:0,他引:8
研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。基于粗集理论的分类规则挖掘是一种重要的方法,在分析有关算法的基础上提出一种改进方法,并通过实例证明了该方法的效率有所提高。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。 相似文献
17.
Web包装器是根据特定的抽取规则从特定的Web数据源执行数据抽取程序,设计Web包装器是Web信息抽取和集成的关键技术.针对网页结构的不确定性和易变性,详细阐述了一种基于预定义模式的Web包装器的设计与实现过程,并选取了几个出版社的新书发布Web页面进行了数据抽取验证和抽取结果分析,取得了较好的效果.充分体现了此Web包装器的可行性,并具有一定的高效性及可维护性,能够应用在基于Wrapper/Mediator方法的Web数据集成. 相似文献
18.
基于Web的CSCW在企业环境中的实现方法 总被引:5,自引:0,他引:5
本文首先对企业的特点和协同机制理论加以研究和总结,阐述了在企业网络解决方案中运用CSCW技术的必要性。在此基础上,用ActiveX和Java等技术构建了一个可运用在企业中的CSCW系统。 相似文献
19.
一种基于动态时间阈值的会话识别方法 总被引:2,自引:1,他引:2
会话识别是Web日志挖掘的关键步骤,会话识别的质量直接影响后续挖掘的准确性。在Timeout方法固定时间阈值的基础上,提出动态时间阈值,通过对样本日志的分析,得到不同时段的时间阈值。在处理日志文件时,根据当前会话开始记录的访问时间选择时间阈值。实验表明,该方法识别会话的质量比Timeout方法有了明显提高。 相似文献
20.
一种基于数据挖掘的Deep Web模式匹配方法 总被引:1,自引:0,他引:1
模式匹配是Deep Web异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配.主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘技术的算法(Correlated-clustering).该算法先利用积极相关发现组匹配,再通过概念相似度的计算聚类同义属性,最后进行匹配选择.实验结果表明,本算法全面、效率高,充分体现了整体性方法的思想. 相似文献