期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段. 相似文献

8.

Web日志中时态约束浏览模式挖掘算法研究 总被引：1，自引：0，他引：1

宁慧李红宇吴培莲《哈尔滨工业大学学报》2008,40(9):1474-1480

为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值. 相似文献

9.

面向Web活跃用户的树型访问模式挖掘算法

贝毅君陈刚董金祥《浙江大学学报(工学版)》2009,43(6):1005-1013

传统Web挖掘技术面向所有Web用户,而访问网站时活跃用户与非活跃用户表现特征不同.基于此,提出一种面向活跃用户的访问模式挖掘方法,包括活跃用户会话提取算法(AUSM)和树型访问模式挖掘算法(WAPBUM).AUSM扫描一遍日志数据即可挖掘Web活跃用户并提取会话信息,在提取的用户会话信息基础上,利用网站拓扑结构给出了一种基于树结构的频繁访问模式挖掘算法(WAPBUM).WAPBUM针对Web日志挖掘特点,通过对子树构造等价类,自下而上产生频繁子树.人工数据集和真实数据集上的实验都证明AUSM算法的运行时间与Web日志数据量成线性关系,且运行过程中内存保持稳定;WAPBUM在处理带根子树挖掘时明显快于FREQT算法,所挖掘结果可有效应用于网站结构分析. 相似文献

10.

Web文本挖掘及相关技术研究

白翎雁才书训《沈阳工程学院学报(自然科学版)》2008,4(3)

随着信息的海量化,如何获取用户所需已经日益突显出其重要性.Web文本挖掘可对Web上大量文档集合的内容进行总结、分类、聚类、分析以便于利用.介绍了Web文本挖掘的定义、特点,重点分析了其相关的几种关键技术-文本特征表示、特征子选取、文本分类、文本聚类,并对其发展作以展望. 相似文献

11.

一种基于商务网站CRM的Web挖掘工具架构

王玉珍《北京电子科技学院学报》2008,16(4):99-104

Web挖掘是数据挖掘的新方向之一,其应用领域非常广泛。将基于商务网站的Web数据挖掘工具应用于网站的客户关系管理中,可发现许多客户获取、客户保持等方面的有用信息,有效地使用这些信息可促进商务网站的发展。相似文献

12.

基于Web使用挖掘的电子商务个性化服务研究 总被引：3，自引：1，他引：3

刘建涛《武汉理工大学学报(信息与管理工程版)》2006,28(8):114-117

基于国内外最新研究成果对电子商务中个性化服务的Web使用挖掘进行了深入研究。介绍了个性化服务系统的内涵，提出了Web使用挖掘的基本过程和关键技术，围绕模式识别，研究了其中的一些关键的数据挖掘技术与算法。最后针对电子商务的个性化服务提出了基于Web使用挖掘的体系结构，并对其工作流程进行了简略的介绍。相似文献

13.

Web挖掘技术在服装领域的应用

耿增民周毅灵《北京服装学院学报(自然科学版)》2010,30(3):36-40

服装行业与国民经济及人民的生活消费密切相关,发展迅速.服装工作者为了把握时尚、紧跟国际潮流,需要利用信息获取技术,从数据海洋中获取服装知识,故有必要采用互联网时代的新技术——Web挖掘技术.Web数据挖掘技术如何应用到服装领域在国内外尚属空白,本文论述了数据挖掘和Web挖掘的概念并给出了挖掘技术在服装领域可能的研究方向,对服装专业的教学、科研和服装设计生产单位有一定的指导意义. 相似文献

14.

Web使用挖掘中重建会话的改进算法

庞敏周海英魏海燕《长春理工大学学报(自然科学版)》2009,32(2):288-291

网络使用挖掘是利用数据挖掘技术从网络用户浏览行为中发现各种信息.这些访问请求信息一般被保存在服务器的访问日志中.网络使用挖掘的第一阶段是数据预处理阶段,在数据预处理阶段,首先从服务器日志中过滤出有关信息.之后将属于同一个用户的访问请求合并为一组用户会话.最后将面向时间和面向导航相结合的启发式进行会话构造.在传统的启发式会话构造方法中加入网站拓扑信息,以达到提高会话构造准确性的目的. 相似文献

15.

基于Apriori改进算法的Web日志挖掘支撑工具的实现

陈炼孙金华饶泓廖远林渝《南昌大学学报(工科版)》2007,29(2):190-193,201

Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性. 相似文献

16.

基于电子商务的Web挖掘技术研究 总被引：6，自引：0，他引：6

王玉珍《北京电子科技学院学报》2005,13(4):22-25

Web挖掘是数据挖掘与Web领域相结合的产物.本文首先讨论了Web数据挖掘的基本知识,然后在此基础上深入分析了Web挖掘技术在电子商务领域中的具体应用. 相似文献

17.

基于XML的Web中文文本挖掘系统设计 总被引：1，自引：0，他引：1

张霄军张凌岚《术语标准化与信息技术》2004,(3):31-35

语料本的挖掘和本语料库的建设对语言学研究具有重要意义，因此语料本的挖掘和本语料库的建设就越来越值得探讨。但由于Web上本的半结构化特征和异构本源的问题，在Web上的本挖掘具有很多困难。本提出了将XML技术与Web挖掘技术相结合，根据研究的个人需求定制个性化的Web中本挖掘系统框架和实现方案，并给出了面向法律领域的Web本挖掘系统Laws Miner的实例。相似文献