首页 | 本学科首页   官方微博 | 高级检索  
     

一种重构网站结构的Web日志挖掘数据预处理方法
引用本文:袁健,金鑫.一种重构网站结构的Web日志挖掘数据预处理方法[J].小型微型计算机系统,2011,32(7).
作者姓名:袁健  金鑫
作者单位:上海理工大学,上海,200093
基金项目:上海市重点学科建设项目(T0502)资助
摘    要:在Web日志挖掘的过程中,数据预处理是整个Web日志挖掘过程的基础,其直接影响了日志挖掘的质量和结果.由于目前大多数网页都采用框架模式,而传统的预处理技术并没有针对frame页面进行过滤,即使过滤,也会导致页面结构的混乱,从而不能够为路径补充提供正确的信息.基于此,本文提出一种基于重构网站结构的Web日志挖掘数据预处理方法以及基于它的路径补充方法.

关 键 词:网站重构  数据预处理  Web日志挖掘  

Data Pre-processing in Web Log Data Mining Based on Reconstructed Web Structure
YUAN Jian,JIN Xin.Data Pre-processing in Web Log Data Mining Based on Reconstructed Web Structure[J].Mini-micro Systems,2011,32(7).
Authors:YUAN Jian  JIN Xin
Affiliation:YUAN Jian,JIN Xin(University of Shanghai for Science and Technology,Shanghai 200093,China)
Abstract:In the process of web log mining,data preprocessing is the basis for the entire mining process,which directly affects the quality and results log mining.Most Web pages are based on the framework model,the traditional pre-processing technology has not filtered the frame pages,even if doing,the filter would lead to confusion in the page structure,so as not to be able to provide the correct information for the complementary path.Based on this,this paper proposes a log data preprocessing based on the reconstruc...
Keywords:reconstructed web structure  data pre-processing  web log data mining  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号