首页 | 本学科首页   官方微博 | 高级检索  
     

一种动态时间阈值的会话识别算法
引用本文:张晓伟.一种动态时间阈值的会话识别算法[J].山东电力高等专科学校学报,2012,15(4):35-37.
作者姓名:张晓伟
作者单位:泰山职业技术学院 山东 泰安 271000
摘    要:会话识别是网络日志预处理中的重要环节,传统网络日志数据的预处理采用固定阈值会话识别算法,不能较好消除网络日志中的冗余信息。为更好提高后继数据挖掘的效率和精度,提出一种改进的预处理网络日志数据的会话识别算法,根据内容及站点结构确定其重要程度,对时间阈值进行动态控制调整,根据用户对访问内容的兴趣度删除不感兴趣的页面,消除冗余信息。

关 键 词:会话识别  数据预处理  数据挖掘

A Conversation Recognition Algorithm of Dynamic Time Threshold
Abstract:Conversation recognition is an important link in the pretreatment web log. The traditional network log datapretreatment use the fixed time threshold conversation identification algorithms, it can't eliminate the redundant information web logs. We put forward an improved network log data pretreatment of conversation identification algorithms in order to improve the efficiency of data mining and subsequent accuracy. According to the content and structure to determine its important degree site. Improving the time threshold in a dynamic control adjustment. According to the user' interests to eliminate the redundant information.
Keywords:conversation recognition  data pretreatment  data mining
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号