期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

方元康胡学钢夏启寿朱勇《计算机应用与软件》2009,26(1)

会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法.在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别.最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效. 相似文献

2.

Web 日志挖掘中的会话识别方法研究

顾兆军李晓红王伟黄杰培《计算机技术与发展》2012,(4)

数据预处理是 Web 日志挖掘的首要环节,而会话识别是数据预处理中的关键步骤之一.为了更好地实现会话识别、提高会话识别的真实度,从而为后续的模式挖掘工作提供精确的挖掘数据,文中在分析了现有常用的会话识别方法后,提出了优化初始会话集的方法.在该方法中,首先初始会话集的产生采用传统的基于访问时间的方法,然后对初始会话集进行合并和断开操作,生成优化的会话集.最后,采用实验实现了该方法.实验结果表明会话质量得到了提高相似文献

3.

Web日志挖掘中的会话识别方法研究

顾兆军李晓红王伟黄杰培《微机发展》2012,(4):45-49

数据预处理是Web日志挖掘的首要环节,而会话识别是数据预处理中的关键步骤之一。为了更好地实现会话识别、提高会话识别的真实度,从而为后续的模式挖掘工作提供精确的挖掘数据,文中在分析了现有常用的会话识别方法后,提出了优化初始会话集的方法。在该方法中,首先初始会话集的产生采用传统的基于访问时间的方法,然后对初始会话集进行合并和断开操作,生成优化的会话集。最后,采用实验实现了该方法。实验结果表明会话质量得到了提高。相似文献

4.

一种改进的Web日志会话识别方法

方元康 ;胡学钢 ;夏启寿《微机发展》2008,(11):214-216

会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阙值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。相似文献

5.

一种改进的Web日志会话识别方法 总被引：4，自引：0，他引：4

方元康胡学钢夏启寿《计算机技术与发展》2008,18(11)

会话识别是Web日志挖掘中的数据预处理中的一个重要步骤.文中提出了一种改进的会话识别方法.首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性. 相似文献

6.

优化的Web日志会话识别方法 总被引：2，自引：0，他引：2

方元康王汝传《计算机工程与设计》2009,30(7)

关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法.统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阀值,再用页面访问时间阁值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化.通过实验结果表明,该方法所得到的会话集更具有真实性. 相似文献

7.

电子商务网站用户访问模式挖掘中的预处理技术 总被引：6，自引：0，他引：6

郭伟刚《计算机应用》2005,25(3):691-694

对电子商务网站的用户访问模式挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括源数据的采集方法以及数据清理、用户识别、会话识别、事务识别、会话子序列生成等所采用的技术。并给出了框架网页过滤、识别搜索引擎Robot产生的访问记录,以及生成用户会话语义序列的方法。相似文献

8.

Web日志预处理中优化的会话识别方法 总被引：4，自引：0，他引：4

下载免费PDF全文

方元康胡学钢夏启寿《计算机工程》2009,35(7):49-51

针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。相似文献

9.

Web日志挖掘中的会话识别算法 总被引：7，自引：0，他引：7

蔡浩贾宇波黄成伟黄志强《计算机工程与设计》2009,30(6)

会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确.针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法.通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话.最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效.实验结果表明,会话质量得到了提高. 相似文献

10.

Web日志挖掘中一种改进的会话识别方法

周爱武程博《微型机与应用》2010,29(15)

提出了一种改进的会话识别方法.该方法基于访问站点的首页和导航页,以首页或导航页作为新会话开始的标识.选取真实的Web日志,用PL/SQL编程实现改进的会话识别方法,并与现有方法进行比较.实验结果证明,改进的会话识别方法比现有方法识别会话更有效. 相似文献

11.

Web日志挖掘预处理中会话识别算法的优化

李瑞朱鹤祥《数字社区&智能家居》2009,(31)

会话识别是Web日志数据预处理中的重要步骤,直接影响着Web日志挖掘的效率和准确性。在给出会话识别定义的基础上,对传统的预先设定时间间隔方法进行了优化,并具体描述了数据结构及其算法。实验结果证明会话质量得到了提高。相似文献

12.

Web日志挖掘预处理中会话识别算法的优化

李瑞朱鹤祥《数字社区&智能家居》2009,(11):8616-8618

会话识别是Web日志数据预处理中的重要步骤,直接影响着Web日志挖掘的效率和准确性。在给出会话识别定义的基础上．对传统的预先设定时间间隔方法进行了优化,并具体描述了数据结构及其算法。实验结果证明会话质量得到了提高。相似文献

13.

Online smoothness with dropping partial data based on advanced video coding stream

Huey-Min Sun 《Multimedia Tools and Applications》2014,69(3):1021-1040

Most studies of smoothing video stream compute the required bit rate of video transmission to satisfy all the transmitted data. In this paper, our proposed online smoothing with tolerable data dropping algorithm can adjust the bit rate as smooth as possible. Several multimedia encoding schemes, such as advanced video coding (AVC), can support partial data dropping to adapt to available bandwidth network. The AVC stream can be adapted by smoothing algorithm to ensure video quality for a given set of constraints where these constraints may be either static after the session set up or may dynamically change over the session duration. Our algorithm is based on the online minimum variance bandwidth allocation algorithm to look ahead a window of frames, dynamically adjusting the required bit rate such that ensuring smoothness when the buffer encounters underflow or overflow for video stream. Furthermore, we add the scheme of data dropping into this algorithm to increase the possibility of smoothing bit rates. The experimental results show the peak rate, the average ratio of dropped data, and the coefficient of variation for five test sequences with different content characteristics such as the average frame size, the peak/mean ratio of frame size, and the average frame bit rate. Experimental parameters are varied by window sizes and tolerable dropping ratios. The algorithm can significantly reduce the peak rate and the coefficient of variation when the transmitted packets are allowed dropping by a user-defined dropping ratio. 相似文献

14.

利用图片类日志信息改进会话识别质量 总被引：2，自引：0，他引：2

范纯龙姜宏飞李华《计算机应用》2010,30(4):1056-1058

数据预处理是Web日志挖掘的基础,而会话识别则是数据预处理的关键步骤,其质量严重影响Web日志挖掘的结果。在分析现有会话识别方法的基础上,提出了利用数据预处理中废弃的图片等日志数据,并结合扩展Web图结构,从页面分组规则和路径补全算法两个方面改进会话识别质量,并通过实验证实该方法对改善会话识别质量是有效的。相似文献

15.

基于过滤器的Web访问模式挖掘

下载免费PDF全文

佟强周园春吴开超阎保平《计算机工程》2007,33(6):59-61

针对传统Web访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,该文提出了基于过滤器的Web访问模式挖掘系统。它能够准确地识别用户和会话,为挖掘算法提供优质的数据。给出了日志过滤器的实现和部署,提出了Web访问模式的挖掘算法。目前该方法已经广泛地应用于科学数据库系统中。相似文献