首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为了获取用户访问页面的行为全过程以及准确时间,在网站中建立自动记录离开访问页面机制,准确的记录了用户访问页面的行为的全过程,确保访问日志的完整性和准确性.在此基础上,提出了服务器访问日志数据清理算法,确保准确提取出页面访问时间,从而解决了常见的页面访问时间算法不能准确确定每个页面被访问的确切时间的问题.  相似文献   

2.
把IIS的自动日志保存功能和ASP技术相结合,提出一种Web日志保存方案并予以实现。该方法能够更加全面地获取用户访问信息,为分析用户需求,改进Web站点网页结构提供了丰富的信息:用户访问信息直接存储在Web数据库,为基于Web信息的数据挖掘提供了数据源。该方法已在Web站点的设计和运行中得到实际应用。  相似文献   

3.
李冬 《福建电脑》2012,28(2):133-134
随着互联网搜索引擎的广泛应用,Web Spam对人们产生的危害也日益严重,而Web Spam检测技术却总是无法跟上Web Spam产生的速度。本文提出一种基于网站访问日志分析的Web Spam检测方法,希望对此状况有所改善。  相似文献   

4.
基于Web日志的用户访问模式挖掘   总被引:1,自引:0,他引:1  
Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。  相似文献   

5.
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。  相似文献   

6.
目前最流行Web服务软件恐怕非IIS莫属,它的功能强大,被非常多的服务器用来发布网站。虽然这的强大功能是有目共睹的,但是其安全性问题却不容忽视。由于很多入侵行为都是建立在入侵Web服务的基础上,所以我们有必要对它的安全防范进行深入的了解。  相似文献   

7.
Web日志数据挖掘的数据预处理方法研究   总被引:18,自引:1,他引:17  
主要介绍了Web用户访问日志数据挖掘数据预处理过程,综述了国际上的研究现状。流行的预处理方法。在对用户访问行为的合理假定基础上,最后提出了基于综合最大前向参引模型和时间窗口模型的新方法。  相似文献   

8.
通过结合网站设计初期的网站结构和典型用例的预先定义,构建一个基于Web日志数据的用户访问数据分析系统。该系统(AS-UAB,Analysis System of User Access Behaviors)通过对网站结构和典型用例的预先植入,利用该领域最新的研究方法和结论,为网站相关人员提供可视化的用户访问信息统计及趋势预测,网站结构设计及交互设计上存在的问题及改进建议等通用功能和个性化定制功能。  相似文献   

9.
Web应用环境复杂,传统基于故障测量的方法不能很好地满足系统可靠性度量的需求.充分考虑用户对系统的使用情况,从Web服务器日志中获取用户点击数、传输字节数、用户数和用户会话数,提出基于这四个指标的工作量测量法,并与传统的故障测量法结合,采用Nelson模型进行系统可靠性评估.通过实验比较工作量测量的四种方法与故障测量方法的优劣.结果验证了基于工作量测量的方法能更稳定地评估Web应用的可靠性.  相似文献   

10.
陶剑文 《微计算机应用》2006,27(3):293-293,301
MAWLMS为基于移动Agent技术的四层体系结构,包括用户访问层、Web服务器层、移动代理层和持久数据层, 用户访问层:用户可通过Web访问,角色不同的用户页面显示不同,一般用户只是允许查询,而作为管理用户提供管理界面,可以实现配置代理以及监控目前的过程。  相似文献   

11.
一种基于云理论的Web日志定性规则提取方法   总被引:1,自引:0,他引:1  
通过对Web日志中用户访问模式规则抽取方法的研究,提出一种基于云理论的Web日志定性规则提取方法。该方法分析了影响用户兴趣度的时间因素,利用云模型表示关联规则挖掘中支持度和置信度的“软阈值”,采用云变换过程来实现各页面停留时间定性概念的划分,克服了边界过硬的问题。与传统方式相比,该方法挖掘出的规则是一种基于时间概念的多条件多规则的定性描述形式,能够灵活地反映Web用户访问模式的规律性。  相似文献   

12.
基于分布式的Web log挖掘模型   总被引:1,自引:0,他引:1  
本文提出了一种基于分布式web log挖掘模型,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担,体现并行计算、异步挖掘、异构数据挖掘的优点。  相似文献   

13.
针对二元的互关联后继树模型进行改进,构造三元互关联后继树,并结合Web日志的特点,构造Web事务集的互关联后继树和增量更新模型,设计基于三元互关联后继树的频繁路径挖掘算法,挖掘Web日志中的频繁路径。通过实验证明了基于三元互关联后继树和改进后的模型的出色插入查询性能。  相似文献   

14.
本文将互关联后继树(Inter-Related Suffix Tree,IRST)模型应用于Web日志事务挖掘,构造Web日志事务集的互关联后继树结构,从中挖掘频繁路径。通过实验证明了基于IRST的Web日志挖掘系统有优秀的性能。  相似文献   

15.
电力数据安全随着电力信息网与互联网的接入变得尤为严峻,其数据与规模愈加庞大复杂。为了对其进行有效的安全分析及特征提取,提出一种基于特征提取的SQL注入攻击检测模型。从Web访问日志中提取SQL注入语法特征和行为特征,得到语法特征矩阵和行为特征矩阵数据集。以漏报率和误报率为评价指标,选取K-means、Naive Bayes、SVM和RF算法分别在两类数据集上实验。实验结果表明,与以语法特征矩阵作为数据集相比,行为特征矩阵在SQL注入攻击检测中具有更好的效果。此外SVM和RF检测效果较好,具有较低的漏报率和误报率,该方法能有效检测出SQL注入攻击。  相似文献   

16.
Web日志挖掘中的序列模式识别   总被引:16,自引:0,他引:16  
Web日志挖掘的基本思想是将数据挖掘技术应用于 Web服务器的日志文件 .本文从 Web日志挖掘过程预处理阶段的结果用户会话文件开始 ,提出了一种基于扩展有向树模型进行用户浏览模式识别的 Web日志挖掘方法 ,并在实验室对该方法进行了简单实现和实际日志数据的测试 .  相似文献   

17.
Web信息集成技术研究   总被引:24,自引:0,他引:24  
信息系统集成技术已经历了二十多年的发展,研究者已提出了很多信息集成的体系结构和实现方案,然而这些方法研究的主要集成对象是传统的异构数据库系统。随着Internet的飞速发展,网络迅速成为一种重要的信息传播和交换的手段,尤其是Web上,有着及其丰富的数据来源。如何获取Web上的有用数据并加以综合利用,即构建Web信息集成系统,成为一个引起广泛关注的研究领域。本文结合自己的研究工作,对这一领域的研究做了简单的综述,对有关的研究问题给出了分析。  相似文献   

18.
一种基于情境的语义Web服务发现方法   总被引:1,自引:0,他引:1  
在普适计算环境下,如何结合情境信息以发现满足用户需求的服务,是目前Web服务研究的一个关键问题.提出一种基于情境的Web服务发现框架,采用本体进行情境建模,利用用户反馈信息进行权重计算,并给出了一个基于相似度的语义Web服务的匹配算法.最后通过实验验证了该方法的有效性.  相似文献   

19.
Web日志挖掘中会话识别方法研究   总被引:3,自引:0,他引:3  
提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性.相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面访问时间阈值,进行会话识别时具有更高的效率和真实性.  相似文献   

20.
提出并实现了一种针对HTML文档的页面分割方法,其目的是为了能有效提取新闻网页的正文以进行数据挖掘.基本思想是通过模拟网页浏览器的部分渲染工作,来还原HTML文档中每个标签在浏览器窗口上的显示位置,并以此对页面分割,用于提取一些重要区域的信息.在实验中,对10多个知名新闻站点如新浪、网易、TOM新闻等,利用这一方法提取其网页中的新闻正文,准确率在88.5%左右,表明了这一方法的有效性和可行性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号