期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

Web用户访问模式挖掘研究 总被引：5，自引：0，他引：5

陈新中李岩等《计算机科学》2003,30(3):27-29

1 引言目前World Wide Web(WWW)已经发展成为拥有近亿个工作站、数十亿页面的分布式信息空间,在这个分布式信息空间中蕴涵着具有巨大潜在价值的知识,也带来了巨大的经济效益和社会效益。对于不同层次、不同使用目的和爱好的浏览者需要个性化的信息服务,希望网站能够根据自己的浏览习惯,动态定制相似文献

2.

基于Web日志的用户访问模式挖掘 总被引：1，自引：0，他引：1

王新马万青潘文林《计算机工程与应用》2006,42(21):156-158

Web日志挖掘是数据挖掘技术在Web日志数据存储中的应用。论文介绍了Web日志挖掘,在分析发现用户访问模式方法——类Apriori算法的基础上,给出一种基于粗糙集的用户访问模式聚类方法。相似文献

3.

基于用户访问记录的Web挖掘研究

何典宋中山刘济波《计算机系统应用》2007,16(4):57-60

从Web日志挖掘存在的困难和不足出发,结合电子商务个性化服务的特点,引入用户访问记录进行Web挖掘,提出了一种Web挖掘中数据采集与预处理的新思路,指出了该思路的实现方法和特点。提出了引入用户访问记录后的Web挖掘体系结构。相似文献

4.

用户访问兴趣路径挖掘方法 总被引：1，自引：1，他引：1

褚红丹焦素云马威《计算机工程与应用》2008,44(35):135-137

针对当前挖掘用户访问模式算法仅将频繁访问路径作为用户浏览兴趣路径的问题,依据使用Web日志挖掘用户兴趣页面时,通过引入页面信息量参数,综合考虑页面访问次数、浏览时间和页面信息量大小来定义用户兴趣度,提出了基于兴趣度的用户访问模式挖掘算法。实验证明该算法是有效的,在用户浏览兴趣度量方面比当前的频繁访问路径挖掘算法更准确。相似文献

5.

基于不规则路径聚类算法的用户访问模式挖掘

杨彦玲任燕段隆振刘飞荣李磊《计算机与现代化》2010,(4):91-93

通过分析目前主流的Web用户访问模式挖掘的技术方法,针对各种挖掘算法存在复杂度高、灵活性低的缺陷,本文提出一种能对不规则用户访问路径进行用户访问模式挖掘的聚类算法,该算法可以简单高效地挖掘不定长度的用户兴趣模式。相似文献

6.

基于区域—频道访问度的民意热点信息挖掘算法

孟令达周喜《计算机应用研究》2013,30(7):1939-1941

为了有效地从电子政务网站的Web日志中挖掘民众关注的热点信息, 提出基于区域—频道访问度的民意热点信息挖掘算法——PHIMA算法。该算法在分析目前Web日志挖掘算法存在的问题的基础上, 利用提出的区域—频道访问度概念设计Web访问矩阵, 并基于该矩阵结合区域—频道访问度和灰关联分析法提出。实验表明算法能有效地挖掘民意热点信息, 可用于电子政务网站站点优化、个性化服务和为决策者提供决策支持等。相似文献

7.

用户访问模式挖掘中数据预处理问题的研究 总被引：5，自引：0，他引：5

邓英李明《计算机工程与应用》2002,38(1):188-190

首先给出了用户访问模式挖掘的概念,然后主要对用户访问模式挖掘中的数据预处理工作中碰到的一些问题及对这些问题的解决方法进行了较为详细的描述。相似文献

8.

基于访问日志的网页内容监控挖掘系统

下载免费PDF全文

丘海澜文翰肖南峰《计算机工程》2011,37(4):70-72

URL是用于完整描述Internet上网页和其他资源地址的一种标识方法,URL访问日志能记录用户的上网痕迹。针对该特点,提出一种基于访问日志的网页内容监控挖掘系统,实现网页内容抓取、监控、分析、报表生成等一系列过程的自动化。系统运行测试结果表明,该系统的准确率较高,能有效解决运营商和互联网监管部门的网络监管问题。相似文献

9.

基于Web挖掘的远程教育课件访问模式分析系统 总被引：1，自引：0，他引：1

赵宝华《计算机应用与软件》2009,26(3)

课件访问模式分析系统利用Web使用挖掘技术对服务器日志进行挖掘,通过对用户浏览课件的学习行为进行分析从而为课件制作的优化、教学监控的实施以及教学管理等提供决策依据.提出的系统是对现存相关产品的完善和有益的补充. 相似文献

10.

基于BIPL的Web频繁访问模式挖掘

下载免费PDF全文

吴雅双张东站《计算机工程与应用》2008,44(23):136-138

挖掘频繁访问模式是Web日志挖掘的一个重要任务。针对类Apriori算法和GITC算法的不足,提出了基于双亲链的单次扫描求交的Web频繁访问模式挖掘算法—BIPL,该算法首先对用户的访问模式两两进行交集运算,生成候选访问模式,并在求交集过程中保存各个候选访问模式的双亲模式,然后通过简单的求和运算,计算出各个候选访问模式的支持数。最后通过理论分析和实验验证,该算法是稳定的和高效的。相似文献

11.

基于WWW的信息挖掘 总被引：3，自引：0，他引：3

王振强《中国计算机用户》1997,(10):5-6

本文介绍了信息挖掘的概念以及WWW和信息挖掘的商业意义,简要论述了基于WWW的信息挖拙的应用框架,并探讨了其应用、实现和进一步研究的方向。相似文献

12.

Web挖掘中基于GITC算法发现用户频繁访问模式

下载免费PDF全文

欧阳一鸣郭维郭骏孙超超《计算机工程与应用》2007,43(7):191-194

用户频繁访问模式的发现是Web日志挖掘的重要研究内容。本文提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发现用户频繁访问模式。相似文献

13.

有序概念格与WWW用户访问模式的增量挖掘 总被引：7，自引：1，他引：7

金阳左万利《计算机研究与发展》2003,40(5):675-683

访问模式是用户沿URL超链寻找和浏览网页规律的总结 ,发现用户访问模式对于帮助用户快速到达目标页面 ,进而实现搜索引擎的个性化导航具有重要意义目前虽有一些挖掘用户访问模式的工作 ,但尚未发现能够处理增量数据的系统化挖掘算法用户访问模式挖掘可由如下 3个步骤完成 :①由日志库提取最大向前关联路径 ,②由最大向前关联路径发现频繁关联路径序列 ,③由频繁关联路径序列得到最大频繁关联路径序列 ,其中②是问题的核心为得到系统化算法 ,对概念格模型加以顺序约束 ,提出了有序概念格 ,并将其用于Web访问模式的增量发掘给出了增量式高效挖掘算法 ,并与相关工作进行了比较 ,对合成数据和实际数据的实验结果验证了算法的有效性相似文献

14.

马尔科夫链在域名信息探测中的应用

胡荣贵许成喜汪永益张亮《计算机应用与软件》2015,(6)

域名信息探测是企业网络安全评估和渗透测试的重要内容。针对当前蛮力扫描和DNSenum等基于字典的探测方法普遍存在获取信息不全、过度依赖数据字典的问题,建立了基于Markov链的域名结构模型,提取出域名起始字符集合与分布、状态转移矩阵等域名统计与分布特征,提出了一种新域名的生成算法。对.com、.net和.org三类通用域名进行抽样探测,实验结果表明,该算法在探测域名数量、探测域名集的区分度和探测效率上优于现有方法 DNSenum。相似文献

15.

基于增量式蚁群聚类的用户访问模式挖掘

沈洁林颖陈志敏赵敏涯《计算机应用》2005,25(7):1654-1657

提出一种新的用户访问模式增量式聚类算法：首先引入一种新的用户兴趣表示方法构造用户访问特征对象,再基于蚁群聚类的基本思想,利用人工蚂蚁依相邻区域对象相似性拾起或放下对象实现聚类;然后使用一种类解体机制,随着用户兴趣度的变化而形成新的类别,从而实现增量式聚类更新发现用户新的访问兴趣。实验结果表明,该方法能动态有效地实现增量式聚类。相似文献

16.

基于会话分类的Web用户访问模式挖掘研究

吴海燕朱靖君高国柱程志锐《小型微型计算机系统》2010,31(9)

随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础上分别对3类用户的访问模式进行挖掘.通过会话分类可以提高挖掘的效率与准确性.其中重点研究了人类用户的访问模式挖掘,提出一种基于用户访问路径树的事务识别方法,并对PrefixSpan算法进行了改进.这套方法在实验中取得了很好的挖掘效果. 相似文献

17.

基于Internet信息挖掘的Agent通信协议

王斌张尧学陈建二陈松乔《计算机科学》2002,29(8):85-87

相似文献

18.

基于用户访问树的Web日志挖掘数据预处理 总被引：1，自引：0，他引：1

刘加伶范军《计算机科学》2009,36(9):154-156

在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果.提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理. 相似文献

19.

基于用户访问模式挖掘的网页实时推荐研究 总被引：1，自引：1，他引：1

张慧颖梁伟《计算机应用》2004,24(6):70-73

文中将数据挖掘技术用于Web日忘文件的挖掘,提出一个简单高效的关联规则和序列模式挖掘算法Predictor,谊算法具有较快的响应速度．可以满足实时页面推荐的需要,同时该算法还可以进行增量挖掘。相似文献

20.

基于用户访问序列的实时网页推荐研究

杨正余王卫平《计算机系统应用》2008,17(5):50-53

应用序列模式挖掘的网页推荐系统具有较高的准确率。但是,目前广泛应用的基于树型结构的序列模式挖掘在页面推荐前需花费大量时间来统计历史访问页面的访问次数,降低了推荐效率。本文介绍了一种智能化网页推荐系统模型,该方法无需统计每个页面的访问次数,避免了重复访问数据库,且利用用户即时访问的滑动窗口,直接在模式树中搜索相匹配的访问规则,加快了推荐速度,较好地满足页面推荐实时快速的要求,最后试验表明其具有较好的推荐效果。相似文献