期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于页面内容和站点结构的页面聚类挖掘算法 总被引：16，自引：0，他引：16

杨怡玲管旭东尤晋元《软件学报》2002,13(3):467-469

提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高. 相似文献

2.

基于页面聚类的推荐算法的改进

张海玉刘志都杨彩贾松浩《计算机应用与软件》2008,25(9)

基于页面聚类的推荐算法常被应用在个性化推荐系统中,但是很少考虑页面访问的顺序性.针对这种弊端,提出了一种新的路径相似度系数,同时在推荐算法中运用了关联规则,提高了推荐结果的准确性. 相似文献

3.

模糊动态聚类算法在网络教育中的应用

国伟王浩《电脑开发与应用》2007,20(6):51-53,57

针对当前大部分网站使用的是动态页面,分析日志比较困难的问题,给出了在动态网页环境下Web使用记录挖掘的数据采集方法;为了使计算简单、快捷,给出了一种Web用户和页面的直接模糊聚类算法,从而能够根据学生的访问规律对页面内容进行分类、总结和预测趋势,指导高校网站的建设,提高网络教育,具有很好的实用价值。相似文献

4.

一种新的Web用户群体和URL聚类算法的研究

宋江春沈钧毅《控制与决策》2007,22(3):284-288

提出一个基于Web日志的web用户群体和站点URL聚类算法．使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类．由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高．同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性．最后对算法的有效性和可伸缩性进行了研究．相似文献

5.

模糊聚类的最大树算法在Web页面分类中的应用 总被引：5，自引：0，他引：5

刘琦林怀忠陈纯《计算机应用研究》2004,21(11):286-287

通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快捷,适合处理高维数据的特点。相似文献

6.

Web页面和客户群体的模糊聚类算法 总被引：17，自引：0，他引：17

宋擒豹沈钧毅《小型微型计算机系统》2001,22(2):229-231

web日志挖掘在电子商务和个性化web等方面有着广泛的应用.文章介绍了一种web页面和客户群体的模糊聚类算法.在该算法中,首先根据客户对Web站点的浏览情况分别建立Web页面和客户的模糊集,在此基础上根据Max—Min模糊相似性度量规则构造相应的模糊相似矩阵,然后根据模糊相似矩阵直接进行聚类.实验结果表明该算法是有效的. 相似文献

7.

一种面向WEB页面的标记聚类方法

焦永强王维扬尚颖《计算机与数字工程》2020,48(5):1148-1153,1200

相似文献

8.

基于页面聚类的Web应用测试方法研究

下载免费PDF全文

尤枫张雅峰赵瑞莲马金慧《计算机工程与应用》2018,54(5):51-56

现有的Web测试是由前端出发,通过分析页面DOM结构来获取状态与状态跳转的条件。但现有技术是将任何DOM节点的改变都认定为产生了新的DOM树,如果对于任何改变DOM结构的操作都认为是新操作来重新生成测试用例会浪费相当的时间和人力。提出一种基于页面DOM相似度的Web应用单元测试方法。利用爬虫程序获取页面状态与相应的DOM结构;利用DOM相似度对DOM进行评价,并对DOM状态进行分类,利用分类簇的中心作为相应功能的操作结果,返回应用中寻找相应的代码块并且进行测试。实验结果表明：该方法可以有效地降低“单一DOM对应单一状态”模式中的冗余状态跳转,可以达到合理的功能发现率,同时有效降低冗余的待测试状态。相似文献

9.

Web页网和客户群体的模糊聚类算法 总被引：3，自引：0，他引：3

宋擒豹沈钧毅《小型微型计算机系统》2001,22(2):229-231

Web日志挖掘在电子商务和个性化Web等方面有着广泛的应用。文章介绍了一种Web页面和客户群体的模糊聚类算法。在该算法中,首先根据客户对Web站点的浏览情况分别建立Web页面和客户的模糊集,在此基础上根据Max-Min模糊相似性度量规则构造相应的模糊相似矩阵,然后根据模糊相似矩阵直接进行聚类。实验结果表明该算法是有效的。相似文献

10.

基于相对Hamming距离的Web聚类算法

李彬汪天飞刘才铭张建东《计算机应用》2011,31(5):1387-1390

针对Web使用挖掘中聚类结果准确性不高的问题,提出了一种改进的基于相对Hamming距离和类不一致度的聚类算法。该算法首先以Web站点的URL为行、以UserID为列建立关联矩阵,元素值为用户的访问次数;然后,对所建立关联矩阵的列向量或行向量进行相似性度量,获得相似客户群体或相关页面。实验表明,该算法具有较高的准确性。相似文献

11.

Ranking Pages by Topology and Popularity within Web Sites

José Borges Mark Levene 《World Wide Web》2006,9(3):301-316

We compare two link analysis ranking methods of web pages in a site. The first, called Site Rank, is an adaptation of PageRank to the granularity of a web site and the second, called Popularity Rank, is based on the frequencies of user clicks on the outlinks in a page that are captured by navigation sessions of users through the web site. We ran experiments on artificially created web sites of different sizes and on two real data sets, employing the relative entropy to compare the distributions of the two ranking methods. For the real data sets we also employ a nonparametric measure, called Spearman's footrule, which we use to compare the top-ten web pages ranked by the two methods. Our main result is that the distributions of the Popularity Rank and Site Rank are surprisingly close to each other, implying that the topology of a web site is very instrumental in guiding users through the site. Thus, in practice, the Site Rank provides a reasonable first order approximation of the aggregate behaviour of users within a web site given by the Popularity Rank. 相似文献

12.

基于Web页面结构和主色调的聚类算法

下载免费PDF全文

赵涓涓陈俊杰李元俊《计算机工程》2010,36(3):1-3

针对目前Web聚类准确率不高的问题,提出一种基于Web页面链接结构和页面中图片主色调特征的聚类算法。通过分析Web页面中的链接结构和Web页面中所显示图片的主色调来比较页面之间的相似度,对Web站点中的Web页面进行聚类。聚类过程兼顾Web页面结构和页面的主要色彩特征。系统实验结果表明,该算法能有效提高聚类的准确性。相似文献

13.

基于链接关系的网页分类优化算法

蒋宗礼时福林《计算机与现代化》2014,(5):14-17

针对基于链接关系的网页分类算法中存在噪声邻域网页干扰分类结果的问题,提出利用网页间的相似度进行优化的方法。为不同关系的满足相似度阈值的邻域网页分别设置不同的权值,同时结合支持向量机对网页的分类结果,计算得到网页的类别。实验表明,本文算法准确率、召回率和F1值均有所提高。  相似文献

14.

Optimizing Web Servers Using Page Rank Prefetching for Clustered Accesses

Safronov Victor Parashar Manish 《World Wide Web》2002,5(1):25-40

This paper presents a Page Rank based prefetching technique for accesses to Web page clusters. The approach uses the link structure of a requested page to determine the most important linked pages and to identify the page(s) to be prefetched. The underlying premise of our approach is that in the case of cluster accesses, the next pages requested by users of the Web server are typically based on the current and previous pages requested. Furthermore, if the requested pages have a lot of links to some important page, that page has a higher probability of being the next one requested. An experimental evaluation of the prefetching mechanism is presented using real server logs. The results show that the Page-Rank based scheme does better than random prefetching for clustered accesses, with hit rates of 90% in some cases. 相似文献

15.

Web模糊聚类方法及其应用 总被引：5，自引：0，他引：5

刘茂福何炎祥彭敏《计算机科学》2005,32(1):155-158

本文提出了Web模糊聚类的概念,给出了Web模糊聚美的过程模型WFCM并进行了详细阐述,沦述了Web模糊聚类在Web访问信息挖掘中,尤其是在Web用户聚类和Web页面聚类方面的应用．最后用实例证明了在Web页面聚类中使用Web模糊聚类的可行性。相似文献

16.

基于马尔可夫链的网页间距离衡量方法

下载免费PDF全文

熊智郭成城《计算机工程》2008,34(5):110-112

HTTP/1.1的持续连接特性会给基于内容请求分发的Web集群服务器带来额外的开销。为减少这种开销,可将用户经常一起访问的网页组成簇并以簇为单位来分布文档。如何衡量网页间的距离是网页组簇的关键问题。该文提出一种基于马尔可夫链的衡量网页间距离的方法,该方法同时考虑了用户访问的时间相关性和用户的访问路径。实例表明,与基于时间相关性的衡量网页间距离的方法相比,采用该衡量方法能更有效地减少网页组簇后HTTP/1.1持续连接所带来的额外开销。相似文献

17.

网站结构和内容对Web使用挖掘的影响

刘丽珍宋瀚涛陆玉昌《计算机科学》2003,30(6):82-83

The Paper emphasizes relativity between Web usage mining and the application of Web site structure and content.It has shown that the amount of effort involved in processing and quantifying the structure and content of a Web site is well worth in performing Web usage mining.The necessity of combining Web site structure and content with Web usage mining process is further proved. 相似文献

18.

用N-连字算法实现网页的相似度比较

火善栋《现代计算机》2007,(9):21-22

提出并实现了一种N-连字算法,用该算法可以较好地实现网页的相似度比较,用本算法来实现网页的"去重",效果尤为明显. 相似文献