共查询到19条相似文献,搜索用时 296 毫秒
1.
基于网络用户行为的相关页面挖掘模型 总被引:11,自引:0,他引:11
郭岩 《微电子学与计算机》2003,20(5):76-82,109
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。 相似文献
2.
文章提出了一种基于ISODATA的用户访问路径聚类算法,根据用户的访问兴趣定义了相似性测量手段和聚类中心。在对Web站点的访问日志进行事务识别后,根据群体用户对Web站点的访问顺序进行聚类,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。 相似文献
3.
基于兴趣度的Web用户聚类方法 总被引:1,自引:1,他引:0
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法.通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果. 相似文献
4.
基于特征事务元素的用户事务聚类方法研究 总被引:4,自引:2,他引:2
针对现有用户访问事务聚类算法复杂度较高的问题,文章提出了一种新的用户事务聚类算法。首先对用户事务中访问过的页面浏览次数和时间进行综合统计,并定义了函数,将其映射为页面访问时间属性值;其次通过抽取事务的特征事务元素集,建立新的聚类对象集事务,实现对原有事务的降维。最后给出计算事务相似度的方法.并得到一个模糊相似度矩阵以实现事务聚类。该算法具有较高的准确性,计算复杂度低,扩展性好,可以广泛地应用于电子商务领域。 相似文献
5.
6.
面向Weblog的协同聚类算法具有同时发现用户聚类及与之对应的页面聚类的能力,已成为Weblog数据挖掘的重要研究内容。由于现有的面向Weblog的协同聚类算法大多采用硬划分方法将用户和页面分配到聚类,因此,无法很好地处理聚类边界的问题,即一个用户可能属于多个聚类,从而影响了聚类质量。该文给出了一种面向Weblog的模糊协同聚类FCOW(Fuzzy CO-clustering for Weblog)算法来解决协同聚类算法的边界问题,以提高聚类结果的质量。该算法首先利用矩阵Hadamard积运算发现Weblog中隐含的独立用户模式1={,,K}PA pa pa;其次,依据pa k所对应的页面子集将剩余用户分配到该独立模式中,从而产生协同聚类结果 {k,k}CS CP,k=1,,K;最后计算每个用户和页面与协同聚类之间的模糊隶属度,并以该隶属度作为个性化推荐的依据。实验结果表明,FCOW算法具有获得高质量聚类结果的能力。 相似文献
7.
8.
个性化服务中用户兴趣聚类算法研究 总被引:2,自引:0,他引:2
讨论了个性化服务中用户兴趣建模对聚类算法的要求,指出经典聚类算法应用于用户兴趣聚类时的不足。在基于图论的K近邻聚类算法的基础上进行改进,提出一种基于相似度的聚类算法。实验证明,与K近邻算法相比,该算法能够显著提高聚类质量,有效区分孤立点,适用于用户兴趣聚类。 相似文献
9.
结合关联规则与模糊C均值聚类(Fuzzy C-Means,FCM)进行用户聚类,首先将用户访问事务集构造出页面关联矩阵,以此来计算用户浏览路径之间的相似程度,接着利用FCM算法对用户进行聚类.通过与传统聚类比较的实验证明,此方法是有效的且更符合实际. 相似文献
10.
一种基于用户访问模式优化网站结构的算法 总被引:1,自引:2,他引:1
提出一种算法,通过挖掘Web日志中的关联规则,发现用户访问兴趣间的关联度和站点拓扑结构的不一致,并结合网站既有的拓扑结构,对于通常在用户的某次浏览过程中同时被访问.但在网站拓扑中相距较远的内容页面集,增加页面间的直接链接,最终实现网站系统结构的调整、优化,提高网站的访问效能。 相似文献
11.
12.
13.
网页信息抽取方法的研究 总被引:2,自引:0,他引:2
信息抽取技术属于人工智能的一个分支.使用信息抽取技术可以人性化地从网页中把人们需要的信息抽取出来.文中提出的信息抽取技术是基于DOM和网页模板的一种归纳网页模板的新方法,它能很好地对各种布局元素的网页进行模板归纳,同时给出核心算法的C++实现. 相似文献
14.
本文将压缩感知图像恢复问题作为低秩矩阵恢复问题来进行研究.为了构建这样的低秩矩阵,我们采样非局部相似度模型,将相似图像块作为列向量构建一个二维相似块矩阵.由于列向量间的强相关性,因此该矩阵具有低秩属性.然后以压缩感知测量作为约束条件对这样的二维相似块矩阵进行低秩矩阵恢复求解.在算法求解的过程中,使用增广拉格朗日方法将受限优化问题转换为非受限优化问题,同时为了减少计算复杂度,使用基于泰勒展开的线性化技术来加速算法求解.实验表明该算法的收敛率、图像恢复性能均优于目前主流压缩感知图像恢复算法. 相似文献
15.
为了有效地的恢复遮挡点,本文提出一种迭代二次规划遮挡点恢复方法,该方法首先分别利用图像矩阵的行向量和列向量在图像矩阵生成的正交补空间上的投影为0的特性,构造行和列余差函数,同时,对遮挡点分别按行为主序和列为主序进行排列,利用排列后这两者之间存在一个变换关系,将行和列余差函数统一表示为一个二次优化目标函数.该方法同时考虑了遮挡点在行和列两个方向的约束,而且将遮挡点求解转化为迭代求解一个二次规划问题.实验结果表明,本文方法具有收敛速度快,恢复精度高等优点. 相似文献
16.
17.
提出了一种基于LCS的特征树最大相似性匹配网页去噪算法.通过将目标网页和相似网页转化为特征树,并将特征树映射为一个特征节点序列,利用LCS算法能获得最长子序列全局最优解的特点,找出两棵特征树之间的不同节点作为候选集,并对候选集进行聚集评分找出网页重要内容块.给出了算法的原型系统,并对每一个模块的实现做了详尽的描述. 相似文献
18.
Li Lei Niu Zhisheng 《电子科学学刊(英文版)》2007,24(2):257-260
A spatial compatible user grouping algorithm is proposed to reduce CoChannel Interference (CCI) in Space Division Multiple Access (SDMA) multiuser Multiple Input Multiple Output (MIMO) systems. We evaluate the interferences among Users by use of distances between row spaces spanned by users' channel matrixes, then control frequency sharing according to the compatible user grouping algorithm. Results show that the row space distance algorithm outperforms others because it can fully utilize the information from users' channel matrixes, especially the matrix structure information. The results also prove that the algorithm based on channel matrix structure analysis is a better candidate for spatial compatibility approximation. 相似文献