共查询到10条相似文献,搜索用时 687 毫秒
1.
了解用户的兴趣所在是电子商务网站的一项重要工作。文中提出了一种分析用户兴趣度的新方法.该方法综合考虑了用户浏览网页的时间长度、点击网页的次数、网页的类型和内容,它首先将网站的内容归纳为若干主题,然后利用模糊综合评判得出用户对于某主题的兴趣度,再与网站主题的平均兴趣度水平作对比,从而发现用户的兴趣所在。实验表明该方法是有效的。 相似文献
2.
了解用户的兴趣是电子商务网站实现个性化的基础,该文提出了一种分析用户兴趣度的新方法,该方法首先根据网站主索引页上的超链接将网站上的网页模糊分类,并通过对Web日志的统计,得出各交叉页的模糊度,然后综合考虑用户浏览网页的时间长度、点击网页的次数,利用模糊综合评判得出用户对于各网页分类的兴趣度,再与各网页分类的平均兴趣度水平作对比,从而发现用户的兴趣所在,实验表明该方法是有效的。 相似文献
3.
4.
5.
6.
鉴于传统方法在赌博网站检测上时效性低、准确度低,提出基于PAM概率主题模型的赌博网站检测方法.抽取网站及其关联网页的文本内容,并参考网站的结构化信息给不同的文本内容赋予不同的权重;利用PAM模型对网页文本信息进行主题挖掘,分析其是否大概率倾向于"赌博"主题;综合计算所抽取的各个网页的主题信息,判断该网站是否属于赌博网站,从而实现对赌博网站的有效检测.通过实验分析,该方法在赌博网站检测上的准确度达到72.3%. 相似文献
7.
一种挖掘用户浏览模式的新方法 总被引:3,自引:0,他引:3
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示.这个概念准确地反映了用户对页面的访问情况.在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵.通过对该矩阵计算得到用户浏览偏爱路径.实验表明该算法能准确地反映用户浏览兴趣. 相似文献
8.
针对传统的PageRank算法存在主题漂移、忽略用户兴趣等不足,提出一种基于用户兴趣与主题相关的Page-Rank改进算法——ITPR。为了更好地提高用户搜索质量,利用网页浏览时间与页面篇幅共同构建用户兴趣度因子,用线性拟合月点击量的方法预测用户兴趣度的升降,同时结合网页内容引入主题相关度因子,共同对网页PR值进行适当的修正,使其分配更为合理。仿真实验结果表明,在相同的实验环境下,改进的PageRank算法提升了网页排序质量、查准率以及用户搜索满意度。 相似文献
9.
介绍了基于链接结构和内容相似度的主题Web Crawler系统结构,重点介绍了其中的联合网页链接结构和内容相似度来计算网页相关度算法.该算法计算种子网页集到抓取网页的链接数目和抓取网页到种子网页集的链接数目,及Web内容与主题的内容相似度,综合计算该网页的相关度权值,从中选择权威网页或hub网页作为种子网页,从而提高主题爬虫系统的爬行效率和抓取网页的查准率. 相似文献
10.
为了解决煤矿企业网站用户查找信息难的问题,提出了一种基于Web日志的煤矿企业网站个性化推荐服务模型。该模型应用关联规则对新用户进行页面推荐,应用聚类算法对老用户进行页面推荐;并结合点击网页的次数、网页的浏览时间、雅可系数与最长公共路径系数来度量用户兴趣度的方法,可为用户准确地推荐其感兴趣的页面。测试结果表明,该模型能够有效地对网页资源进行分类并进行个性化推荐。 相似文献