首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 125 毫秒
1.
互联网上网服务行业用户画像系统通过对用户行为数据进行分析,利用网络爬虫、数据挖掘以及文本分类等技术,对用户进行画像,刻画了一个完整的用户全貌.系统对不同属性的数据采用不同的方法,挖掘出数据中的有用信息,提取用户的平台特征,为用户标记不同权重的标签,使得企业更加了解用户,为企业发展提供指导,同时也为用户提供个性化服务铺平道路.此外,针对K-means算法进行改进,从测试结果可以看出,经过改进的K-means准确率和稳定性都得到了极大的提升.  相似文献   

2.
研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的“脏”数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。  相似文献   

3.
针对目前主流的推荐算法中获取的用户信息不完整以及推荐时间过长的问题,本文提出一种基于用户信息向量聚类和改进SAMME的推荐算法,该算法通过分析用户基本信息(地域、时间、兴趣、标签等),找出用户信息关键词;对不同用户信息关键词基于TF-IDF方法进行加权构建用户信息向量;接着使用K-means算法进行用户聚类分析,将用户聚类结果作为改进SAMME训练样本集;最后通过改进SAMME算法将预测结果对用户进行好友推荐,并在训练过程中保存模型,大大减少推荐时间。最终将本文算法在真实的微博用户数据集上进行实验,并与其他主流算法进行对比,结果显示本文算法在准确率、召回率、F值上都取得了不错的效果。  相似文献   

4.
针对传统协同过滤算法中数据稀疏造成推荐准确度低以及K-means聚类算法需要预先确定聚类个数的问题,提出自适应K-means聚类算法(SKCA)。引入物理学中的拓扑势场理论,利用拓扑势值进行用户重要性表示并获得用户影响范围,结合改进K-means算法完成用户聚类并得到各类代表用户,目标用户通过与各代表用户进行用户相似度计算确定最优代表用户,在最优代表用户场域内使用协同过滤算法进行推荐。与其它算法对比的实验结果表明,SKCA在准确率、F值及运行效率上都有提升,有效缓解了数据稀疏的影响。  相似文献   

5.
基于用户浏览行为分析的用户兴趣度计算   总被引:2,自引:0,他引:2  
从用户的浏览行为可以反映用户的兴趣出发,分析了用户的浏览行为与兴趣之间的关系,通过分析把能反映用户兴趣的典型浏览行为归纳为保存页面、打印页面、将页面加入收藏夹、复制页面内容、访问同一页面的次数和在页面上浏览时间这些浏览行为.针对这些浏览行为下的用户兴趣度计算做出阐述,并且在分析基于网页驻留时间和浏览次数计算网页兴趣度的算法的基础上,考虑网页大小的影响因素,使用基于浏览速度计算网页兴趣度,同时利用BP神经网络进行用户兴趣度融合.  相似文献   

6.
为了揭示用户的访问模式,对传统的基于聚类技术构建用户概貌方法进行了研究,同时引入语义事务分析的观点,提出一种基于潜在语义模型构建用户概貌的方法.通过语义分析中的奇异值分解(SVD)算法,将构建的用户会话-浏览页面矩阵向量空间投影到潜在语义向量空间;利用扩展的K-means聚类算法,对潜在语义向量空间聚类生成用户会话聚类;计算浏览页面均值向量,构建以加权浏览页面集表示的用户概貌;最后采用加权平均访问百分比(WAVP)方法评价构建的用户概貌,表明了该方法的有效性.  相似文献   

7.
针对COVID-19这一特殊时期,利用大数据技术,处理原始不同数据结构的电力数据.将用户用电行为的数据分成内部数据和外部数据,其次是确定用电行为分析,通过对传统的K-means聚类算法改进,提高K-means效率.最后利用改进算法聚类出的类别构建用电行为模型,实现用户用电行为分析.最终实现达到帮助国家电网公司达到电力智能分配的目的,并且给出了大致的政策倾向.提升国家各部门监管能力,助力国家应急管理.  相似文献   

8.
个性化推荐服务中用户兴趣模型研究   总被引:1,自引:0,他引:1  
本文提出了一种利用用户浏览页面集的内容信息和浏览行为信息,隐式地创建用户兴趣描述文件的方法。通过对用户浏览的web页面进行兴趣度分析,并与对用户浏览网页时的浏览行为分析相合,得到了用特征矩阵表示的用户兴趣模型。并采用层次聚类算法和k-means聚类算法相结合的综合聚类算法进行聚类,得到用兴趣分类树表示的用户兴趣模型。由于采用的是隐式创建用户描述文件的方法,减少了因用户参于而带来的系统噪声,保证了所创建的用户兴趣模型的准确性。  相似文献   

9.
通过给出页面层次的概念,充分考虑用户在页面上的浏览时间以及在路径选择上表现出来的浏览偏爱,结合Web站点的结构层次特征,提出了一种改进的Web用户浏览偏爱模式挖掘算法.通过具体的事例和试验数据证明,新的模型能够更准确地寻找用户浏览偏爱模式,从而发现用户的兴趣和爱好.  相似文献   

10.
传统的协同过滤算法虽然可以很容易地挖掘出用户的兴趣爱好,但存在数据冷启动和稀疏性问题.针对这些问题,提出一种基于用户兴趣模型的推荐算法.首先通过LDA主题模型训练数据集得到物品-主题概率分布矩阵,利用物品-主题概率分布矩阵得到用户历史兴趣模型,然后结合用户历史行为信息和物品内容信息得到用户兴趣模型,最后计算用户与候选集之间的相似度,进行TOP-N推荐.在豆瓣电影数据集上的实验结果表明,改进后的推荐算法能够更好地处理稀疏数据和冷启动问题,并且明显提高了推荐质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号