首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
微博用户的兴趣分析和模型表示是用户关系分析的基础,而用户关系分析又构成了微博社会网络的生成和分析的基础.该文主要讨论微博的用户关系分析技术.作者将微博社会网络视为一个加权无向图,节点表示用户,边表示用户之间的关系,边的权值表示用户之间的关系强度.该文将用户关系强度定义为用户之间的相似度,分别给出了基于各种用户属性信息(背景信息、微博文本、社交信息)的用户相似度计算方法,并通过实验系统性对比了上述方法的优劣.实验结果显示:基于社交信息的用户相似度在用户关系分析方面取得了最好的效果.为了进一步验证上述用户相似度的实际性能,该文将它们应用于用户推荐的相关实验,基于社交信息的用户相似度又取得了最好的推荐效果.最后,该文应用基于社交信息的用户相似度生成了微博的社会网络(称作用户相似性网络),在该社会网络上进行了团体挖掘的实验,实验结果显示了该相似度在团体挖掘上的有效性.  相似文献   

2.
给出了面向多异构社交网络(Multi-heterogeneous social network, MHSN)的全局表示模型,建立了MHSN用户空间及内容空间的关联模型,为基于MHSN的后续研究提供借鉴。以MHSN的地域突发事件检测为例,论述了基于内容空间的MHSN的融合方法,并以微博和贴吧进行了数据采集和突发事件检测的实验分析;以MHSN的用户兴趣挖掘为例,论述了基于用户空间的MHSN的融合方法,并以微博和贴吧进行了数据采集和用户兴趣挖掘的实验分析。结果表明,本文所提的面向MHSN的突发事件融合检测及用户兴趣融合挖掘方法可以有效地改善突发事件检测和用户兴趣挖掘的效果。  相似文献   

3.
由于信息传播模型是社区挖掘、社区影响力研究的基础,文中提出结合用户兴趣的信息传播模型,设计基于频繁子树的信息传播微观模式挖掘方法.首先,基于微博社交网络图表示及用户多标签建模,将微观信息传播模式转换为频繁子树挖掘问题.然后,针对微博社交网络图单节点多标签特性,设计多标签节点树的频繁子树挖掘算法(MLTreeMiner).最后,结合主题提取方法,使用MLTreeMiner挖掘信息传播模式.在人工数据集上的实验表明,MLtreeMiner能高效地对多标签节点树进行频繁子树挖掘.针对新浪微博真实数据的实验也验证方法的有效性.  相似文献   

4.
微博平台隐含潜在的用户信息,通过微博数据挖掘用户兴趣具有重要的社会意义。结合用户兴趣与微博信息的特点,提出了一种文本聚类与兴趣衰减的微博用户兴趣挖掘(TCID-MUIM)方法。首先,通过基于词林的同义词合并策略弥补建模时词频信息不足的弊端;其次,利用二次Single-Pass不完全聚类算法将用户微博划分为多个簇,将簇合并为同一文档以弥补微博文本短小难以挖掘主题信息的问题;最后,通过LDA模型建模,并考虑用户兴趣随时间变化的问题,引入时间因子,将微博—主题矩阵压缩为用户—主题矩阵,获取用户兴趣。实验表明,较之传统建模方法与合并用户历史微博为同一文档的建模方法,TCID-MUIM方法挖掘的用户兴趣主题具有更好的主题区分度,且更贴合用户的真实兴趣偏好。  相似文献   

5.
针对传统基于用户的博文内容和共同好友数在计算微博用户的相似度时存在潜在误差过大的问题、而基于用户多源背景信息的相似度计算模型有计算复杂度高且忽略了用户的兴趣等问题,提出了一种结合用户兴趣和背景信息的综合相似度计算方法(BIBS)。首先从用户的标签中提取用户的兴趣,当用户的标签缺失时,通过对用户关注关系网络中的重要用户聚类来间接获取用户的兴趣点,以此计算用户的兴趣相似度;其次根据用户的性别、年龄和地点等背景属性计算用户的背景相似度,层次化地挖掘出最相似的用户;最后基于新浪微博的数据进行实验分析。结果表明,与基于多源信息相似度的微博用户推荐算法(MISUR)相比,该方法在用时更少的情况下,准确率、召回率和◢F◣值分别提高了8.1%、16.7%和13.6%,证明了提出的BIBS方法的有效性和准确性。  相似文献   

6.
在分析Web使用挖掘中现有用户浏览兴趣表示方法的特点和不足基础上,针对现有方法表示用户浏览兴趣准确性不高的缺点,提出了一种新的可扩展用户浏览兴趣表示模型(SIM),并且给出了SIM的数据结构、SIM表示用户浏览兴趣的方法。以真实数据进行了实验分析,实验结果表明,SIM与现有方法相比有效地提高了表示用户浏览兴趣的准确性。  相似文献   

7.
基于微博扩展的用户兴趣主题挖掘算法   总被引:1,自引:0,他引:1  
为解决基于微博的用户兴趣建模存在建模不全面的问题,提出一种基于微博扩展的用户兴趣主题挖掘算法。通过结合用户自身兴趣及用户关注人的兴趣来扩充微博用户兴趣,将兴趣分为长期兴趣、过期兴趣、近期兴趣,利用改进的TF. IDF算法分析相关微博内容,利用基于时间及文档频率加权的主题词重要度计算兴趣主题词得分,得出综合全面的用户兴趣。实验结果表明,综合分析用户及用户关注人的兴趣,可以有效得到真实、全面、包含潜在兴趣的用户个人兴趣。  相似文献   

8.
微博作为国内主流社交网站,信息量与日俱增.目前微博用户兴趣挖掘方法大多停留在研究用户浏览网页时点击行为、用户所发微博内容或所在社区等表象层面,尚未深入到微博用户使用特性层面.从用户微博内容出发,结合用户关注对象微博,提出一种改进作者主题模型UF_AT(users focus-author topic).最后对真实数据进行实验得出,模型在用户兴趣主题以及主题词概率值上均高于AT模型,而且用户兴趣主题准确、全面,同时验证了UF_AT模型在挖掘用户兴趣中的有效性.  相似文献   

9.
郁友琴  李弼程 《计算机科学》2021,48(12):219-225
微博用户兴趣发现对社交网络的个性化推荐和信息传播的正确引导具有重要意义,因此提出了一种基于多粒度文本特征表示的微博用户兴趣识别方法.首先,从主题层、词序层和词汇层3个方面对微博用户构造文本向量,利用LDA提取内容的主题特征,通过LSTM学习内容的语义特征,引入腾讯AI Lab开源词向量获取词义特征;然后,将以上3种特征向量拼接得到的多粒度文本特征表示矩阵输入CNN中,进行文本分类训练;最后,通过多端输出层实现对微博用户的兴趣识别.实验结果表明,多粒度特征表示模型的分类实验结果比单粒度特征表示模型的精准率、召回率和F1值分别提高了8%,12%和13%.基于对文本粗、细语义粒度和词粒度的综合考量,结合神经网络分类算法,多粒度特征表示模型的评价指标均优于单粒度特征表示模型.  相似文献   

10.
徐建民  申永平  吴树芳 《计算机应用研究》2021,38(12):3597-3603,3610
针对现有微博推荐中未考虑分层关系对兴趣影响的问题,提出一种基于分层社交关系的微博推荐算法.首先基于时间窗口计算相对亲密强度与社交增长率来构建分层网络;其次在网络中量化影响力、吸引力、交互紧密度来挖掘目标用户潜在兴趣;然后依据短文本扩展策略获取目标用户显性兴趣;最后将潜在兴趣与显性兴趣融合,计算融合兴趣与待推荐微博的相似度实现推荐.实验结果表明,与经典的微博推荐方法相比,该算法在准确率、召回率、F值、MRR上均优于其他方法,最高提高了14.73%.由实验结果可知,综合考虑潜在兴趣和显性兴趣可以提高微博推荐效果.  相似文献   

11.
由于人们在书写用户属性信息时随意性和虚假性,使得在进行用户兴趣建模时用户属性无法得到有效利用。针对该问题,提出了一种基于兴趣偏好和网络结构的混合好友推荐方法。采用LDA主题模型对用户微博进行建模,从中挖掘用户兴趣,并依据同质性原理利用好友兴趣偏好对目标用户兴趣偏好进行修正。同时,采用一种新颖的基于网络结构的预测指标度量用户间的亲密程度。实验结果表明,与仅利用网络结构的推荐效果相比,加入用户兴趣后的模型在准确率及AUC指标上有显著提升,同时也可提高部分博文主题不明确用户的兴趣挖掘效果。  相似文献   

12.
相似用户挖掘是提高社交网络服务质量的重要途径,在面向大数据的社交网络时代,准确的相似用户挖掘对于用户和互联网企业等都有重要的意义,而根据用户自己的兴趣话题挖掘的相似用户更符合相似用户的要求。提出了一种基于用户兴趣话题进行相似用户挖掘的方法。该方法首先使用TextRank话题提取方法对用户进行兴趣话题提取,再对用户发表内容进行训练,计算出所有词之间的相似度。提出CP(Corresponding Position similarity)、CPW(Corresponding Position Weighted similarity)、AP(All Position similarity)、APW(All Position Weighted similarity)四种用户兴趣话题词相似度计算方法,通过用户和相似用户间关注、粉丝重合率验证相似用户挖掘效果,APW similarity的相似用户的关注/粉丝重合百分比为1.687%,优于提出的其他三种算法,分别提高了26.3%、2.8%、12.4%,并且比传统的文本相似度方法Jaccard相似度、编辑距离算法、余弦相似度分别提高了20.4%、21.2%、45.0%。因此APW方法可以更加有效地挖掘出用户的相似用户。  相似文献   

13.
基于用户浏览行为分析的用户兴趣度计算   总被引:2,自引:0,他引:2  
从用户的浏览行为可以反映用户的兴趣出发,分析了用户的浏览行为与兴趣之间的关系,通过分析把能反映用户兴趣的典型浏览行为归纳为保存页面、打印页面、将页面加入收藏夹、复制页面内容、访问同一页面的次数和在页面上浏览时间这些浏览行为.针对这些浏览行为下的用户兴趣度计算做出阐述,并且在分析基于网页驻留时间和浏览次数计算网页兴趣度的算法的基础上,考虑网页大小的影响因素,使用基于浏览速度计算网页兴趣度,同时利用BP神经网络进行用户兴趣度融合.  相似文献   

14.
个性化服务技术为门户平台上的兴趣挖掘研究带来了新的挑战,如何隐式地获取门户用户兴趣行为以及发现兴趣迁移模式是其中的重要课题.在对门户个性化兴趣映射描述的基础上,提出了一种独立于门户平台的含隐私保护的门户个性化兴趣获取机制,可实现不同兴趣访问行为的隐式获取以及操作语义分析,并采用兴趣扩展规则描述方式进行了隐私保护.结合门户个性化兴趣影响以及兴趣目的预测,给出了带有门户个性化兴趣描述的隐Markov模型扩展,可用于发现不同用户的门户个性化兴趣迁移模式.最后通过验证实验给出了有效性和可行性的结论分析.  相似文献   

15.
马慧芳  张迪  赵卫中  史忠植 《软件学报》2019,30(11):3397-3412
向微博用户推荐对其有价值和感兴趣的内容,是改善用户体验的重要途径.通过分析微博特点以及现有微博推荐算法的缺陷,利用标签信息表征用户兴趣,提出一种结合标签扩充与标签概率相关性的微博推荐方法.首先,考虑到大部分微博用户未给自己添加任何标签或添加标签过少,视用户发布微博为超边,微博中的词视为超点来构建超图,并以一定的加权策略对超边和超点进行加权,通过在超图上随机游走,得到一定数量的关键词,对微博用户标签进行扩充;然后,采用相关性标签权重加权方案构建用户-标签矩阵,利用标签之间的概率相关性,构造标签相似性矩阵,对用户-标签矩阵进行更新,使该矩阵既包含用户兴趣信息,又包含标签与标签之间的关系.以新浪微博公开API抓取的微博信息作为实验数据进行了一系列的实验和分析,结果表明,该推荐算法具有较好的效果.  相似文献   

16.
微博已成为主流的在线社交网络平台,用户的影响力已成为衡量用户价值的一个重要指标。本文基于PageRank算法,通过分析用户之间的兴趣相似度、相对发帖活跃度、相互反馈互动程度来计算一个用户对其所关注的用户的关注程度,提出一个能够评估用户在微博上实际影响度WeiboRank算法。实验数据分析表明,该算法得到的用户影响度值能较客观地反映用户在其所处的虚拟社交网络中的实际影响度。  相似文献   

17.
针对社交网络中提高用户的高黏性问题,提出了一种基于用户忠诚度的用户发现的算法。该算法利用双重RFM模型对用户忠诚度进行计算,挖掘出忠诚度不同分类的用户。首先,通过双重RFM模型动态计算出用户在某一时间段的消费价值与行为价值,得到用户某一时间段的忠诚度;其次,根据用户的忠诚度,确定标度曲线,利用相似度计算找到典型的忠诚用户与不忠诚用户;最后,采用基于模块度的社区发现与独立级联传播模型,发现潜在的忠诚用户与不忠诚用户。在某社交网络的微博数据集上,实现了社会性网络服务(SNS)下用户忠诚度的量化表示,获得了基于用户忠诚度的用户发现结果。实验结果表明,所提算法能够有效挖掘出基于忠诚度的用户分类,可以为社交网站针对用户的个性化推荐及营销等,提供理论支持和实用方法。  相似文献   

18.
赵蒙  宋俊德  鄂海红 《软件》2013,(12):136-138
随着互联网技术的发展,海量信息同时呈现,使得用户难以有效发现本身感兴趣信息,并且大量的网络暗信息少人问津,难以被普通用户获取,为了处理信息过载问题,出现了个性化用户系统,以弥补海量信息中用户很难找到有用信息的问题。而只有具备了精准的用户兴趣模型,个性化用户系统才得以真正存在。因此用户兴趣建模的研究与探索具有深远的意义。从而,本文首先介绍了社会化标签Tag系统,其次分析了用户兴趣建模的四种表示方法,最后讨论了一种基于社会化标签系统的兴趣建模方法。  相似文献   

19.
以新浪微博为研究平台,随机获取微博用户数据作为研究样本,通过共链关系构建社会网络,利用聚类分析方法对样本进行微博关注好友的网络群体分析,网络内部子结构分析和个体角色分析。进而从微博用户好友数据中挖掘关注对象的特征和关注对象间的关联特征,并对改进微博用户关注好友的推荐和信息推送提出一些建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号