首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 90 毫秒
1.
提出一种基于词项关联关系与归一化割加权非负矩阵分解的微博用户兴趣模型构建方法.该方法首先基于词分布上下文语义相关性来建立词项关联关系矩阵刻画词项间相似度,然后应用归一化割加权非负矩阵分解算法获取用户—主题矩阵,产生用户感兴趣的微博主题聚类结果.实验表明,此方法能有效地进行微博主题聚类,并支持微博用户兴趣模型构建.  相似文献   

2.
赵蒙  宋俊德  鄂海红 《软件》2013,(12):136-138
随着互联网技术的发展,海量信息同时呈现,使得用户难以有效发现本身感兴趣信息,并且大量的网络暗信息少人问津,难以被普通用户获取,为了处理信息过载问题,出现了个性化用户系统,以弥补海量信息中用户很难找到有用信息的问题。而只有具备了精准的用户兴趣模型,个性化用户系统才得以真正存在。因此用户兴趣建模的研究与探索具有深远的意义。从而,本文首先介绍了社会化标签Tag系统,其次分析了用户兴趣建模的四种表示方法,最后讨论了一种基于社会化标签系统的兴趣建模方法。  相似文献   

3.
随着微博研究的深入,对微博用户可信度的评价成为一个研究热点。针对微博用户可信度评价的问题,提出了一种基于关联关系的用户可信度分析方法。以新浪微博为研究对象,首先从用户的资料信息、交互信息和行为信息三个方面出发,分析了用户的7个相关特征,利用层次分析法(AHP),进而得到用户自评价可信度;然后以用户自评价作为基点,以用户关系网络作为载体,结合用户之间潜在的用户互评关系,通过改进PageRank算法,提出了用户可信度评价模型User-Rank,进而,利用关系网络中其他用户对待分析用户的可信度进行综合评价。大规模的微博真实数据的实验表明,所提方法能够取得良好的用户可信度评价效果。  相似文献   

4.
夏宁霞  苏一丹  覃华  张敏 《计算机应用》2011,31(6):1667-1670
针对社会化标签系统中现有用户兴趣模型建立的缺陷,即:使用一些零散标签的集合来表示用户兴趣,而忽略标签的联合使用现象。提出一种将共现技术引入自然法的用户建模方法,该方法以自然法为基础,向用户模型中添加适量的标签对,较好地体现了标签之间的联系,又同时考虑了体现用户兴趣的标签自身的权重。在PKDD2009数据集上测试实验结果表明,该模型较之已提出的自然法和共现法,取得了更高的准确率和召回率。  相似文献   

5.
针对微博用户兴趣建模问题,提出一种在微博短文本数据集上建立用户兴趣模型的方法。为缓解短文本造成的数据稀疏性问题,在分析微博短文本结构和内容的基础上,给出微博短文本重构概念,根据微博相关的其他微博短文本和文本中包含的3种特殊符号,进行文本内容的扩展,从而扩充原始微博的特征信息。利用HowNet2000概念词典将重构后文本的特征词集映射到概念集。以抽象到概念层的文本向量为基础进行聚类,划分用户的兴趣集合,并给出用户兴趣模型的表示机制。实验结果表明,短文本重构和概念映射提高了聚类效果,与基于协同过滤的微博用户兴趣建模方法相比,平衡均值提高29.1%,表明构建的微博用户兴趣模型具有较好的性能。  相似文献   

6.
肖琳  陈博理  黄鑫  刘华锋  景丽萍  于剑 《软件学报》2020,31(4):1079-1089
自大数据蓬勃发展以来,多标签分类一直是令人关注的重要问题,在现实生活中有许多实际应用,如文本分类、图像识别、视频注释、多媒体信息检索等.传统的多标签文本分类算法将标签视为没有语义信息的符号,然而,在许多情况下,文本的标签是具有特定语义的,标签的语义信息和文档的内容信息是有对应关系的,为了建立两者之间的联系并加以利用,提出了一种基于标签语义注意力的多标签文本分类(LAbel Semantic Attention Multi-label Classification,简称LASA)方法,依赖于文档的文本和对应的标签,在文档和标签之间共享单词表示.对于文档嵌入,使用双向长短时记忆(bi-directional long short-term memory,简称Bi-LSTM)获取每个单词的隐表示,通过使用标签语义注意力机制获得文档中每个单词的权重,从而考虑到每个单词对当前标签的重要性.另外,标签在语义空间里往往是相互关联的,使用标签的语义信息同时也考虑了标签的相关性.在标准多标签文本分类的数据集上得到的实验结果表明,所提出的方法能够有效地捕获重要的单词,并且其性能优于当前先进的多标签文本分类...  相似文献   

7.
在现有的推荐系统中,其用户兴趣模型都能够有效地表达出用户的兴趣,但在用户兴趣发生变化时却不能很好地调整用户兴趣模型,不能及时适应用户兴趣的动态变化。本文提出一种基于语义相关实时更新用户兴趣模型的推荐系统。该系统能够及时响应用户兴趣变化,从而改善了以往推荐系统对用户兴趣更新不及时所导致的推荐结果不够全面、准确的问题。实验表明该系统能够准确表达用户兴趣,特别是在用户兴趣发生变化时比以往系统具有更高的准确性。  相似文献   

8.
分析用户的网络交互行为与用户兴趣之间的关系,针对目前的兴趣标签建模方法的不足,提出将用户的点击对象进行标签量化,通过用户的点击行为建立用户兴趣模型的方法,并在社交网络环境中对模型进行用户兴趣分析与测试。测试结果表明,该方法能有效地构建用户兴趣模型,证明了该方法的可行性。  相似文献   

9.
在多标签文本分类任务中,每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题:(1)对标签-文本和标签-标签关系的联合建模不充分;(2)对标签本身语义的挖掘不足;(3)忽略了对标签内部结构信息的利用。对于以上问题,提出了一种基于联合注意力和共享语义空间的多标签文本分类方法。提出了融合多头注意力机制,该方法旨在同步地对标签与文档的关系和标签之间的关系进行建模,利用两者交互信息的同时避免误差传递。提出了解耦的共享语义空间嵌入方法,改进了利用标签语义信息的方法,使用共享参数的编码器提取标签和文档的语义表示,减少其在建模相关性阶段的偏差。提出了一种基于先验知识的层次提示方法,利用预训练模型中的先验知识增强标签层次结构信息。实验结果表明,该方法在公开数据集上优于目前最先进的多标签文本分类模型。  相似文献   

10.
针对标签随着时间变化的动态多标签文本分类问题,提出了一种基于标签语义相似的动态多标签文本分类算法。该算法在训练阶段,首先按照标签固定训练得到一个基于卷积神经网络的多标签文本分类器,然后以该分类器的倒数第二层的输出为文本的特征向量。由于该特征向量是在有标签训练得到的,因而相对于基于字符串即文本内容而言,该特征向量含有标签语义信息。在测试阶段,将测试文档输入训练阶段的多标签文本分类器获取相应的特征向量,然后计算相似性,同时乘以时间衰减因子修正,使得时间越近的文本具有较高的相似性。最后,采用最近邻算法分类。实验结果表明,该算法在处理动态多标签文本分类问题上具有较优的性能。  相似文献   

11.
聚类相关度大的个人微博有助于快速了解博主的专业兴趣和经历,目前的短文本聚类方法缺乏对于语义和句子相关度的充分考虑,提出了一种基于知网的个人微博语义相关度的聚类方法。其要点如下:(1)利用Skip-gram训练大量微博文本生成词汇向量;(2)根据词汇义原进行句内词汇消除歧义;(3)分别计算个人微博之间词汇和句子的相似度并将其综合得到博文相关度;(4)根据博文相关度进行个人微博的聚类。实验表明,相较于层次聚类法、密度聚类法,本文算法的准确度有明显提高。  相似文献   

12.
向微博用户推荐对其有价值和感兴趣的内容,是改善用户体验的重要途径。通过分析微博的特点以及现有微博推荐算法的缺陷,利用标签信息表征用户兴趣,提出一种基于标签概率相关性的微博推荐方法 LPCMR。首先,该方法利用标签之间的概率相关性,构造标签相似性矩阵。然后通过相关性标签权重加权方案,加强标签权重,构建用户-标签矩阵。针对用户标签矩阵稀疏的问题,采用标签相似性矩阵对用户-标签矩阵进行更新,使该矩阵既包含用户兴趣信息,又包含标签与标签之间的关系。以新浪微博公开API抓取的微博信息作为实验数据,进行了一系列的实验和分析,结果表明本文提出的推荐算法具有较好的效果。  相似文献   

13.
本文针对微博内容较短、歧义较大的问题,利用概率主题模型对用户的兴趣进行建模,提出了一种基于用户兴趣的微博实体链接方法。具体地,本文首先利用现有的主题模型从知识库的大量数据中训练实体与上下文词汇的语义关联,然后提出用户兴趣主题模型来建模用户对实体的兴趣以及微博的语义,并完成实体链接的任务。此外,本文在真实数据集上进行了大量实验和分析,取得了87.6%的实体链接准确率,实验结果表明,与现有方法相比,该方法通过用户兴趣的建模更好地刻画了微博的语义,因而也取得了更高的实体链接准确率。  相似文献   

14.
基于加权语义网和有效信息的个性化用户兴趣建模*   总被引:1,自引:0,他引:1  
为了提高个性化用户兴趣建模的准确率,对用户建模过程进行了优化。在计算文档相似度时,综合考虑特征词的语义关系以及在文档中的分布情况,引入加权语义网,提高了文档相似度计算精度;在计算兴趣度权值时,引入有效信息的概念及量化方法,以解决用户兴趣类权值计算过于主观的问题,并提出具体权值算法,提高了权值计算的准确性。实验结果表明,改进的方法在用户兴趣聚类和兴趣类别权值计算的准确率上都较以往方法有较大提高。  相似文献   

15.
基于用户感兴趣区域的图像检索方法*   总被引:5,自引:0,他引:5  
提出了一种基于用户选择感兴趣区域的图像检索方法.该方法先由用户选择感兴趣的区域,然后提取该区域的特征进行扫描式匹配检索.实验结果表明,该方法不仅极大地增强了检索系统的灵活性,而且具有较高的查准率.  相似文献   

16.
罗芳  徐阳 《计算机应用研究》2020,37(5):1354-1358,1367
以新浪微博为研究对象,提出一种适用性更广、考虑因素更全面的微博用户影响力度量算法,将用户基本属性、用户交互行为和用户博文内容三个维度因素融入传统PageRank算法中,提出了一种多维度微博用户影响力度量算法——MDIR(multi-dimension influence rank)。实验结果表明,MDIR算法相较于其他常用的五种影响力度量算法,能更加全面、真实地反映微博用户的实际影响力。  相似文献   

17.
为了得到更多的用户兴趣信息,提出了一种新的高效的用户兴趣模式获取方法,面向层次结构的信息网站,提供动态的多层次用户兴趣模式。该方法根据网站和用户兴趣所具有的层次性特征,利用蚁群算法,将用户对网站结点的一次浏览过程,对应于蚂蚁的一次觅食活动周期,从各个层次求出相应路径的信息素浓度和支持度,从而得到用户对该结点的偏好函数值,再依据此值求得用户兴趣模式。实验表明了该方法的有效性。  相似文献   

18.
为了增强基于WAP网页的手机广告推荐中用户建模的准确性,并对"非邀"式广告推荐中脱离用户兴趣试探性推荐进行修正,针对手机广告推荐中手机屏幕小、用户注意力集中等特点,根据用户对广告的访问历史和操作模式建立其广告兴趣模型和非兴趣模型,同时分析用户网页访问模式探测其网页兴趣度,在此基础上建立用户综合兴趣模型。分别采用基于网页兴趣模型、基于广告兴趣模型和基于用户综合兴趣模型进行广告推荐,随着样本空间增大,综合兴趣模型的查准率明显优于另两者。实验验证了用户综合兴趣模型在手机广告推荐中的有效性和优越性。  相似文献   

19.
浦慧忠 《软件》2014,(7):126-128
基于用户兴趣的不同,研究如何针对用户的浏览行为来获取用户的有效兴趣数据,并根据现有用户兴趣模型存在的不足,结合Web挖掘中的相关技术,先显式构建用户兴趣模型,后隐式更新用户兴趣模型,从而实现能适应用户兴趣变化的用户兴趣模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号