首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对日渐丰富的跨语言的文字信息资源与新闻报道及科技文献中的多标签数据,为了挖掘跨语言间的相关性及数据属性间的关联性,提出了带标签双语主题模型,应用于跨语言文本分类与标签的推荐。首先,假设科技文献中的关键词与摘要部分有着内容上的相关性,对关键词进行提取,并进行标签化,进而把标签对应于主题模型中的主题,实例化“潜在”的主题;其次,利用带标签双语主题模型对摘要部分进行了训练迭代;最后,对新加入的文档进行跨语言文本分类及标签的推荐。实验结果表明,跨语言文本分类任务中micro-F1达到94.81%,推荐的标签也较好地体现出语义上的相关性。  相似文献   

2.
传统基于标签的推荐算法仅考虑用户的评分信息,导致推荐准确度不高。为解决该问题,提出一种改进的协同过滤推荐算法。对用户-标签矩阵、资源-标签矩阵进行潜在Dirichlet分布建模,发掘推荐系统中的潜在语义主题,从语义层面计算用户对各资源的偏好概率,将计算出的偏好概率与协同过滤算法计算出的资源相似度相结合,预测用户偏好值,实现个性化推荐。在Movielens数据集上的实验结果表明,与传统基于标签的推荐算法相比,该算法能消除标签中存在的同义词、多义词等语义模糊问题,同时提高推荐准确度。  相似文献   

3.
为进一步提高个性化标签推荐性能,针对标签数据的稀疏性以及传统方法忽略隐藏在用户和项目上下文中潜在标签的缺陷,提出一种基于潜在标签挖掘和细粒度偏好的个性化标签推荐方法。首先,提出利用用户和项目的上下文信息从大量未观测标签中挖掘用户可能感兴趣的少量潜在标签,将标签重新划分为正类标签、潜在标签和负类标签三类,进而构建〈用户,项目〉对标签的细粒度偏好关系,在缓解标签稀疏性的同时,提高对标签偏好关系的表达能力;然后,基于贝叶斯个性化排序优化框架对细粒度偏好关系进行建模,并结合成对交互张量分解对偏好值进行预测,构建细粒度的个性化标签推荐模型并提出优化算法。对比实验表明,提出的方法在保证较快收敛速度的前提下,有效地提高了个性化标签的推荐准确性。  相似文献   

4.
针对人物标签推荐中多样性及推荐标签质量问题,该文提出了一种融合个性化与多样性的人物标签推荐方法。该方法使用主题模型对用户关注对象建模,通过聚类分析把具有相似言论的对象划分到同一类簇;然后对每个类簇的标签进行冗余处理,并选取代表性标签;最后对不同类簇中的标签融合排序,以获取Top-K个标签推荐给用户。实验结果表明,与已有推荐方法相比,该方法在反映用户兴趣爱好的同时,能显著提高标签推荐质量和推荐结果的多样性。  相似文献   

5.
多数基于标签的推荐算法都存在推荐方式单一的问题,没有充分利用社会关系等其他信息。针对这一问题,提出了一种融合信任关系、时间因子和标签信息的个性化推荐算法TTLMF,该算法在现有基于标签的个性化推荐算法的基础上,充分利用了用户之间的信任关系和当前上下文的时间信息,使得推荐项目更加符合用户的需求。在公共数据集last.fm上进行了实验,结果表明TTLMF算法在准确率、召回率、[Fmeasure]以及覆盖率这四个指标上具有更好的推荐效果,一定程度上缓解了数据稀疏性和用户的冷启动问题。  相似文献   

6.
社会化标签系统允许用户使用个性化的词汇对网络中的资源进行标注而被用户广泛接受。在微博网络中,用户可以为自己加注标签以推广自己或者方便别人找到自己。深入分析了微博用户数据,总结了微博用户标签的特点,针对LDA(latent Dirichlet allocation)主题模型在处理短文本时存在的不足,提出了一种基于好友关系约束主题模型。在此基础上对微博用户标签进行主题分析,计算用户的主题分布,对标签词进行聚类,并最终为用户推荐标签。通过对比实验证明了该方法可以提高标签推荐的准确度。  相似文献   

7.
随着互联网技术的发展, 个性化标签推荐系统在海量信息或资源过滤中起着重要的角色. 在新浪微博平台中, 用户可以自主的给自己添加标签来表明自己的兴趣爱好. 同时, 用户也可以通过标签来搜索与自己兴趣爱好相似的用户. 针对新浪微博中大部分用户没有添加标签或添加标签数目较少的问题, 提出了一种基于RBLDA模型和交互关系的微博标签推荐算法, 它首先利用RBLDA模型来产生用户的初始标签列表, 然后再结合用户的交互关系而形成的交互图来预测用户标签的算法. 通过在新浪微博真实数据集上的实验发现, 该方案与传统的标签推荐算法相比, 取得了良好的实验效果.  相似文献   

8.
现有的标签推荐方法大多根据标签在对象中出现的次数来表示用户,标签与资源之间的关系。这种方法对标签信息的利用过于简单,导致最终的推荐结果的准确度和召回率不高。基于这个问题,提出一种采用图模型的个性化标签推荐方法,将用户、标签和资源三者的关系转换成一个三元无向图。对图中相邻顶点的处理采用一种综合的权重衡量方法,而不相邻顶点的关系采用最短路径思想得出。既考虑标签与用户的关系,又考虑标签与资源的关系给出最后的标签推荐方法。将该方法与现存的标签推荐方法做比较。实验采用的数据来自CiteULike。实验结果表明,该方法能够显著地提高推荐结果的召回率,准确性等。  相似文献   

9.
随着互联网的飞速发展所带来的“信息过载”问题使准确的新闻推荐技术变得越来越重要。提出基于兴趣标签的个性化新闻推荐系统,利用Hadoop大数据平台,采用基于项的协同过滤算法,通过收集用户的浏览记录和兴趣标签,挖掘用户的主题兴趣,建立用户的兴趣模型,提高个性化推荐系统的准确性和可扩展性,具有良好的推荐效果。  相似文献   

10.
建立一个基于用户偏好模型的标签推荐系统,从该系统产生的标签集合中选择出能降低一般性概念描述的模糊性的标签子集,推荐给用户。实验表明,该系统具有较高的可靠性和精准度。  相似文献   

11.
何明  杨芃  要凯升  张久伶 《计算机科学》2018,45(Z6):465-470, 486
标签作为Web 2.0时代信息分类和检索的有效方式,已经成为近年的热点研究对象。标签推荐系统旨在利用标签数据为用户提供个性化推荐。现有的基于标签的推荐方法在预测用户对物品的兴趣度时往往倾向于赋予热门标签及其对应的热门物品较大的权重,导致权重偏差,降低了推荐结果的新颖性,未能充分反映用户个性化的兴趣。针对上述问题,定义了标签熵的概念来度量标签的不确定性,提出了标签熵特征表示的协同过滤个性化推荐算法。该算法通过引入标签熵来解决权重偏差问题,利用三分图形式描述用户-标签-项目之间的关系;构建基于标签熵特征表示的用户和项目特征表示,并通过特征相似性度量方法计算项目的相似性;最后利用用户标签行为和项目的相似性线性组合预测用户对项目的偏好值,并根据预测偏好值排序生成最终的推荐列表。在Last.fm数据集上的实验结果表明,该方法能够提高推荐准确性和新颖性,满足用户的个性化需求。  相似文献   

12.
提升标签聚类的质量是识别标签语义的一个关键问题.文中提出基于资源的联合主题模型标签聚类方法.利用资源的引用关系,采用随机游走的方法获取资源的权威度分数,以此设置“资源-标签”和“资源-词”这2个二元关系的权重.在此基础上,构建基于资源加权的词与标签的联合潜在狄利克雷分布(LDA)模型,通过迭代学习,获取标签的潜在主题,并根据主题最大隶属度聚类标签.实验表明,相比其它基于资源的标签聚类方法,文中方法能获取更好的聚类效果.  相似文献   

13.
何明  要凯升  杨芃  张久伶 《计算机科学》2018,45(Z6):415-422
标签推荐系统旨在利用标签数据为用户提供个性化推荐。已有的基于标签的推荐方法往往忽视了用户和资源本身的特征,而且在相似性度量时仅针对项目相似性或用户相似性进行计算,并未充分考虑二者之间的有效融合,推荐结果的准确性较低。为了解决上述问题,将标签信息融入到结合用户相似性和项目相似性的协同过滤中,提出融合标签特征与相似性的协同过滤个性化推荐方法。该方法在充分考虑用户、项目以及标签信息的基础上,利用二维矩阵来定义用户-标签以及标签-项目之间的行为。构建用户和项目的标签特征表示,通过基于标签特征的相似性度量方法计算用户相似性和项目相似性。基于用户标签行为和用户与项目的相似性线性组合来预测用户对项目的偏好值,并根据预测偏好值排序,生成最终的推荐列表。在Last.fm数据集上的实验结果表明,该方法能够提高推荐的准确度,满足用户的个性化需求。  相似文献   

14.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

15.
基于概率主题模型的标签预测   总被引:1,自引:1,他引:1  
袁柳  张龙波 《计算机科学》2011,38(7):175-180
充分利用用户自定义标签信息,是理解Web资源语义,提高Web应用智能程度的重要途径。针对资源标签分派中大量存在的信息不完整、不一致的现象,建立基于用户标记行为特征的概率主题模型,利用概率主题模型实现对标记信息不完整资源的标签预测。根据每个资源所对应的标签的统计特征,可产生不同形式的标签文档,通过分析标签文档所生成主题的性能,确定适合于特定数据集的标签文档形式;利用同一主题内词汇间的高度相关性,设计合理的预测标签排序方法,从而实现对标记信息不完整资源的标签预测以及标签语义不一致现象的检测。在数据集DeliciousT 140和Wikilo+上的测试表明,所提方法能有效实现标签预测,并可提高信息检索的性能。  相似文献   

16.
基于张量分解的个性化标签推荐算法   总被引:1,自引:0,他引:1  
基于互联网的社会标签推荐系统为广大用户提供了一个信息共享平台,让用户以"标签"的形式为其浏览的物品标注信息。标签既描述了物品语义,又反映了用户偏好。标签系统的最大优势在于可以发挥群体的智能,获得用户对物品比较准确的关键词描述,而准确的标签信息是提升个性化推荐系统性能的重要资源。然而,现存的标签推荐系统面临的问题是:由于兴趣的不同,不同的用户对于同一物品可能会打不同的标签,或者是同一标签对于不同用户可能会蕴含不同的语义。因此如何有效获取用户、物品、标签3者之间潜在的语义关联成为标签推荐系统需要解决的主要问题。为此引入三维张量模型,利用三维张量的3个维度来分别描述社会标签推荐系统中3种类型的实体:用户、物品、标签。在基于历史标签数据(标签元数据)构建初始张量的基础上,应用高阶奇异值分解(HOSVD)方法降低张量维度,同时实现3种类型实体之间潜在的语义关联分析,从而进一步提高标签推荐系统的准确性。实验结果表明,该方法较当前两种典型的标签推荐算法(FolkRank和PR)在准确率和召回率性能指标上有明显提升。  相似文献   

17.
曾安  徐小强 《计算机科学》2017,44(8):246-251
针对传统推荐算法存在数据稀疏影响推荐效果的问题,考虑到社交网络中的链路预测能够综合考虑用户节点之间的拓扑结构,以及好友关系能反映用户的兴趣爱好,提出了一种融合好友关系和标签信息的推荐算法。首先,借助网络资源分配算法对社交网络的结构信息进行特征提取;然后,利用TF-IDF构建合理的社会化标签模型;最后,利用线性模型融合两方面的信息,从而实现推荐。在Last.fm和Delicious数据集上的实验表明,与传统算法相比,所提算法在推荐的召回率和准确率指标上有显著提高。  相似文献   

18.
首先对国内微博平台的信息进行了综合分析,主要介绍了微博信息的定义,在错综复杂的微博信息中哪些信息比较重要,以及这些微博信息包含哪些详细的内容,是如何组织的。然后选取新浪微博平台作为研究对象,利用新浪微博API设计了爬虫程序,抽取用户信息;以用户的关注人数、粉丝数和发布的微博数为标准对用户信息进行了定量分析。最后根据分析结果,针对不同特征的用户群体提出了相应的标签推荐方法。  相似文献   

19.
黄媛  李兵  何鹏  熊伟 《计算机科学》2013,40(2):167-171
聚类Web服务能大大提高W c6服务搜索引擎检索相关服务的能力。ProgrammablcWeb. com是一个很流行 的在线社会Mashup网站。作为基于Web的应用程序,Mashup本质上是开发者提供的Web服务。结合Mashup服 务的描述文档和相应标签提出一种新颖的Mashup服务聚类的方法,此外还提出一种标签推荐的方法来改进服务聚 类的性能。实验结果表明,基于标签推荐的服务聚类方法的聚类精度比其他两种实验方法要高,说明提出的标签推荐 策略有效扩充了标签数较少的Mashup服务,从而带来更多相关标签信息,因而聚类效果更好。  相似文献   

20.
传统基于项目的协同过滤算法在计算项目相似度时仅依靠评分数据,未考虑项目的自身特征。社会化标注的出现使得标签能在一定程度上反映项目特征,但标签具有语义模糊的特点,因此直接将标签纳入协同过滤算法存在一定问题。为解决上述问题,提出一种改进的基于项目的协同过滤推荐算法。该算法对标签进行聚类并生成主题标签簇,根据项目标注情况计算项目与主题间的相关度并生成项目-主题相关度矩阵,同时将其与项目-评分矩阵相结合来计算项目间的相似度,采用协同过滤完成对目标项目的评分预测,以实现个性化推荐。在Movielens数据集上的实验结果表明,该算法能够解决标签的语义模糊问题并提升推荐质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号