首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
方阳  谭真  陈子阳  肖卫东  张玲玲  田锋 《软件学报》2023,34(10):4548-4564
在推荐系统中,冷启动推荐由于缺乏用户和物品交互信息而具有很大的挑战性.该问题可以由数据层和模型层的策略进行缓解.传统的数据层方法利用如特征信息的辅助信息来增强用户和物品表示的学习.最近,异质信息网络被整合于推荐系统中.它可以提供更丰富的辅助信息和更有意义的语义信息.但是,这些模型无法充分利用结构和语义信息,并且忽视了网络中的无标签信息.模型层的方法应用了元学习框架,该框架通过学习相似任务的先验知识然后利用很少的标签信息适应新任务,与冷启动问题相似.综上,我们提出了一个基于异质信息网络的对比元学习框架CM-HIN,同时在数据层和模型层解决冷启动问题.具体的,利用元路径和网络模式两个视图分别刻画异质信息网络的高阶以及本地结构信息.在元路径和网络模式视图中,采用对比学习挖掘异质信息网络的无标签信息并整合两个视图.在三个基准数据集上的三个冷启动推荐场景的大量实验中,CM-HIN超越了所有先进的基线模型.  相似文献   

2.
基于异质信息网络的推荐方法已成为当前数据挖掘领域的研究热点。但传统基于异质信息网络的推荐方法多存在可解释性缺失和稀疏不一致性问题,导致无法充分挖掘用户潜在的偏好特征,且有效地进行特征融合。因此,提出了一种在异质信息网络中融合网络嵌入的注意力偏好推荐方法(MFFHINE);利用对称元路径在刻画对象间语义关系上的优势,在对称元路径上随机游走进行网络嵌入来学习用户偏好特征。采用基于注意力机制的偏好权重融合策略将学习到的各个偏好特征有效融合,并将其集成到矩阵分解模型中。通过联合优化矩阵分解模型和融合函数,以进行最终的评分预测任务。在Douban和Yelp真实大规模数据集上对提出的算法进行实验分析。通过对各基准算法进行横向性能比较,在训练集比例、元路径设置、潜在因子维度等方面进行纵向比较。实验结果表明,MFFHINE性能提升显著。  相似文献   

3.
异质信息网络能够对真实世界的诸多复杂应用场景进行建模,其表示学习研究也得到了众多学者的广泛关注.现有的异质网络表示学习方法大多基于元路径来捕获网络中的结构和语义信息,已经在后续的网络分析任务中取得很好的效果.然而,此类方法忽略了元路径的内部节点信息和不同元路径实例的重要性;仅能捕捉到节点的局部信息.因此,提出互信息与多条元路径融合的异质网络表示学习方法.首先,利用一种称为关系旋转编码的元路径内部编码方式,基于相邻节点和元路径上下文节点捕获异质信息网络的结构和语义信息,采用注意力机制来建模各元路径实例的重要性;然后,提出一种互信息最大化与多条元路径融合的无监督异质网络表示学习方法,使用互信息捕获全局信息以及全局信息和局部信息之间的联系.最后,在两个真实数据集上进行实验,并与当前主流的算法进行比较分析.结果表明,所提方法在节点分类和聚类任务上性能都有提升,甚至和一些半监督算法相比也表现出强劲性能.  相似文献   

4.
王家龙  杨杰  周丽华  王丽珍  王睿康 《软件学报》2023,34(10):4830-4850
社区是信息网络的重要属性, 社区搜索旨在寻找满足用户给定条件的节点集合, 是信息网络分析的重要研究内容. 异质信息网络由于包含更加全面、丰富的结构和语义信息, 所以异质信息网络的社区搜索近年来受到人们的广泛关注. 针对现有异质信息网络的社区搜索方法难以满足复杂条件社区搜索要求的不足, 定义了复杂条件社区搜索问题, 提出了考虑非对称元路径、受限元路径和禁止节点约束的搜索算法. 3种算法分别通过元路径补全策略、调整带标签的批量搜索策略和拆分复杂搜索条件的方式搜索社区, 同时针对禁止节点约束的搜索算法设计了基于剪枝策略和近似策略的优化算法以提高搜索效率. 在真实数据集上进行了大量实验, 实验结果证明了所提算法的有效性和高效性.  相似文献   

5.
异质信息网络表示学习在节点分类、链接预测、个性化推荐等多个领域上被广泛应用.现有的异质信息网络表示学习方法大多集中在静态网络,忽略网络中时间属性对节点表示的影响.为了解决该问题,文中提出基于元路径和层次注意力的时序异质信息网络表示学习方法.利用元路径捕获异质信息网络中的结构和语义信息.通过时间衰减注意力层,捕获不同元路径实例在特定时间对目标节点的影响.通过元路径级别注意力,融合不同元路径下的节点表示,得到最终表示.在DBLP、IMDB数据集上的实验表明,文中方法在节点分类和节点聚类任务上均可达到较优效果.  相似文献   

6.
针对当前冷启动推荐模型在处理异质信息网络时难以充分挖掘结构与语义信息,以及忽略网络中用户行为属性的问题,提出了一种基于元学习的多视图对比融合冷启动推荐算法(MVC-ML)。该算法在模型层和数据层双重作用下,有效缓解了冷启动问题。在MVC-ML算法框架中,首先通过元路径视图提取异质信息网络的高阶语义信息;其次,利用网络模式视图捕获网络的结构特征;再接着,通过聚类视图分析用户行为属性信息;最后,运用对比学习方法,将上述三个视图中提炼的信息进行综合融合,以生成准确的表示向量。通过在DBook等三个数据集上的实验验证,MVC-ML模型在冷启动场景下相较MetaHIN等传统异质信息网络模型,在MAE上降低了1.67%,在RMSE上降低了2.06%,同时nDCG@K提高了1.48%。这些数据充分证实了MVC-ML算法的合理性和有效性。  相似文献   

7.
异质网是包含多种类型的对象和复杂链接关系的大规模异构信息网络.针对科研异质网,文中提出基于元路径信息的节点分类方法.利用异质网中具有不同语义信息的元路径,建立节点之间的关联特征矩阵,并通过加入跳转路径扩展异质网,解决信息稀疏问题.在DBLP数据集上的实验表明,文中方法可以有效利用较少的分类标签,解决复杂网络中的节点分类,在标注数据比例规模较小时,加入跳转路径,优化决策树分类性能.  相似文献   

8.
针对基于单条元路径的异质网络表征缺失异质信息网络中结构信息及其它元路径语义信息的问题,本文提出了基于融合元路径权重的异质网络表征学习方法.该方法对异质信息网络中元路径集合进行权重学习,进而对基于不同元路径的低维表征进行加权融合,得到融合不同元路径语义信息的异质网络表征.实验结果表明,基于融合元路径权重的异质网络表征学习具有良好的表征学习能力,可有效应用于数据挖掘.  相似文献   

9.
推荐系统能够有效解决信息过载等问题,得到了国内外众多学者的广泛关注。真实世界中的应用场景往往可以建模成异质信息网络,因此基于异质信息网络表示学习的推荐算法成为了近年来的研究热点。然而,当前的研究工作仍然存在异质信息提取缺乏深度、节点的复杂关系发掘不充分等问题。为解决这些问题,文中提出了基于异质信息网络表示学习与注意力神经网络的推荐算法。首先,提出了保持语义关系与结构拓扑的异质信息网络表示方法;然后,设计了基于元路径的随机游走策略来获取异质信息网络中的节点序列,对序列过滤并生成用户和项目在不同元路径下的表示向量;最后,设计了基于注意力神经网络的推荐算法,将上述向量输入注意力神经网络,深入挖掘表示向量之间的关系以实现有效的推荐。在两个真实数据集上进行实验并与3种主流的算法进行比较,结果表明,所提算法在MAE与RMSE这2个推荐指标方面都有提升,最高提升了8.9%。  相似文献   

10.
为了完全挖掘异质信息网络中节点的特征并且更好地融合这些特征,提高推荐算法的性能,提出一种基于自注意力机制的局部与全局特征融合的评分预测算法(rating prediction algorithm based on self-attention mechanism and fusion of local & global features,AMFL&GRec)。首先基于LeaderRank算法提取目标节点的全局序列,基于元路径带偏置的随机游走算法提取节点的局部序列,通过skip-gram模型分别学习节点的全局特征与局部特征;通过自注意力机制学习目标节点对局部与全局特征的偏好,从而得到在单一元路径下节点的特征表示;再通过自注意力机制融合不同元路径下同一节点的表示,从而得到节点在不同元路径下的最终的特征表示;最后基于多层感知器实现评分预测任务。在两个真实数据集进行了大量实验,实验结果验证了AMFL&GRec算法不仅能够捕获具有密集连通节点的微观(局部)结构,而且还能够捕获该节点在网络中的全局结构,从而使其得到的节点特征得以体现节点的整体(局部+全局)特征。同时,实验结果也证明了AMFL&GRec算法评分预测性能优于对比算法,从而证明利用自注意力机制考虑异质信息网络中节点对于局部、全局特征以及元路径的偏好能够提高评分预测的准确性。  相似文献   

11.
影响力最大化是研究如何在社会网络中寻找小部分最具影响力的节点作为信息扩散源,使信息在网络中传播范围最大的问题.已有相关研究大多只是针对同质信息网络,但现实中的社会网络是包含了多种对象类型和对象之间多种关系类型的异质网络,因此提出了基于元路径的邻接信息熵(MPAIE)模型,以及基于元图的邻接信息熵(MGAIE)模型来模拟异质信息网络中的社会影响.通过设置元路径或元图,该方法可以灵活地整合异质网络中的结构和语义信息,对节点的影响力做出度量,并在两个真实数据集上验证了MPAIE及MGAIE模型的有效性.  相似文献   

12.
随着社交网络和文献索引网络等大规模互联多类异质信息网络的浮现,为相似搜索提出许多挑战,其中相似性度量是关键问题之一。现有适用于同构网络的相似度量方法没有考虑网络多个路径的不同语义。本文提出一种新的基于元路径的相似性度量方法,可以在异构网络中搜索相同类型的对象。元路径是由在不同对象类型中定义的一系列关系所组成的路径,可以为网络中相似搜索引擎提供共同的基础。在真实数据集上的实验表明,与无序相似性衡量方法相比,本文提出的方法支持快速路径相似性查询,可广泛地应用于社交网络和电子商务领域。  相似文献   

13.
考虑到安卓应用虚拟化技术的功能特性,精确检测安卓虚拟化程序是识别其隐藏安全风险的基础和必要前提。为此,提出了基于异质信息网络的安卓虚拟化程序检测方法,并实现了原型系统Aiplugin。根据安卓虚拟化程序的特点,提取四类静态程序特征,并将程序特征映射到异质信息网络上,以元路径的形式将不同程序关联起来。采用异质图注意力网络表征算法和OC-SVM算法,融合不同视图的程序语义信息,实现对安卓虚拟化程序的表征和分类。实验结果表明,相较于当前的代表性工具VAhunt, Aiplugin可有效检测包括平行空间等更多类型的安卓虚拟化程序。  相似文献   

14.
Community detection can be used to help mine the potential information in social networks, and uncovering community structures in social networks can be regarded as clustering optimization problems. In this paper, an overlapping community detection algorithm based on biogeography optimization is proposed. Firstly, the algorithm takes the method of label propagation based on local max degree and neighborhood overlap for initial network partitioning. The preliminary partition result used to construct initial population by cloning and mutating to accelerate the algorithm’s convergence. Next, to make biogeography optimization algorithm suitable for community detection, we design problem-specific migration rules and mutation operators based on a novel affinity degree to improve the effectiveness of the algorithm. Experiments on benchmark test data, including two synthetic networks and four real-world networks, show that the proposed algorithm can achieve results with better accuracy and stability than the compared evolutionary algorithms.  相似文献   

15.
标签传播算法是高效且具代表性的社团检测算法,其中不包含必需调节适应的相关参数,是大型网络社团检测的首选算法。标签传播算法具有较低的时间复杂度,但其随机性较强,且在标签传播过程中存在不确定性因素,影响了社区检测的准确性和稳定性。针对上述问题,提出一种基于节点引力和鱼记忆标签存储策略的社区检测算法CDA-GM。通过融入节点信息熵的k-shell排序策略增强社区检测的准确性,利用节点间的引力更新标签,减小标签传播的随机性。在此基础上,引入鱼记忆节点标签存储策略,避免出现标签震荡,增强标签传播的稳定性。选择人工网络和真实世界网络数据集进行实验,结果表明,该算法能够显著提高社区检测质量,获得准确的社区结构,与COPRA、SLPA、DLPA和COPRAPC算法相比,其标准化互信息值平均提高0.01、0.18、0.12、0.02,社区模块度平均提高0.04、0.02、0.07、0.01。  相似文献   

16.
陈晶  刘江川  魏娜娜 《计算机应用》2022,42(4):1162-1169
针对标签传播算法稳定性不足、准确性较差的问题,提出了融合K-shell和标签熵的标签传播重叠社区发现算法OCKELP。首先,采用K-shell算法减少了标签初始化时间,并利用标签熵的更新序列提高了算法的稳定性;其次,引入综合影响力进行标签选择,并将社区层次信息和节点局部信息融合提高了算法的准确性。在真实网络数据集上,OCKELP相较于重叠社区发现算法(COPRA)、基于多核心标签传播的重叠社区识别方法(OMKLP)、SLPA的模块度最大提升分别约68.64%、53.99%、42.29%,在人工网络数据集的归一化互信息(NMI)值上,OCKELP相较于其他三种算法也有着明显优势,且随着重叠节点隶属社区数量的增加可以挖掘出社区的真实结构。  相似文献   

17.
社区检测是复杂网络分析的重要研究任务之一,其检测结果有助于人们深入理解复杂网络的社区结构,同时为下游任务提供支持,如内容推荐、链路检测等。针对复杂网络的社区检测问题,提出了一种基于标签传播的两阶段社区检测算法——TS-LPA。TS-LPA采用扩展邻域的思想来量化节点的传播能力,并在此基础上,利用节点信息和网络中边的权重等信息,提出了新的评价指标来衡量节点的中心性和节点之间的影响力。所提算法在计算节点中心性的基础上确定了节点标签更新的顺序和种子节点的选择策略,消除了算法在更新过程中的不稳定。在节点标签更新的过程中,为了更好地利用邻居节点标签类别来进行标签更新,TS-LPA采用广度优先传播的思想,提出了第二阶段标签传播方式。当标签开始传播的时候,待更新节点的所有邻居节点都对该节点的类别标签产生影响,同时,为了减轻周围邻居节点对待更新节点的支配程度,除邻居节点的影响外,加入附近种子节点对待更新节点的影响,共同完成节点的标签更新。在不同的真实数据集和人工合成数据集的实验结果分析表明,TS-LPA在消除随机性、表现出较强稳定性的同时,有效提高了社区检测的质量。  相似文献   

18.
Traditional community detection methods in attributed networks (eg, social network) usually disregard abundant node attribute information and only focus on structural information of a graph. Existing community detection methods in attributed networks are mostly applied in the detection of nonoverlapping communities and cannot be directly used to detect the overlapping structures. This article proposes an overlapping community detection algorithm in attributed networks. First, we employ the modified X‐means algorithm to cluster attributes to form different themes. Second, we employ the label propagation algorithm (LPA), which is based on neighborhood network conductance for priority and the rule of theme weight, to detect communities in each theme. Finally, we perform redundant processing to form the final community division. The proposed algorithm improves the X‐means algorithm to avoid the effects of outliers. Problems of LPA such as instability of division and adjacent communities being easily merged can be corrected by prioritizing the node neighborhood network conductance. As the community is detected in the attribute subspace, the algorithm can find overlapping communities. Experimental results on real‐attributed and synthetic‐attributed networks show that the performance of the proposed algorithm is excellent with multiple evaluation metrics.  相似文献   

19.
近年来,网络社区挖掘得到了极大的关注,尤其是针对二分网络的社区挖掘。二分网络社区挖掘对于研究复杂网络有非常重要的理论意义和实用价值。提出了一个基于蚁群优化的二分网络社区挖掘算法。该算法首先将二分网络社区挖掘问题转化成一个优化问题,建立一个可供蚂蚁搜索的图模型。同时,根据顶点的拓扑结构定义启发式信息。每只蚂蚁根据每条路径上的信息素和启发式信息选择路径,构造出一个社区的划分,再用二分模块度去衡量社区划分的优劣。实验结果表明,该算法不但可以较准确地识别二分网络的社区数。而且可以获得高质量的社区划分。  相似文献   

20.
乔连鹏  侯会文  王国仁 《软件学报》2023,34(3):1277-1291
近年来,异质信息网络上的社区搜索问题已经吸引了越来越多的关注,而且被广泛应用在图数据分析工作中.但是现有异质信息网络上的社区搜索问题都没有考虑子图上属性的公平性.将属性的公平性与异质信息网络上的kPcore挖掘问题相结合,提出了基于属性公平的异质信息网络上的极大core挖掘问题.针对该问题,首先提出了一个子图模型FkPcore.当对FkPcore进行枚举时,基础算法Basic-FkPcore遍历了所有路径实例,并枚举了大量k Pcore及其子图.为了提高算法效率,提出了Adv-FkPcore算法,以避免在枚举FkPcore时对所有的kPcore及其子图进行判断.另外,为了提高点的P_neighbor的获取效率,提出了结合点标记的遍历方法(traversalmethod with vertex sign, TMS),并基于TMS算法提出了FkPcore枚举算法Opt-FkPcore.在异质信息网络数据集上进行的大量实验证明了所提方法的有效性和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号