首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
杨丹  陈默  孙良旭  王刚 《计算机科学》2015,42(4):147-150
面对异构信息空间中具有时间信息的大量相互关联的异构实体数据如作者、论文、产品、电影等,提出一个以实体及关联关系为中心的多层的时态数据模型,即多层的时态实体关联网络MTE-Network,它能有效捕捉异构实体和关联关系的时间信息.基于此时态数据模型,提出了实体搜索的多模态融合的查询模型,其支持用户搜索异构信息空间中的任何类型的实体及相关实体,支持在实体级、实体聚类级和时间轴上的实体搜索,并且满足用户多模态融合实体搜索的信息需求.在真实数据集上的实验结果证明了该时态数据模型和查询模型的可行性和有效性.  相似文献   

2.
杨丹  陈默  王刚  孙良旭 《计算机科学》2017,44(3):215-219
已有的传统的实体识别技术大多是以线下、非实时的方式,在静态数据集上进行,对于大数据集的执行通常需要大量的时间和系统资源。对于异构信息空间中具有时间信息、不断演化的异构实体来说,时间感知的查询时实体识别与数据融合越来越成为一种保证数据质量和满足用户需求的发展趋势。针对异构信息空间中使用时间上下文的关键字查询进行的实体搜索,提出一种时间感知的查询时实体识别与数据融合方法TQ-ER,以给用户提供准确的实体概貌(entity profile);提出一种迭代式时间感知的实体候选集生成算法。TQ-ER充分利用查询的时间上下文和实体的时间信息给正确的回答一个给定查询所需要的、最少的实体数据,以进行识别与数据融合。在真实数据集上的大量实验结果表明了TQ-ER的有效性和正确性。  相似文献   

3.
王江海  吴扬扬 《计算机科学》2012,39(10):170-173,186
提出了一种数据空间中的命名实体集成模型(NEIM)及其在异质异构数据源中的集成方法。命名实体模型描述了数据源、实体与实体描述间的关系,能够实现从其中任意一个息查询到其它相关信息。命名实体的集成架构指出了数据空间中命名实体集成要完成的主要任务,包括命名实体的识别、实体的集成映射和实体的统一。集成算法描述了数据空间中异构数据源包含的命名实体及其描述信息的集成方法。针对结构化半结构化数据,它采取构建映射规则,使系统可以在后期持续集成这些数据源中的实体信息,实验验证了集成方法的构建映射规则的有效性。  相似文献   

4.
查询推荐已经成为改善用户搜索体验和提高搜索引擎服务质量的重要方法。提高查询推荐串的质量和用户满意度显得尤为迫切。已有研究方法在相似度计算上忽略了命名实体的重要性和搜索日志整体的信息量度。通过对查询串进行聚类后的热度评估,并提取查询串中的命名实体。然后融合查询串热度信息和命名实体特征到相似度计算公式中,提出了一种新的查询推荐方法,该方法所得结果的满意度平均值均比最新的三种方法的推荐结果值高,表明了该方法的有效性。该方法在相似度计算上利用了识别出的命名实体,同时考虑了推荐串在全局日志中的热度,提高了推荐词的总体质量,但方法局限于提取特征的精确度,有赖于特征进一步的丰富和优化。  相似文献   

5.
用户在使用现有的搜索引擎时,常因为无法构造清晰准确的查询词而导致检索效果不佳,传统的查询推荐方法没有充分考虑用户行为的关联性,导致了查询推荐的结果不准确.本文提出了一个新的查询推荐模型,即基于点击模型和网络嵌入的查询推荐模型.该模型首先通过点击链式模型嵌入用户的历史检视行为和点击行为,并通过注意力机制衡量查询和返回文档的相关性;然后利用属性异构网络来获取复杂异质网络结构中的潜在语义信息;最后通过多头注意力捕获多个空间的复杂信息,并利用多任务学习来做评分预测.在搜狗实验室提供的公开查询日志上的实验结果表明,我们的模型在查询建议的鉴别式任务和生成式任务中均优于基线模型.  相似文献   

6.
杨丹  陈默  申德荣 《计算机科学》2017,44(2):112-116
异构信息空间中的实体和关联关系普遍具有时间信息、多种时间版本的实体数据共存,而传统的实体集成忽略了时间信息,不支持时间维度上的集成。提出一种异构信息空间中时间感知的实体集成框架T-EI,从大量异构实体数据中聚集事实形成干净的、完整的、具有时间信息的实体概貌,进而支持时间感知的实体搜索。T-EI利用实体及关联关系所具有的时间信息提出时间感知的实体识别算法,并通过考虑数据时效性提出时间感知的数据融合算法。在真实数据集上的实验结果表明了T-EI的可行性和有效性。  相似文献   

7.
郑冬冬  崔志明 《计算机应用》2006,26(9):2024-2027
越来越多的信息隐藏在Web查询接口之后,在此情况下如何寻找与用户查询最相关的数据源接口就变得越来越重要。文中提出了一种Deep Web查询接口选择算法,该算法是完全依赖于查询接口特征的。给定大量异构的Deep Web数据源,目标是选择与用户查询最相关的查询接口集。通过对实际查询接口特征的观察,发现了查询接口上谓词间的相关性。基于此发现,设计了一种基于共同出现谓词相关度模型的数据源选择算法,用于选择与用户查询最相关的查询接口集。  相似文献   

8.
知识图谱引入推荐系统可以利用知识图谱实体之间的语义关系学习用户及项目表示。基于嵌入传播的方法利用知识图谱的图结构学习相关特征,但随着传播范围增加,多跳实体间的语义相关性减小。为有效提升推荐语义表达能力并提高推荐准确度,提出基于用户潜在兴趣的知识感知传播推荐模型,该模型采用异构传播方式传播项目关联知识并迭代学习用户的潜在兴趣,以此增强模型对用户与项目的表示能力。具体地,首先图嵌入层生成用户与项目的初始化表示,随后在异构传播层中采用知识感知注意力机制区分同一层中实体之间的重要性,更精确生成目标实体的表示。随后通过用户潜在兴趣传播学习用户的高阶潜在兴趣,增强多跳实体语义相关性。最后在预测层中使用信息衰减因子区分不同传播层次的重要性,生成用户及项目的最终表示。实验表明,该模型在Last. FM与Book-Crossing两个公开数据集上AUC值相较于最先进的基线提升了2.25%与4.71%,F1值分别提升3.05%和1.20%,recall@K值均优于对比的基线模型,提出的模型能有效提高推荐准确度。  相似文献   

9.
传统的实体关系抽取方法主要针对语义信息较为完整的文本,基于抽取模式抽取文本中的实体关系,并采用启发式算法或者概率模型来选择抽取出的候选关系.而对于半结构化的页面,由于没有成句的实体信息展示,导致这些方法不能很好适用.论文提出的实体关系抽取系统能较好地处理半结构化的页面.该系统主要包括数据抽取规则学习、数据抽取、实体间关系计算等核心功能模块,并为用户提供了关系库查询接口.用户输入关键词和选定匹配类型,系统将根据关键词及匹配类型查询实体信息库,然后用满足条件的实体再去查询实体关系库,将包含这些实体的关系返回给用户.  相似文献   

10.
俞菲  李治军  车楠  姜守旭 《软件学报》2017,28(8):2148-2160
随着社交网络的不断发展,朋友推荐已成为各大社交网络的青睐对象,在能够帮助用户拓宽社交圈的同时可以通过新朋友获取大量信息.由此朋友推荐应该着眼于拓宽社交圈和获取信息,然而传统的朋友推荐算法几乎没有考虑从获取信息的角度为用户推荐潜在好友,大多是依赖于用户在线的个人资料和共同的物理空间中的签到信息.而由于人们活动具有空间局部性,被推荐的好友分布在用户了解的地理空间,并不能够满足用户通过推荐的朋友获取更多地理信息的需求.本文采用用户在物理世界中的签到行为代替虚拟社交网络中的用户资料,挖掘真实世界中用户之间的签到行为的相似性,为用户推荐具有相似的签到行为且地理位置分布更广泛的陌生人,能够增加用户接受被推荐的陌生人成为朋友的可能性和在保证一定的推荐精度的基础上增加用户的信息获取量.本文采用核密度估计估算用户签到行为概率分布,用时间熵度量签到行为在时间上的集中程度,选择可以为用户带来更多新的地理信息的陌生人作为推荐的对象,通过大规模Foursquare的用户签到数据集验证本文的算法在精度上保证了与目前已有LBSN上陌生人推荐算法的相似性,在信息扩大程度上高于上述已有算法.  相似文献   

11.
Along with the growth of Internet and electronic commerce, online consumer reviews have become a prevalent and rich source of information for both consumers and merchants. Numerous reviews record massive consumers’ opinions on products or services, which offer valuable information about users’ preferences for various aspects of different entities. This paper proposes a novel approach to finding the user preferences from free-text online reviews, where a user-preference-based collaborative filtering approach, namely UPCF, is developed to discover important aspects to users, as well as to reflect users’ individual needs for different aspects for recommendation. Extensive experiments are conducted on the data from a real-world online review platform, with the results showing that the proposed approach outperforms other approaches in effectively predicting the overall ratings of entities to target users for personalized recommendations. It also demonstrates that the approach has an advantage in dealing with sparse data, and can provide the recommendation results with desirable understandability.  相似文献   

12.
The rapid evolution of the Internet has been appealing for effective recommender systems to pinpoint useful information from online resources. Although historical rating data has been widely used as the most important information in recommendation methods, recent advancements have been demonstrating the improvement in recommendation performance with the incorporation of tag information. Furthermore, the availability of tag annotations has been well addressed by such fruitful online social tagging applications as CiteULike, MovieLens and BibSonomy, which allow users to express their preferences, upload resources and assign their own tags. Nevertheless, most existing tag-aware recommendation approaches model relationships among users, objects and tags using a tripartite graph, and hence overlook relationships within the same types of nodes. To overcome this limitation, we propose a novel approach, Trinity, to integrate historical data and tag information towards personalised recommendation. Trinity constructs a three-layered object-user-tag network that considers not only interconnections between different types of nodes but also relationships within the same types of nodes. Based on this heterogeneous network, Trinity adopts a random walk with restart model to assign the strength of associations to candidate objects, thereby providing a means of prioritizing the objects for a query user. We validate our approach via a series of large-scale 10-fold cross-validation experiments and evaluate its performance using three comprehensive criteria. Results show that our method outperforms several existing methods, including supervised random walk with restart, simulation of resource allocating processes, and traditional collaborative filtering.  相似文献   

13.
石乐昊  寇月  申德荣  聂铁铮  李冬 《软件学报》2022,33(10):3619-3634
由于异构信息网络具有丰富的语义信息而在推荐任务中得到广泛应用.传统的面向异构信息网络的推荐方法忽略了网络中关联关系的异质性,以及不同关联类型之间的相互影响.本文提出了一种基于多视角嵌入融合的推荐模型,分别从同质关联视角和异质关联视角来挖掘异构信息网络的深层潜在特征并加以融合,有效地保证了推荐结果的准确性.针对同质关联视角,提出了一种基于图卷积神经网络的嵌入融合方法,通过对同质关联作用下节点邻域信息的轻量式卷积,实现节点嵌入的局部融合.针对异质关联视角,提出了一种基于注意力的嵌入融合方法,利用注意力机制来区分不同关联类型对节点嵌入的影响,实现节点嵌入的全局融合.通过实验验证了本文所提出的关键技术的可行性和有效性.  相似文献   

14.
现有的大多数利用知识图谱的推荐算法在探索用户的潜在偏好时没有有效解决知识图谱中存在的不相关实体的问题,导致推荐结果准确率不高。针对这一问题,提出了基于知识图谱和图注意网络的推荐算法KG-GAT(knowledge graph and graph attention network)。该算法将知识图谱作为辅助信息,在图注意网络中使用分层注意力机制嵌入与实体相关的近邻实体的信息来重新定义实体的嵌入,得到更有效的用户和项目的潜在表示,生成更精确的top-N推荐列表,并带来了可解释性。最后利用两个公开数据集将所提算法和其他算法进行实验对比,得出所提算法KG-GAT能够有效解决沿着知识图谱中的关系探索用户的潜在偏好时存在的不相关实体的问题。  相似文献   

15.
In this paper, we explore heterogenous information networks in which each vertex represents one entity and the edges reflect linkage relationships. Heterogenous information networks contain vertices of several entity types, such as papers, authors and terms, and hence can fully reflect multiple linkage relationships among different entities. Such a heterogeneous information network is similar to a mixed media graph (MMG). By representing a bibliographic dataset as an MMG, the performance obtained when searching relevant entities (e.g., papers) can be improved. Furthermore, our academic search enables multiple-entity search, where a variety of entity search results are provided, such as relevant papers, authors and conferences, via a one-time query. Explicitly, given a bibliographic dataset, we propose a Global-MMG, in which a global heterogeneous information network is built. When a user submits a query keyword, we perform a random walk with restart (RWR) to retrieve papers or other types of entity objects. To reduce the query response time, algorithm Net-MMG (standing for NetClus-based MMG) is developed. Algorithm Net-MMG first divides a heterogeneous information network into a collection of sub-networks. Afterward, the Net-MMG performs a RWR on a set of selected relevant sub-networks. We implemented our academic search and conducted extensive experiments using the ACM Digital Library. The experimental results show that by exploring heterogeneous information networks and RWR, both the Global-MMG and Net-MMG achieve better search quality compared with existing academic search services. In addition, the Net-MMG has a shorter query response time while still guaranteeing good quality in search results.  相似文献   

16.
传统的协同过滤推荐算法存在普遍的数据稀疏性问题;应用于推荐算法领域的异构信息网络模型对对象的相似关系认定通常是对称的,这种对称关系的认定在实际问题的处理中存在局限性。为解决上述问题,提出一种非对称异构信息网络的模糊推荐算法。该算法利用模糊集理论在处理用户喜好程度方面的优势,从模糊的信息种获取用户的准确偏好,根据异构信息网络中元路径的丰富语义信息,获取不同角度的用户关联,在相似度计算中引入对象关系的非对称系数,对不同特征元路径的计算结果进行加权,以此提高用户之间相似关系的准确度,通过矩阵分解的方法实现评分预测。实验结果表明,该算法有效解决了数据稀疏性问题,提升了推荐精度。  相似文献   

17.
随着互联网、计算机等技术的深入发展,互联网为用户带来了各类网络服务用于增进用户交流。其中,问答社区为用户提供了提问和回答的交流平台,其目的是通过互联网实现用户间的知识经验分享和信息传播。但仍存在一些问题限制问答社区的发展,例如随着用户数量的不断增长,大量问题得不到及时回答且提问者对已有问题的回答并不满意。因此,对于问答社区来说,如何从大量的用户中找到专家用户是非常重要的。针对以上问题,本文提出一种基于异构信息网络的推荐方法,首先对问答社区中的问题属性和用户属性建立异构信息网络,利用元路径来捕捉异构信息网络中丰富的语义信息,然后使用基于元路径的相似度计算方法分别计算问题与用户的相似度矩阵,采用3种方式将得到的相似度矩阵与问题-用户评分矩阵相融合,然后使用矩阵分解获得问题和用户的潜在特征,最后使用因子分解机进行训练和推荐。在海川化工问答数据集上将本文提出的方法同多种先进的推荐算法进行对比,并利用评价指标对模型进行评估。实验结果表明,本文提出的算法在相关评估指标方面相较于之前的算法具有一定优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号