首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 859 毫秒
1.
杨丹  陈默  孙良旭  王刚 《计算机科学》2015,42(4):147-150
面对异构信息空间中具有时间信息的大量相互关联的异构实体数据如作者、论文、产品、电影等,提出一个以实体及关联关系为中心的多层的时态数据模型,即多层的时态实体关联网络MTE-Network,它能有效捕捉异构实体和关联关系的时间信息.基于此时态数据模型,提出了实体搜索的多模态融合的查询模型,其支持用户搜索异构信息空间中的任何类型的实体及相关实体,支持在实体级、实体聚类级和时间轴上的实体搜索,并且满足用户多模态融合实体搜索的信息需求.在真实数据集上的实验结果证明了该时态数据模型和查询模型的可行性和有效性.  相似文献   

2.
杨丹  陈默  申德荣 《计算机科学》2017,44(2):112-116
异构信息空间中的实体和关联关系普遍具有时间信息、多种时间版本的实体数据共存,而传统的实体集成忽略了时间信息,不支持时间维度上的集成。提出一种异构信息空间中时间感知的实体集成框架T-EI,从大量异构实体数据中聚集事实形成干净的、完整的、具有时间信息的实体概貌,进而支持时间感知的实体搜索。T-EI利用实体及关联关系所具有的时间信息提出时间感知的实体识别算法,并通过考虑数据时效性提出时间感知的数据融合算法。在真实数据集上的实验结果表明了T-EI的可行性和有效性。  相似文献   

3.
数据空间中一种灵活的集合式实体识别框架   总被引:1,自引:0,他引:1  
数据空间是一个异构、动态的环境,具有随时间演化的特性.针对数据空间中随时间演化的、彼此间具有相互关联关系的大量异构实体,提出一个灵活的、基于演化的集合式实体识别框架TE-CER.TE-CER在实体识别过程中考虑时间信息和演化的影响,提出基于时间的blocking算法T-blocking和基于时间演化的聚类算法TE-Clustering.TE-Clustering聚类算法考虑了演化对实体相似度的影响,在相似度度量中引入属性演化系数和关联关系演化系数;在聚类过程中引入簇的时间约束.并且TE-CER提出基于识别顺序依赖图来确定集合式实体识别的识别顺序的策略,这样一种实体的识别结果可以用来后续另一种相关联实体的识别证据,以提高识别的准确率.在真实数据集上的大量实验结果表明所提出方法的有效性.  相似文献   

4.
针对微博文本内容短、稀疏、高维等特点,提出一种改进的半监督微博聚类算法。该算法利用词项间的关系丰富文本特征,通过定义词项文档间关联关系和词项文档内关联关系揭示词项间语义的关联程度,并由此自动生成有标记的数据来指导聚类过程。对词项先验信息进行成对约束编码,构建基于词项间成对约束的三重非负矩阵分解模型来实现微博的半监督聚类。实验结果表明,该算法可以减少繁琐的人工标记过程,并能高效地进行微博聚类。  相似文献   

5.
为了将语义信息用于文本聚类和有效地进行特征选择,文中提出一种基于协同聚类的两阶段文本聚类方法.该方法分别对文档和特征进行聚类从而得到特征与主题之间的语义关联关系.然后利用此关系来相互调整彼此的聚类结果.实验结果表明,利用特征与主题之间的语义关联关系能有效提高聚类效果.  相似文献   

6.
以流程工厂协同设计应用为背景,提出基于允许误差的最大语义图匹配(MSMGE)算法的异构图形数据近似语义匹配模型。利用类无向图来描述2D和3D异构图形数据的工程属性和拓扑关系,消除了图形信息的异构性,并建立各种类实体的属性标签词典来消除2D和3D属性信息的异构性,用语义表达式来表示类无向图顶点和边的语义关系,将异构图形匹配转化为近似语义图匹配。通过基于工程语义对类无向图进行语义分割和基于最大公共序列算法的语义表达式比较、语义规整和语义裁剪等方法,降低了匹配搜索空间,提高了近似语义图匹配效率,实现了近似语义图匹配判断。该研究已经在流程工厂设计软件中得到较好地应用。  相似文献   

7.
数据空间中数据模型及实体关联关系挖掘的研究   总被引:2,自引:0,他引:2  
数据模型的研究是目前数据空间中研究的主要问题之一,是数据空间管理系统提供其它服务的基础.由于数据空间中多种异构性数据资源的共存和松散连接的特点,有必要提出一个有效、简单而且通用的数据模型来描述和管理这些数据.本文提出了分层的图数据模型lgDM来描述数据空间中的各种数据并捕捉实体间和实体类间的语义关联信息;并给出了实体关联关系挖掘的不同策略和对图加权重的方法.lgDM具有较好地通用性和扩展性,实验结果表明所提出模型的可行性和有效性.  相似文献   

8.
杨丹  陈默  王刚  孙良旭 《计算机科学》2017,44(5):189-192, 205
随着实体搜索成为信息检索的一种新趋势,实体推荐也成为业界和学术界的热门研究问题之一。异构信息空间中的异构实体间彼此相互关联,因此跨类型实体推荐至关重要。此外,异构实体具有时间信息,异构信息空间中的实体不断随时间演化,用户希望得到在时间上最相关的实体推荐。提出一个时间感知的跨类型实体推荐框架T-ERe,利用异构实体间丰富的关联关系和查询日志实现跨类型的实体推荐。T-ERe考虑实体的时间信息和查询的时间上下文, 给用户推荐时间上最相关的多种类型的实体。在真实数据集上的实验结果表明了T-ERe的可行性和有效性。  相似文献   

9.
推荐在满足用户信息需求和解决信息过载问题中发挥着重要作用,异构信息网络因其蕴含丰富的语义信息为推荐的优化提供了新的途径。在查阅国内外异构信息网络的推荐研究基础上,采用SATI、Ucinet、NetDraw和SPSS等软件进行文献计量分析和可视化分析,得出当前研究热点和进展。依据文献关键词的聚类结果,发现已有研究主要是基于聚类、随机游走、元路径、矩阵分解和网络嵌入的算法,并实现了在学术科研、兴趣点、Web服务、社交好友、专利交易和新闻等推荐场景的应用。基于异构信息网络的推荐研究还有较大发展空间,未来可以在动态推荐、深度网络表示学习和拓展应用等方面开展研究。  相似文献   

10.
石乐昊  寇月  申德荣  聂铁铮  李冬 《软件学报》2022,33(10):3619-3634
由于异构信息网络具有丰富的语义信息而在推荐任务中得到广泛应用.传统的面向异构信息网络的推荐方法忽略了网络中关联关系的异质性,以及不同关联类型之间的相互影响.本文提出了一种基于多视角嵌入融合的推荐模型,分别从同质关联视角和异质关联视角来挖掘异构信息网络的深层潜在特征并加以融合,有效地保证了推荐结果的准确性.针对同质关联视角,提出了一种基于图卷积神经网络的嵌入融合方法,通过对同质关联作用下节点邻域信息的轻量式卷积,实现节点嵌入的局部融合.针对异质关联视角,提出了一种基于注意力的嵌入融合方法,利用注意力机制来区分不同关联类型对节点嵌入的影响,实现节点嵌入的全局融合.通过实验验证了本文所提出的关键技术的可行性和有效性.  相似文献   

11.
基于用户搜索行为的query-doc关联挖掘   总被引:1,自引:0,他引:1  
朱亮  陆静雅  左万利 《自动化学报》2014,40(8):1654-1666
query和doc之间的关联关系是搜索引擎期望获取的一类有价值的信息. query和doc间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query理解和doc理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query和doc关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session数据,最终挖掘出点击日志中用户没有点击到的doc数据,从而预测出query和doc间的隐含关联关系,同时也可以利用该算法得到query和query潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础.  相似文献   

12.
基于局部语义聚类的语义重叠社区发现算法   总被引:2,自引:0,他引:2  
语义社会网络是一种包含信息节点及社会关系构成的新型复杂网络,因此以节点邻接关系为挖掘对象的传统社会网络社区发现算法无法有效处理语义社会网络重叠社区发现问题。针对这一问题,提出基于局部语义聚类的语义社会网络重叠社区发现算法,该算法:1)以 LDA (latent Dirichlet allocation)模型为语义信息模型,利用 Gibbs 取样法建立节点语义信息到语义空间的量化映射;2)以节点间语义坐标的相对熵作为节点语义相似度的度量,建立节点相似度矩阵;3)根据社会网络的局部小世界特性,提出语义社会网络的局部社区结构 S‐fitness 模型,并根据 S‐fitness 模型建立了局部语义聚类算法(local semantic clusterm ,LSC);4)提出可度量语义社区发现结果的语义模块度模型,并通过实验分析,验证了算法及语义模块度模型的有效性及可行性。  相似文献   

13.
项目文档主题表征的好坏直接影响后续评审专家的推荐效果.为有效利用项目文档片段之间的关联关系进行项目主题分析,提出一种基于半监督图聚类的项目主题模型构建方法.该方法首先分析项目文档的结构特点,提取项目名称、项目关键字等能表征主题的结构信息,结合专家证据文档、专家主题关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征;然后,利用不同类型的关联关系计算项目文档片段之间的相关性,构建项目文档片段间的无向图模型;最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,从而实现项目主题的提取.项目主题提取对比实验结果验证了所提方法的有效性,项目文档结构化特征、专家证据文档以及专家主题关系网对项目主题模型的构建具有一定的指导作用.  相似文献   

14.
信息服务目前依然是一个研究热点。提出了基于语义关联的信息聚焦概念及数学模型。信息聚焦作为一种新的信息服务方式,利用信息之间的语义关联关系实现信息汇聚。首先给出了基于本体的元数模型以及信息、信息空间的数学模型和信息聚焦的数学描述,并在此基础上提出了基于本体的语义相关及信息聚焦的形式化描述。  相似文献   

15.
提出一种基于词项关联关系与归一化割加权非负矩阵分解的微博用户兴趣模型构建方法.该方法首先基于词分布上下文语义相关性来建立词项关联关系矩阵刻画词项间相似度,然后应用归一化割加权非负矩阵分解算法获取用户—主题矩阵,产生用户感兴趣的微博主题聚类结果.实验表明,此方法能有效地进行微博主题聚类,并支持微博用户兴趣模型构建.  相似文献   

16.
研究了语义数据的聚类问题,提出了一种基于样本内在结构的结构嫡聚类SEC算法。通过给出语义属性相异性度量测度的新定义,挖掘蕴含于数据样本中的结构信息,提出了一种根据结构信息计算样本信息嫡的优化方法,即通过嫡来确定样本的聚类中心,从而完成样本的聚类,并把此方法向异构数据进行了拓展。SEC算法能实现不平衡数据的聚类,能自动确定初始类中心和聚类数目,具有无需迭代、效率高和相当的鲁棒性优势。实验表明,算法是有效的,与文献中的已有方法相比,聚类准确率得到显著提高,具有一定的实用价值。  相似文献   

17.
数据库语义上的异构成为数据整合的重点和难点。针对该问题文章提出一种基于鱼群算法的异构数据库语义聚类算法。其思路是,首先对数据库属性信息进行向量化、矢量化,利用鱼群算法得到一个较优的聚类结果,再根据鱼群算法的结果使用模糊C-均值算法进行调整聚类。实例分析结果证明,该算法具有较高的聚类准确度。  相似文献   

18.
根据加权关联关系挖掘模型和算法,提出一种基于XQuery应用的XML数据加权关联关系的挖掘方法.  相似文献   

19.
根据各分布信息源信息单元实体类的语义相似度,对于信息单元实体类进行聚类,是半自动地进行本体映射、构建分布异构信息资源全局视图的重要步骤。本文面向分布信息资源统一信息视图构建需求,利用基于本体的元数据模型及语义相似度,在其基础上定义了语义聚类特征,基于语义聚类特征设计了一种基于语义特征树的混合层次聚类算法SCFBHCA。从理论和实验两个角度对SCFBHCA算法进行了分析,对比HCA和HCP,该算法具有增量式和扩展性且效率更高。  相似文献   

20.
在同类服务或产品中识别和量化竞争是当前竞争关系挖掘领域关注的重要问题。提出科学合理的竞争关系评价指标,构建实体竞争关系综合评价指标体系,使用隐含Dirichlet分布(LDA)模型对消费者口碑评论进行降维和主题提取,构建口碑相似度函数,对实体用户口碑相似度进行量化表示。根据实体地理位置属性,计算实体空间距离,构建实体相邻关系并以具有相邻关系实体的距离作为聚类中心,使用K近邻(KNN)算法对其进行聚类。综合上述技术提出LTM模型,融合了用户评论、实体地理位置属性,量化实体间竞争关系。大量真实移动社交网络数据上实验结果表明所提方法在量化指标制定、实用性和时间性能上具有较大优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号