首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
李先通  安实 《电子学报》2010,38(12):2937-2943
 交通网络可利用图数据进行描述与分析,常用的方法包括挖掘、查询、分类等.提高大规模图集上查询算法效率的问题是当前图数据分析领域中一个重要的研究方向.给定图集,图包含查询返回图集中所有查询图的子图.本文提出一种基于频繁闭图的包含查询算法.算法首先通过选择比消除频繁闭图之间的冗余,然后将具有强选择性的频繁闭图通过树的结构组织起来建立索引,并在此索引基础上实现图包含查询.在文章的最后,给出了理论与实验的分析结果.结果表明,该算法不但能高效的进行索引筛选,而且能显著的减小候选集尺寸,进而大大的降低了查询图与索引模式之间以及与候选集之间的子图同构测试次数,提高了查询效率.  相似文献   

2.
方晨  张恒巍  王娜  王晋东 《电子学报》2018,46(11):2773-2780
针对传统服务推荐算法由于数据稀疏性而导致推荐准确性不高,以及推荐结果缺乏多样性等缺陷,提出基于随机游走和多样性图排序的个性化服务推荐方法(PRWDR).在分析直接相似关系稀疏性的基础上提出带权重的随机游走模型,通过在用户网络上进行随机游走来挖掘更多的相似关系;基于所有相似用户预测服务的QoS值,并给出服务图模型构建方法,以过滤大量性能过低的候选服务;提出最优节点集合选取策略,利用贪婪算法得到兼具推荐准确性和功能多样性的服务推荐列表.在公开发布的数据集上进行实验,并与多个经典算法进行比较,验证了本算法的有效性.  相似文献   

3.
基于图的半监督学习近年来得到了广泛的研究,然而,现有的半监督学习算法大都只能应用于同构网络。根据查询及文档自身的内容特征和点击关系构建查询—文档异构信息网络,并引入样本的判别信息强化网络结构。提出了查询—文档异构信息网络上半监督聚类的正则化框架和迭代算法,在正则化框架中,基于流形假设构造了异构信息网络上的代价函数,并得到该函数的封闭解,以此预测未标记查询和文档的类别标记。在大规模商业搜索引擎查询日志上的实验表明本方法优于传统的半监督学习方法。  相似文献   

4.
图像检索是计算机视觉领域的一个重要分支。其主要目的是从图像数据库中找出与查询图像相似的语义图像。传统的图像检索方法是在查询图像和数据库图像之间进行“点到点”检索。但是,单个查询图像包含的类别提示较少,即类别信息较弱,使得检索结果并不理想。为了解决这个问题,本文提出了一种基于“点到面”的类别检索策略来扩展一个图像(点)到一个图像类别(面),这意味着从单个查询图像到整个图像类别的语义扩展。该方法挖掘了查询图像的类别信息。在两个常用的数据集上对所提出方法的性能进行了评估。实验表明,该方法可以显著提高图像检索的性能。   相似文献   

5.
<正>本文基于国网客服中心95598语音转文本数据,采用Ro BERTa语言模型对语句进行向量表示与特征提取,通过添加机制,模型可以关注与当前输出相关的信息,并获得文本中的潜在语义信息。通过对照组实验,本文构造的模型能够有效提高实体识别精准程度,且该模型在文本数据集上的抽取效果明显优于其他模型。命名实体识别(Named Entity Recognition,NER)获取有关子任务的信息,搜索分配给文本的对象,并将其分类到预定义的类别中。命名实体识别是自然语言处理中的热点研究方向之一,用于识别和分类文本中的相关实体的类别。命名实体识别的准确度,  相似文献   

6.
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.  相似文献   

7.
李青青  马慧芳  李举  李志欣 《电子学报》2021,49(11):2096-2100
社区搜索旨在寻找与给定查询节点高度相关的个性化社区.现有社区搜索方法多面向简单网络且处理单个查询节点或假定多个查询节点来自同一社区,这种严格的假设使得算法灵活性受限.据此,提出一种在属性网络中利用查询节点随机游走路径的相似性增强的多社区搜索方法,可以有效地定位查询节点所属的多个局部目标社区.具体地,有效融合网络中高阶结构与属性信息,利用重启随机游走计算各查询节点的重要性分数向量;计算查询节点随机游走路径的相似性并设计一种相似性增强策略,使得在无监督学习中相似路径游走者彼此增强关联从而定位不同查询节点所属的多个社区结构;基于结合结构和属性的并行电导值精准查询社区.真实数据集和人工数据集的实验验证了本文方法的有效性和效率.  相似文献   

8.
Web日志挖掘是Web数据挖掘的一个重要研究领域。Web日志挖掘通过发现Web日志中用户的访问规律和模式,可以提取出其中潜在的规律和信息,人们对这个领域的研究也日益重视。然而,传统的基于关联规则的Web日志挖掘算法都是基于所有关联规则的。这种方式往往挖掘产生大量的候选规则,而且存在大量冗余的规则。提出了一种新的无冗余的Web日志挖掘算法,该算法通过引入频繁闭项集合最小关联规则的概念,从而解决了以往基于所有关联规则挖掘算法中出现的上述问题。  相似文献   

9.
基于混合推理系统挖掘用户访问模式的ILP方法   总被引:1,自引:0,他引:1  
提出一种结合DL-safe规则挖掘用户访问模式的ILP方法.该方法首先定义基于事件的日志本体,将DL-safe规则和日志本体构建为一个推理过程可判定的混合日志知识库,在此基础上借助ILp的理论和方法学习生成有效用户访问模式.该方法充分利用日志本体中事件问特定的语义关系有效简化了挖掘过程并提高了挖掘效率,为改进站点结构提供更有效的决策.实验结果表明了该方法的可判定性和有效性.  相似文献   

10.
基于FCM和随机游走的地层图像分割方法   总被引:1,自引:0,他引:1       下载免费PDF全文
颜色特征是地层图像分割的重要依据,但地层图像的高噪声以及地层边界颜色混合使得颜色特征空间聚类分割方法无法获得很好的结果.本文提出了一种融合模糊C均值聚类与随机游走算法的图像分割算法,该算法在聚类过程中结合像素的空间信息计算像素的隶属度,在基于随机游走的半监督图像分割算法中像素结点构成的四连通图上插入类属结点作为已标记结点,将随机游走者第一次游走到某个类属结点的概率作为该像素隶属于该类的隶属度.实验结果表明,本算法可以对地层边界颜色混合区域的像素更准确地进行分类,噪声敏感性降低,有效解决构造模拟地层图像的分割问题.  相似文献   

11.
一种基于随机游动的聚类算法   总被引:2,自引:0,他引:2  
该文提出一种改进的随机游动模型,并在此模型的基础上,发展了一种数据聚类算法。在此算法中,数据集中的样本点根据改进的随机游动模型,生成有权无向图G(V,E,d),其中每个样本点对应图G的一个顶点,并且假设每个顶点为可以在空间中移动的Agent。随后计算每个顶点向其邻集中顶点转移的概率,在随机选定邻集中的一个顶点作为转移方向后,移动一个单位距离。在所有样本点不断随机游动的过程中,同类的样本点就会逐渐的聚集到一起,而不同类的样本点相互远离,最后使得聚类自动形成。实验结果表明,基于随机游动的聚类算法能使样本点合理有效地被聚类,同时,与其他算法对比也说明了此算法的有效性。  相似文献   

12.
In this paper, we present a graph-based approach for mining geospatial data. The system uses error-tolerant graph matching to find correspondences between the detected image features and the geospatial vector data. Spatial relations between objects are used to find a reliable object-to-object mapping. Graph matching is used as a flexible query mechanism to answer the spatial query. A condition based on the expected graph error has been presented which allows determining the bounds of error tolerance and, in this way, characterizes the relevancy of a query solution. We show that the number of null labels is an important measure to determine relevancy. To be able to correctly interpret the matching results in terms of relevancy, the derived bounds of error tolerance are essential  相似文献   

13.
康世泽  马宏  黄瑞阳 《电子学报》2017,45(12):3005-3011
针对在线文本情感摘要生成问题,本文提出了一种基于Opinosis图和马尔科夫随机游走模型的情感摘要框架.首先,该框架将原始文本转化为Opinosis图,并利用其挖掘出文本中的特征词,这些特征词可以用来对原始文本的句子进行分类;其次本文在基于聚类的条件马尔科夫随机游走模型的基础上增加了情感层,改进后的模型可以判断同一聚类中各句子的情感倾向是否具有代表性并结合情感和聚类信息对句子进行排序.实验结果表明,本文提出的方法与基准算法相比在ROUGE(Recall-Oriented Understudy for Gisting Evaluation)值上具有明显提高.  相似文献   

14.
In this paper, we approach the design of ID caching technology (IDCT) for graph databases, with the purpose of accelerating the queries on graph database data and avoiding redundant graph database query operations which will consume great computer resources. Traditional graph database caching technology (GDCT) needs a large memory to store data and has the problems of serious data consistency and low cache utilization. To address these issues, in the paper we propose a new technology which focuses on ID allocation mechanism and high-speed queries of ID on graph databases. Specifically, ID of the query result is cached in memory and data consistency is achieved through the real-time synchronization and cache memory adaptation. In addition, we set up complex queries and simple queries to satisfy all query requirements and design a mechanism of cache replacement based on query action time, query times, and memory capacity, thus improving the performance furthermore. Extensive experiments show the superiority of our techniques compared with the traditional query approach of graph databases.  相似文献   

15.
随着数据库技术的快速发展,管理系统得到广泛应用,人们生产生活中都离不开网络技术,所积累的数据也不断增加.以往的数据库系统能够对数据内容进行录入、查询等功能,但是难以实现对数据未来趋势的预测.校园网络日志能够通过对校园网络中各种事件的记录,将重要的信息提炼出来,及时发现异常行为,对网络结构进行改善.本文将对数据挖掘技术基础上的校园网日志应用以及挖掘系统的设计进行分析.  相似文献   

16.
IP Multimedia Subsystems (IMS) is considered as a comprehensive approach for full-service operation. However,traditional network management concepts are not applicable to IMS network management. This is because IMS is characterized by a flat,all-IP architecture,simplified functionality of Network Elements (NE),and a variety of NEs. This paper introduces an IMS network management system design that covers full-service operation. It then discusses the significant role IMS network management plays in the unifi...  相似文献   

17.
不确定因素在现实世界中普遍存在,因此研究不确定网络条件可信近邻查询具有重要意义。该文给出一种新的解决方法。将不确定网络建模为不确定赋权图,定义不确定图的样本图,样本图指数,基础网络,可达路径长度及可达路径期望长度,并给出基于不确定理论的高效不确定图条件可信近邻查询算法。将不确定网络上的近邻查询等价地转化为基础网络上的近临查询问题。理论分析和实验结果表明所提可信近邻查询算法能够从非确定角度解决不确定网络环境下的近邻查询问题。  相似文献   

18.
研究在图集中挖掘频繁结构模式的方法,并提出了一种发现频繁结构的新算法FSP(Frequent Structure Pattem Mining),通过在图中建立了一种新的字典顺序,并把每个图映射成唯一的最小DFS编码作为图的规范形式,从而把图转换成一个序列。基于这种字典顺序,FSP算法不需要生成候选,采用深度优先搜索策略挖掘频繁连通子图。试验结果显示,FSP算法在性能上优于以前的算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号