首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
针对有向图的局部扩展的重叠社区发现算法   总被引:1,自引:1,他引:0  
当前社区发现算法主要是针对无向图研究社区结构,但在实际复杂网络中,链接关系时常表现出非对称性或方向性,比如Twitter的用户关注关系,文献网络的引 用关系,网页之间的超链接关系等应用网络。因此,本文依据信息在复杂网络中的传播规律和流动方向性,提出了k-Path共社区邻近相似性概念及计算方法,用于衡量结点在同一社区的相似性程度,并给出了把有向图转换为带方向权值的无向图的方法。基于带权无向图提出了一种从局部扩展来探测社区的重叠社区发现算法(Local and wave-like extension algorithm of detecting overlapping community, LWS-OCD)。在真实数据集上的实验表明,共社区邻近相似性概念实现了有向到无向的合理转换,而且提高了社区结点的聚集效果,LWS-OCD算法能够有效地发现带权无向图中的重叠社区。  相似文献   

2.
基于社会性标注的本体学习方法   总被引:2,自引:0,他引:2  
由相互协作的用户在社会性标注系统中产生的大量的标注数据可以作为各种语义网应用的数据源.文中提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息,提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基于此模型推导出本体学习算法.首先利用集合论的方法确定标签之间的包容关系,并将其表示为标签包容关系图.在将此图转化为层次关系时,为解决包容关系的不一致性,提出一种基于随机游走的标签普遍性排序方法.最后提出一种自顶向下的凝聚式层次聚类算法来生成概念层次结构.在实际社会性标注系统中采集的数据集上进行的实验表明,与目前的代表性方法相比,文中提出的方法在性能上有明显的提高.  相似文献   

3.
吴振强  胡静  田堉攀  史武超  颜军 《软件学报》2019,30(4):1106-1120
社交网络平台的快速普及使得社交网络中的个人隐私泄露问题愈发受到用户的关心,传统的数据隐私保护方法无法满足用户数量巨大、关系复杂的社交网络隐私保护需求.图修改技术是针对社交网络数据的隐私保护所提出的一系列隐私保护措施,其中不确定图是将确定图转化为概率图的一种隐私保护方法.主要研究了不确定图中边概率赋值算法,提出了基于差分隐私的不确定图边概率赋值算法,该算法具有双重隐私保障,适合社交网络隐私保护要求高的场景.同时提出了基于三元闭包的不确定图边概率分配算法,该算法在实现隐私保护的同时保持了较高的数据效用,适合简单的社交网络隐私保护场景.分析与比较表明:与(k,ε)-混淆算法相比,基于差分隐私的不确定图边概率赋值算法可以实现较高的隐私保护效果,基于三元闭包的不确定图边概率分配算法具有较高的数据效用性.最后,为了衡量网络结构的失真程度,提出了基于网络结构熵的数据效用性度量算法,该算法能够度量不确定图与原始图结构的相似程度.  相似文献   

4.
现实社会存在大量复杂网络,随着大数据时代的来临,复杂网络数据规模不断扩大,难以进行算法分析和可视化展示.针对复杂网络小世界、无标度特性,提出基于K-sup稠密子图的复杂网络概要算法,利用三角形在网络中的同质性和传递性发现复杂网络中的稠密子图,结合模块度最大化,将子图中相似的节点归并为超点;运用分层结构存储概要图,并进行可视化显示.该算法能对大规模复杂网络进行有效压缩,保持原网络的性质.在5个真实数据集上进行对比实验,显示出该算法在压缩率、幂率性和平均聚类系数的保持等指标优于已有算法,同时在大规模数据下具有保持网络拓扑结构且支持概要图分层可视化的优点.  相似文献   

5.
网络数据下的概念认知与知识发现是网络背景下机器学习和人工智能的重要研究方向,已被引入到推荐系统研究中。现有的基于概念格的推荐方法忽视了节点之间的网络结构关系,同时构造概念格的效率低且构建概念集合的约束条件较严,在大规模的社交网络中难以实现。为解决这些问题,本文在网络形式背景的框架下,综合复杂网络的拓扑结构和弱概念相似度,提出了基于弱概念相似度的组推荐算法。首先,定义属性度、属性密度来描述属性的重要性,通过改进的节点影响力来确定专家节点;其次,利用专家节点划分社区,在划分的社区中通过属性弱概念下限相似度进行组推荐研究,进而获取推荐规则并对相应社区进行组推荐;最后,利用MovieLens数据集和Filmtrust数据集分析了各参数对本文所提算法的影响,并确定了参数的合理取值。将本文所提算法与其他推荐算法进行比较测试,实验验证了本文算法的有效性。  相似文献   

6.
传统协同过滤算法存在严重的数据稀疏和冷启动问题。利用社交网络中的丰富信息为解决传统协同过滤算法的数据稀疏和冷启动带来了契机。然而,传统基于社交网络的协同过滤算法仅利用粗粒度、稀疏的用户信任关系来改进传统协同过滤算法,即用0或1表示用户之间信任程度。另外,传统基于社交网络推荐算法仅仅集成用户之间显式信任关系,而忽略用户之间隐式的信任关系。本文提出一种基于图嵌入模型的协同过滤推荐算法,即利用图嵌入模型技术学习社交网络中用户的低维特征表示,并根据用户的低维特征表示推导用户之间细粒度的信任关系。最后,根据信任用户和相似用户对目标物品的评分权重预测用户对目标物品的评分。在真实数据集上的实验结果表明,基于图嵌入模型的协同过滤算法的性能优于传统的协同过滤算法。  相似文献   

7.
基于图的语义网络构造算法研究   总被引:2,自引:0,他引:2  
在自然语言处理的基础上,将中医领域本体与图的基本性质相结合,提出了构造中医诊疗知识语义网络算法.给出了图的基本性质、语义网络的图定义,并为知识的网络表示建立了相应的数据结构.将算法用于中医领域语义网络和语义场构建.试验结果表明,该算法具有较好的实用性.提出的基于图的语义网络构造算法,对于文本挖掘、知识获取技术研究有重要意义,也是中医专家知识获取的有效方法.  相似文献   

8.
《微型机与应用》2017,(15):16-21
作为网络数据交换和数据共享的标准,XML数据越来越多地用于表示应用系统的流数据。然而,受制于流数据处理有限空间开销等特征,如何高效地实现这种查询成为值得探讨的问题。与传统的基于自动机或层次栈方法不同,文中提出了一种基于图归约的XML查询自动机(GRAT),采用一种图结构来表示针对不同XML流元素的子查询任务之间的关系,通过图的归约变化来实现XPath查询。实验结果表明,基于GRAT的查询算法能够高效地完成复杂的XML查询,流数据处理的吞吐量达到了较高水平。  相似文献   

9.
异常检测是指识别数据集中显著区别于其他正常模式的数据,广泛应用于欺诈检测、入侵检测、数据分析等领域.现有的异常检测研究大多是基于非结构化数据点集,而现实中数据间复杂的结构关系构成了复杂网络,在数学形式上表示为图,所以面向复杂网络的异常检测的需求日益增加.对此,总结了当前复杂网络异常检测的方法与研究进展:首先提出复杂网络异常检测的必要性与发展历史;其次,分别从静态图和动态图的视角将复杂网络异常检测分为基于结构、社区、关系学习的静态图异常检测和基于节点、边、子图、全图的动态图异常检测;然后,分类别地进行概述、分析与比较,并给出复杂网络异常检测的应用场景;最后,总结未来面向复杂网络异常检测的研究方向.  相似文献   

10.
基于网络结构的推荐算法存在多样性不足的问题,为此提出了一种基于二部图多权重投影的大数据推荐算法。首先,提取出数据集的基础信息,将所有的项目—用户数据输入莱文斯坦距离程序,计算各个属性之间的相似性;然后,计算二部图网络中节点之间相同邻居的数量、节点之间的共同邻居度以及每个节点的度,计算二部图网络中每条边的三重权重;最后,采用增强的二部图投影技术提取二部图网络的潜在链接,实现基于相似性的链接预测。在大数据集与小数据集上分别开展了实验,结果显示该算法的准确率与覆盖率均优于其他几种类型的推荐算法,并且优于同类型的推荐算法。  相似文献   

11.
蓝昊慧 《计算机时代》2012,(11):26-27,30
中药复方数据挖掘研究是将我国丰富的中药信息资源和现代最新信息技术相结合的重要内容,它意味着基于中医理论,利用知识发现技术,对传统中药新药、中医组方理论及规律、中药作用机制、有效成分构效关系等多个方面进行全面、系统的研究。图作为一种经典的数据结构,被广泛用于复杂数据结构分析与建模。文章探讨了图建模技术并实现了中医方剂与图集的转换。  相似文献   

12.
基于多维数据分析的中医主药挖掘技术   总被引:2,自引:0,他引:2  
采用数据挖掘技术研究了中药主药分析。提出并实现了基于多维数据分析的主药挖掘算法,在该算法中引入干扰药物过滤算子以及药对算子。以脾胃方剂库为对象,分别使用基于相对剂量的主药分析算法和基于多维数据分析的主药挖掘算法进行了实验。实验表明,加入干扰药物过滤算子以及药对算子的基于多维数据分析的主药挖掘算法能够有效地提高主药分析的正确率。 对  相似文献   

13.
Computational methods for Traditional Chinese Medicine: a survey   总被引:1,自引:0,他引:1  
Traditional Chinese Medicine (TCM) has been actively researched through various approaches, including computational techniques. A review on basic elements of TCM is provided to illuminate various challenges and progresses in its study using computational methods. Information on various TCM formulations, in particular resources on databases of TCM formulations and their integration to Western medicine, are analyzed in several facets, such as TCM classifications, types of databases, and mining tools. Aspects of computational TCM diagnosis, namely inspection, auscultation, pulse analysis as well as TCM expert systems are reviewed in term of their benefits and drawbacks. Various approaches on exploring relationships among TCM components and finding genes/proteins relating to TCM symptom complex are also studied. This survey provides a summary on the advance of computational approaches for TCM and will be useful for future knowledge discovery in this area.  相似文献   

14.
Traditional Chinese Medicine (TCM) has been actively researched through various approaches, including computational techniques. A review on basic elements of TCM is provided to illuminate various challenges and progresses in its study using computational methods. Information on various TCM formulations, in particular resources on databases of TCM formulations and their integration to Western medicine, are analyzed in several facets, such as TCM classifications, types of databases, and mining tools. Aspects of computational TCM diagnosis, namely inspection, auscultation, pulse analysis as well as TCM expert systems are reviewed in term of their benefits and drawbacks. Various approaches on exploring relationships among TCM components and finding genes/proteins relating to TCM symptom complex are also studied. This survey provides a summary on the advance of computational approaches for TCM and will be useful for future knowledge discovery in this area.  相似文献   

15.
基于聚类和模糊关联规则的中医药对量效分析*   总被引:1,自引:0,他引:1  
以数据挖掘为技术手段,对方剂中药对的量效关联进行分析,主要工作包括:根据中药方剂中药物剂量分布的一般规律,用聚类方法自动划分药物剂量的模糊区间;基于模糊关联规则的概念,提出药对量效关联规则的挖掘算法;对所提出的算法进行了实现和验证。结果表明,基于聚类和模糊关联规则挖掘的中医药对量效关联分析符合中医药的基本特点,挖掘出的知识具有较高的正确率。  相似文献   

16.
在中医药领域挖掘药组频繁项集时发现,尽管有些项集的支持度比人们需要的频繁项集的支持度高很多,但这些项集并不是人们感兴趣的,即过分频繁反而变得平凡.本文引入支持度区间的概念,提出了适合中药数据挖掘的二维TCM-FP森林结构及其建树算法.在针对疾病症状的中药药组挖掘过程中,采用优化的搜索策略开发了基于支持度区间的TCMA维间最大频繁项集挖掘算法.这种算法既缩小了挖掘的范围又提高了规则的意义,并且具有较高的执行效率.  相似文献   

17.
将TCMA算法用于挖掘TCM-FP树中的最大频繁项集。在中药维度上应用了双支持度,既缩小了挖掘的范围又提高了规则的意义。算法挖掘的中药TCM规则切合实际,且比FP-growth挖掘算法有更高的运行效率。基于TCMA算法设计了中药挖掘器。将挖掘出的TCM规则作为知识库,可为中药的配方提供参考。  相似文献   

18.
基于贝叶斯方法的中医“症-证”分析   总被引:4,自引:0,他引:4       下载免费PDF全文
中医“症-证”分析在中医诊断学和中医证候分析中非常重要。该文以数据挖掘技术为手段对选取的古方进行“症-证”研究,对古方的主治症状进行规范,挖掘“症-证”之间的关系,从而判定方剂的主治证、兼治证。为了挖掘中医“症-证”之间的关系,提出了基于KNN的挖掘算法和基于贝叶斯的挖掘算法。对比实验证明,基于贝叶斯方法正确率达到65.76%,高于KNN的62.50%。  相似文献   

19.
A self-learning expert system for diagnosis in traditional Chinese medicine   总被引:5,自引:0,他引:5  
A novel self-learning expert system for diagnosis in Traditional Chinese medicine (TCM) was constructed by incorporating several data mining techniques, mainly including an improved hybrid Bayesian network learning algorithm, Naı̈ve–Bayes classifiers with a novel score-based strategy for feature selection and a method for mining constrained association rules. The data-driven nature distinguished the system from those existing TCM expert systems based on if-then rules to address knowledge elicitation problem. Moreover, the learned knowledge was provided in multiple forms including causal diagram, association rule and reasoning rules derived from classifiers. Finally, five representative cases were diagnosed to evaluate the performance of the system and the encouraging results were obtained. The results show that the prototype system performs well in diagnosis of TCM, and could be expected to be useful in the practice of TCM.  相似文献   

20.
中医专家系统技术综述及新系统实现研究   总被引:2,自引:0,他引:2  
对中医专家系统二十多年来的发展进行了简单的概括,总结了专家系统应用在中医领域的技术特点。基于中医诊断专家系统的发展现状,分别从系统建模、知识获取和知识库构建等方面提出了新的思路和实现技术,例如认知模型的建立、领域本体的应用、自然语言理解、数据挖掘、知识网络、多智体agent技术等,并设计了一种新型中医专家系统,为中医专家系统的发展提供了有价值的参考方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号