首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于聚类和模糊关联规则的中医药对量效分析*   总被引:1,自引:0,他引:1  
以数据挖掘为技术手段,对方剂中药对的量效关联进行分析,主要工作包括:根据中药方剂中药物剂量分布的一般规律,用聚类方法自动划分药物剂量的模糊区间;基于模糊关联规则的概念,提出药对量效关联规则的挖掘算法;对所提出的算法进行了实现和验证。结果表明,基于聚类和模糊关联规则挖掘的中医药对量效关联分析符合中医药的基本特点,挖掘出的知识具有较高的正确率。  相似文献   

2.
基于贝叶斯方法的中医“症-证”分析   总被引:4,自引:0,他引:4       下载免费PDF全文
中医“症-证”分析在中医诊断学和中医证候分析中非常重要。该文以数据挖掘技术为手段对选取的古方进行“症-证”研究,对古方的主治症状进行规范,挖掘“症-证”之间的关系,从而判定方剂的主治证、兼治证。为了挖掘中医“症-证”之间的关系,提出了基于KNN的挖掘算法和基于贝叶斯的挖掘算法。对比实验证明,基于贝叶斯方法正确率达到65.76%,高于KNN的62.50%。  相似文献   

3.
李莹  吴晓军 《微机发展》2011,(10):112-115
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构挖掘方法。该方法在传统的超链接结构挖掘算法HITS的基础上引入页面相似度值构造邻接矩阵,并结合基于最大流的Web社区发现技术来构建特征向量空间模型,通过迭代计算最终获得价值最高的权威结果集和中心结果集。实验结果证明该方法有较好的查准率与查全率,并有效抑制了“主题漂移”现象,具有一定的实用价值。  相似文献   

4.
复杂网络的局部社团结构挖掘算法   总被引:1,自引:0,他引:1  
袁超  柴毅 《自动化学报》2014,40(5):921-934
挖掘复杂网络的社团结构对研究复杂系统具有重要的理论和实践意义.其中,相较于全局社团,局部社团的挖掘难度更大,相关文献更少.现有的局部社团挖掘算法大都精度较低、稳定性较差.本文提出了一个有效的局部社团挖掘算法,称为内外夹推法(Shell interception and core expansion,SICE).算法有两个创新之处:1)将节点相似度模型引入到局部社团挖掘算法中(节点相似度模型在局部社团挖掘中较难应用),并提出了“一次一个子图”的社团扩展模式;2)提出了一种“内外夹推”的思想.这两个创新使SICE算法摆脱了缺乏网络全局信息的困扰,并解决了以往算法的一个致命缺陷,从而使算法具有很高的精度和稳定性.通过理论分析和实验比较,证明SICE算法要远好于当前的同类算法,甚至不逊色于性能较好的全局社团挖掘算法.  相似文献   

5.
构效关系是药物分子设计中的核心问题。人工神经网络算法是计算机辅助药物分子设计软件中的一种人工智能方法,近几年在构效关系研究中得到应用,且取得了令人鼓舞的结果。也说明了人工神经网络方法在药物分子设计中具有光明的前景。  相似文献   

6.
在大型数据集中挖掘相关关系的算法   总被引:1,自引:0,他引:1  
为了挖掘对象间的相关关系,建立对象间的相关关系网,该文提出了一种基于传递闭包聚类法挖掘相关关系的方法。为使方法高效、实用,对方法中相似阵及等价阵的计算,文章给出了计算等价阵的一种贪心算法-最大树法、计算相似阵的嵌套循环算法(RNL)及渐进式嵌套循环算法(IRNL)。RNL算法有效减少了大型数据库的I/O开销。当数据库中的数据增加时,使用IRNL算法能够充分利用原来的挖掘结果,避免了原有对象间相关度的重复计算,从而提高了整个挖掘过程的效率。  相似文献   

7.
基因表达编程方法(GEP)是1种较新的进化计算算法,是1种较好的数据挖掘和建模工具。因其出色的数据挖掘能力并能以数学模型表达数据关系而广受关注,但在化学领域的应用还较少。本文应用GEP方法研究环氧酶抑制剂活性和选择性的构效关系(QSAR),选择变量和建立模型,同时与BP人工神经网络(BP-ANN)和遗传算法-多元线性回归(GA-MLR)方法比较。结果发现,GEP方法的预测较好,且模型稳定。研究显示GEP在定量构效关系研究中,具有广阔的应用前景。  相似文献   

8.
基于图结构的挖掘是数据挖掘的新的研究方向,根据相关内容定义了用图表示两个有关文献引用关系的概念,提出了用图挖掘解决文献间相似关系的衡量与解决方法,目的在于找寻以文献为结点构造的图形中结点和结点之间的相互关系,进而反映出文献和文献之间的相似关系与文献的权威度.将图挖掘技术应用在文献引用关系方面,并提出了比较新颖的挖掘算法,此算法适合于以文献为结点构造的有向无环图,并为将来继续研究此方向打下了基础.所得结论将在图挖掘理论研究和网络搜索引擎方面具有很高的实用价值.  相似文献   

9.
基于核矩阵学习的XML文档相似度量方法   总被引:6,自引:0,他引:6  
杨建武  陈晓鸥 《软件学报》2006,17(5):991-1000
XML文档作为一种新的数据形式,成为当前的研究热点.XML文档间相似度的计算是XML文档分析、管理及文本挖掘的基础.结构链接向量模型(structuredlink vector model,简称SLVM)是一种综合考虑XML文档结构信息与内容信息进行XML文档相似度量的方法.体现XML文档结构单元关系的核矩阵在结构链接向量模型中扮演着重要角色.为自动捕获XML文档结构单元关系,提出了两种核矩阵的学习算法,分别是基于支持向量机(support vector machine,简称SVM)的回归学习算法和基于矩阵迭代的学习算法.相似搜索实验对比结果表明,基于核矩阵学习方法的XML文档相似度量方法的准确性明显优于其他方法.进一步实验表明,基于矩阵迭代学习的核矩阵学习算法与基于支持向量机的回归学习算法相比,不仅具有更高的准确性,而且所需训练文档更少、计算代价更小.  相似文献   

10.
目的:研究3-取代吲哆酮类化合物抗肿瘤活性的构效关系。方法:用量子化学从头算法,在HF/6-31g基组上计算分子结构参数,利用逐步回归分析法建立定量构效关系模型。结果:成功建立此类化合物抗肿瘤活性的构效关系模型。结论:3-取代吲哆酮类化合物抗肿瘤活性与吲哆环上的负电荷及取代苄基δ位的电荷数相关,此类化合物与相应酶作用中,可作为电子受体提供空轨道参与反应,活性作用部位在吲哚杂环上。  相似文献   

11.
基于维基百科社区挖掘的词语语义相似度计算   总被引:1,自引:0,他引:1  
词语语义相似度计算在自然语言处理如词义消歧、语义信息检索、文本自动分类中有着广泛的应用。不同于传统的方法,提出的是一种基于维基百科社区挖掘的词语语义相似度计算方法。本方法不考虑单词页面文本内容,而是利用维基百科庞大的带有类别标签的单词页面网信息,将基于主题的社区发现算法HITS应用到该页面网,获取单词页面的社区。在获取社区的基础上,从3个方面来考虑两个单词间的语义相似度:(1)单词页面语义关系;(2)单词页面社区语义关系;(3)单词页面社区所属类别的语义关系。最后,在标准数据集WordSimilarity-353上的实验结果显示,该算法具有可行性且略优于目前的一些经典算法;在最好的情况下,其Spearman相关系数达到0.58。  相似文献   

12.
双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切.目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高.鉴于此,提出了一个新颖的挖掘算法——MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式.就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率.将MRCluster和一个行常量双聚类模式挖掘方法RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率.因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类.  相似文献   

13.
为度量多关系节点相似性、挖掘具有多关系节点的社团结构,提出基于节点多关系的社团挖掘算法LSL-GN。首先基于节点相似性和节点可达性刻画具有多关系的节点相似性度量指标LHN-ISL;然后利用该指标重构目标网络的低密度模型,并结合GN(Girvan-Newman)算法完成社团划分。将LSL-GN算法与多个经典社团挖掘算法在模块度(Q)、标准化互信息(NMI)和调整兰德指数(ARI)上进行对比,结果显示LSL-GN算法在3个指标上均优于经典算法,说明它的社团划分质量相对较好。将LSL-GN应用于“用户-应用”的移动漫游网络模型中,划分出了以携程旅行、高德地图、滴滴出行等为基础应用的社团结构,而这些社团划分结果可为设计个性化套餐业务提供策略参考信息。  相似文献   

14.
推荐系统旨在根据用户的历史行为数据发现该用户可能感兴趣的新项目,并产生相应的推荐。当前大部分的推荐系统多根据用户的历史行为数据,挖掘相似用户,并从相似用户的历史数据中选出彼此历史数据中未出现的新项目;或者根据用户感兴趣的历史项目匹配相似的新项目,从而实现推荐。但这些推荐方式对原始数据有着较强的依赖关系,且难以发觉不同项目之间隐含的序列关系。因此提出一种融合Item2vec和生成对抗网络(Generative Adversarial Networks,GAN)方法的推荐算法,可以学习得到项目间难以表达的关系;挖掘用户历史数据中的序列关系,学习用户兴趣偏好的真实分布;实现用户兴趣偏好的预测。实验发现该推荐算法具有较好的表现。  相似文献   

15.
相似字符的存在是造成多字体字符识别系统出错的一个重要因素。而在传统字符识别系统中,纳入一套前馈神经网络和一个规则行使程序,就可以帮助解决相似字符的混淆问题。与先前的各种方法相比,这种方法有自动选择特征和抽取特征的优点,实验证实,这种方法具有较强的抗噪声能力。它使用一种“雪球”训练算法和“平滑”技术,这两种技术都是对反向传播训练算法的一种修正。“雪球”训练乍法使训练数据有更好的序列,以解决训练收敛问  相似文献   

16.
社区挖掘算法研究是复杂网络分析领域的热点问题。传统层次聚类算法在复杂网络社区挖掘过程中,需要计算所有顶点对之间的相似度。针对这一缺点,在详述了常见相似度计算方法和顶点重要性度量方法的基础上,将ego角色的探测过程引入层次聚类算法,而后只计算其他顶点与ego顶点之间的相似度,提高了社区挖掘效率。最后在不同类型的现实网络中验证了算法的有效性。  相似文献   

17.
王鉴全  季绍波 《计算机科学》2014,41(11):256-259
词语是中文文本的基本元素,汉语语言模型在中文文本挖掘中起关键作用。中文文本挖掘是高维度的数据处理技术,挖掘算法对维度的大小比较敏感,因此挖掘效果依赖于词库的质量。另外,现存的汉语语言模型一般都是基于统计的,比如N-gram语言模型以及各种改进模型都具有较高的计算复杂度。为降低语言模型的计算复杂度、提高词库的质量和构词效率,借鉴关联规则理论对中文词语进行定义,在此基础上构建Auto-word自动构词算法。该算法可以从大量中文语料库中动态地构造词表,并以此为基础进行中文文本挖掘工作。最后通过实验证明了提出的自动构词算法的有效性。  相似文献   

18.
图像语义自动标注问题是现阶段一个具有挑战性的难题。在跨媒体相关模型基础上,提出了融合图像类别信息的图像语义标注新方法,并利用关联规则挖掘算法改善标注结果。首先对图像进行低层特征提取,用“视觉词袋”描述图像;然后对图像特征分别进行K-means聚类和基于支持向量机的多类别分类,得到图像相似性关系和类别信息;计算语义标签和图像之间的概率关系,并将图像类别信息作为权重融合到标签的统计概率中,得到候选标注词集;最后以候选标注词概率为依据,利用改善的关联规则挖掘算法挖掘文本关联度,并对候选标注词集进行等频离散化处理,从而得到最终标注结果。在图像集Corel上进行的标注实验取得了较为理想的标注结果。  相似文献   

19.
本体的自动抽取问题是电子政务信息集成的核心问题之一。在本体的自动抽取过程中,FCA方法用于自动分析概念之间的关系,但它对概念间的同义词关系分析不够。基于这个原因,对FCA方法进行了优化,提出了SFCA算法。算法根据属性在概念中的重要性对属性赋权值,利用属性的权值计算两个概念的相似度,最终确定两个概念是否是同义词关系。通过对算法的实验结果的分析验证其是有效的,并给出了正确性证明。  相似文献   

20.
基于本体的电子政务信息集成研究   总被引:1,自引:0,他引:1  
本体的自动抽取问题是电子政务信息集成的核心问题之一。在本体的自动抽取过程中,FCA方法用于自动分析概念之间的关系,但它对概念间的同义词关系分析不够。基于这个原因,对FCA方法进行了优化,提出了SFCA算法。算法根据属性在概念中的重要性对属性赋权值,利用属性的权值计算两个概念的相似度,最终确定两个概念是否是同义词关系。通过对算法的实验结果的分析验证其是有效的,并给出了正确性证明。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号