首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 221 毫秒
1.
评价中医药方剂的相似度的常用方法是基于方剂的功效和主治功能进行相似度分析,但存在相似度无法定量化的问题,并且没有考虑中医方剂组成成分的影响。提出了利用LDA主题模型发掘“方剂-证型-组成成分”的隐含关系的方法,将“方剂-组成成分”转化成“方剂-证型”和“证型-组成成分”两个概率分布,并利用KL散度距离来计算相似度。实验结果表明基于LDA主题模型的方法能够更好地计算方剂间的相似度,并且能较好地反映中医辩证论治。  相似文献   

2.
篇章分析是自然语言处理领域的一个重要任务。分析篇章主次关系有助于理解篇章的结构和语义,并为自然语言处理的应用提供有力的支持。该文在微观篇章主次关系识别研究的基础上,重点研究宏观篇章主次关系,提出了一种基于word2vec和LDA的主题相似度的宏观篇章主次关系识别模型。基于word2vec的主题相似度和基于LDA的主题相似度在不同维度上计算语义相似度,两者在语义层面形成互补,因而增强了模型识别宏观篇章主次关系的能力。该模型在宏观汉语篇章树库(MCDTB)上实验的F1值达到79.9%,正确率达到81.82%,相较基准系统分别提升了1.7%和1.81%。  相似文献   

3.
词语语义相似度计算在很多自然语言处理相关领域都有着广泛应用.基于知网的现有词语语义相似度计算方法未深入考虑同棵义原层次树的义原距离、义原深度、义原密度及主次关系的影响,致使相似度计算结果并不够精确.针对该问题,提出一种词语语义相似度改进算法,通过分析知网中的义项表达式和义原层次树,用集合的加权平均值代替了义项相似度最大...  相似文献   

4.
词语语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。针对《知网》中现有词语语义相似度计算方法未考虑义原距离与义原深度的主次关系进行了研究,通过约束义原深度因素来改进了义原相似度算法。另外,提出了以词语间第一基本义原相似度最高的概念组合为计算对象,并引入动态加权因子实现了对词语语义相似度算法的改进。对改进前后的算法分别进行了实验,结果表明改进后的算法提高了词语语义相似度的准确性和客观性。  相似文献   

5.
针对传统推荐算法忽略时间因素的问题,根据个体用户短期行为的相似性,利用时间衰减函数计算项目间相关关系,提出基于用户兴趣的项目关联度; 将其用于项目相似度的计算,提出基于用户兴趣的项目相似度; 同时基于项目关联度对ItemRank算法进行改进,提出一种结合时间因素的TItemRank算法.实验结果表明, 利用项目关联度对推荐算法进行改进时,在推荐项目数较少的情况下能够明显地改善推荐效果.特别地,在推荐项目数为20时,基于用户兴趣的项目相似度相比余弦相似度和Jaccard相似度,推荐准确率分别提高了21.9%、6.7%; 在推荐项目数为5时,TItemRank算法相比ItemRank算法推荐准确率提高2.9%.  相似文献   

6.
为了提高基于内容的3D模型检索效率,提出了一种通过基因匹配进行三维模型检索的方法。CAD底层的几何体API及拓扑API作为结构基因和协调基因构成三维模型基因组。基因组相似度主要是指等同基因块的数量、所有结构基因相似度的平均值。将排列次序相同的一系列基因符号串定义为基因块,基因块对应于产品结构的形状特征,基因块的甄别采用的是串模式匹配算法;结构基因相似度是基因欧氏距离的线性函数,采用基因遍历算法实现。参照目标基因组计算待评价基因组的相似度,相应的实例试验演示了这种三维模型检索方法的有效性。  相似文献   

7.
一种基于隶属函数的相似度计算方法及其应用*   总被引:3,自引:0,他引:3  
针对在模糊实例检索中传统的基于距离函数相似度算法的复杂性和不精确性等缺点,通过分析隶属函数提出了基于隶属函数的相似度计算方法。该方法根据不同类型的检索需求,构建了针对模糊数字型需求和模糊语义型需求的相似度计算模型;同时考虑了属性权重问题,采用基于相似度离差信息的客观赋权方法将主观权重和客观权重加以组合,以组合权重来计算实例的全局相似度。以汽车发动机的概念设计为例,验证了基于隶属函数的相似度计算方法能对不同类型的需求实现快速而有效的实例检索。  相似文献   

8.
可分性判据在中文网页分类中的应用   总被引:3,自引:0,他引:3  
提出了一种改进的基于统计的中文网页的分类算法。通过对传统的基于计算相似度文本分类方法和基于贝叶斯模型文本分类算法的研究,我们对贝叶斯模型分类算法进行了改进,提出了利用一种基于概率分布的可分性判据分类方法,即用类别密度函数似然比来增加特征词的可分性信息的算法。通过对计算相似度方法,贝叶斯方法及改进的贝叶斯方法的对比实验表明,改进算法可以使类与类的间隔最大化,因而具有较高的分类精确率和召回率。  相似文献   

9.
基于贝叶斯方法的中医“症-证”分析   总被引:4,自引:0,他引:4       下载免费PDF全文
中医“症-证”分析在中医诊断学和中医证候分析中非常重要。该文以数据挖掘技术为手段对选取的古方进行“症-证”研究,对古方的主治症状进行规范,挖掘“症-证”之间的关系,从而判定方剂的主治证、兼治证。为了挖掘中医“症-证”之间的关系,提出了基于KNN的挖掘算法和基于贝叶斯的挖掘算法。对比实验证明,基于贝叶斯方法正确率达到65.76%,高于KNN的62.50%。  相似文献   

10.
基于聚类分析的RBF网络建模方法及应用的研究   总被引:4,自引:0,他引:4  
该文提出了基于聚类分析的RBF(Radial Basis Function)网络建模方法:利用聚类分析确定RBF神经网络的隐层参数,运用最小二乘法确定RBF神经网络的输出层参数。重点介绍了聚类分析的理论和算法。根据聚类分析和RBF网络结合后的优点以及中医证候大数据、大样本、多中心且无明确函数关系的特性,提出了用该方法建模应用于中医证候诊断,改进了BP(Back Propagation)网络用于中医证候诊断建模的不足之处,并拓宽了RBF神经网络的应用。最后,用2-型糖尿病文献数据库验证了该方法的有效性和合理性。  相似文献   

11.
研究中医冠心病医案,高效挖掘有益信息规则问题,由于中医医案数据量大、关联性强,针对传统的关联规则挖掘算法处理中医医案数据时存在效率低、收敛速度慢及漏报规则等问题,提出一种小生境技术和基因表达式编程相结合的挖掘关联规则的方法。通过惩罚函数设置支持度阈值,利用小生境技术执行小生境演化、融合算法,结合基因表达式编程算法操作简单、鲁棒性强的优势搜索强关联规则,有效避免了算法早熟,解决了规则冗余。针对治疗冠心病的中医医案进行了验证性实验,实验结果表明,改进算法在提取有效信息的效率上有较大的提高,挖掘结果对冠心病中医临床诊治具有一定的参考价值。  相似文献   

12.
王静  张建伟  梁海军 《计算机工程与设计》2012,33(4):1514-1517,1552
通过对空中交通运输管理中目前常用的轨迹预测算法的研究比较和分析,提出了利用遗传算法的从历史数据中进行函数挖掘的思想.针对四维轨迹数据特征的分析和传统的单一函数挖掘的局限性,提出了基于基因表达式编程的频繁函数集挖掘的建模方法.该模型方法通过对历史飞行数据进行遗传算法的操作挖掘出数据集中对应的函数关系集合,用较好的函数模型预测未来航迹.以某一航班雷达数据为训练集做实验,结果表明了应用该方法的准确性和可用性.  相似文献   

13.
基于策略模式的中医数据挖掘平台   总被引:1,自引:0,他引:1  
随着数据挖掘技术的发展和中医信息化的逐渐深入,很多数据挖掘方法被应用到中医研究领域。针对面向对象软件设计模式中的策略模式在数据挖掘科研软件平台设计开发上的应用进行了研究,并提出了平台设计概要。在此基础之上,提出了一种中医数据挖掘研究的思想方法:将中医问题(数据)封装、将数据挖掘方法(算法)封装,实现统一的接口,从而实现在某一类中医问题中尝试不同的数据挖掘方法、将某一种数据挖掘方法应用于不同的中医问题。基于上述思想方法,实现了中医数据挖掘平台,用于中医相关领域的数据挖掘研究。  相似文献   

14.
基于属性归纳的中药方剂数据挖掘   总被引:2,自引:0,他引:2  
传统的面向属性归纳技术(AOI)存在概化粗糙及算法效率较低等缺陷。为适应中药方剂数据挖掘的复杂需求,提出基于中药数据驱动的属性关联概化算法;为关联的维度创建概念树,利用关联属性与基准属性的相关性以提高归纳的效率,实现了面向属性关联归纳的数据挖掘系统TCMDBMiner。实验结果表明,新算法较传统算法的归纳概化效率提高了23%以上,挖掘结果符合中医理论。  相似文献   

15.
基因表达式编程(Gene Expression Programming,GEP)对多项式函数为目标的符号回归问题计算效果良好,而对包含多种运算目数、非多项式函数的计算效果欠佳。受转基因生物工程中基因沉默现象的启发,提出一种GEP拓展算法SFGEP(Gene Expression Programming of Symbol Field,SFGEP)。SFGEP染色体由表达因子域与表达基因域组成,按“深度优先”原则解释染色体,利用不同操作符目数,形成基因表达的抑制因子和位置效应,实现染色体解释中基因沉默的机制。实验结果表明,相较传统多基因染色体GEP,SFGEP既保持了一定多项式函数挖掘的能力,又在包含不同运算目数操作符的非多项式函数挖掘方面具有更好的效能,SFGEP的成功率更高、收敛速度更快。  相似文献   

16.
一种基于GEP的分类规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于一种新的自动程序设计方法基因表达式程序设计(GEP),通过设计适应函数、初始化群体的优化、增加新的遗传算子以及采用演化策略中的(λ+μ)淘汰策略等对原始GEP算法进行有效的改进,设计出一种新的数据挖掘算法。采用UCI机器学习知识库中的数据集对该算法进行了实验,并通过与C4.5及文献[3]的比较,检验了该算法的准确性。  相似文献   

17.
数据挖掘技术在中药自动发药系统中的应用   总被引:1,自引:0,他引:1  
在对中药自动发药系统的发药流程以及对数据挖掘技术的概念、常用分析方法和挖掘过程等知识进行简单介绍的基础上, 探讨了数据挖掘技术在中药自动发药系统中的应用,提出了较好的解决中药自动发药系统效率的策略.  相似文献   

18.
中医概念之间的关系极为复杂,采用传统的基于简单数据集的数据挖掘方法显得力不从心.考虑到中医数据的特点,提出了一种基于图结构的挖掘方法,将中医对象之间的复杂关系和潜在的信息提取出来.首先,通过自然语言处理从医案中抽取出的中医概念与中医本体知识库匹配得到中医的知识网络.然后将该中医网络抽象成数学表达方式--图,利用图论的算法来处理.最后,采用中心性算法来分析中医网络,找出在中医诊断网络中具有重要作用的症状.  相似文献   

19.
基于多维数据分析的中医主药挖掘技术   总被引:2,自引:0,他引:2  
采用数据挖掘技术研究了中药主药分析。提出并实现了基于多维数据分析的主药挖掘算法,在该算法中引入干扰药物过滤算子以及药对算子。以脾胃方剂库为对象,分别使用基于相对剂量的主药分析算法和基于多维数据分析的主药挖掘算法进行了实验。实验表明,加入干扰药物过滤算子以及药对算子的基于多维数据分析的主药挖掘算法能够有效地提高主药分析的正确率。 对  相似文献   

20.
基于策略模式的中医数据挖掘平台的设计与研究   总被引:1,自引:0,他引:1  
随着数据挖掘技术的发展和中医信息化的逐渐深入,很多数据挖掘方法被应用到中医研究领域.本文针对面向对象软件设计模式中的策略模式在数据挖掘科研软件平台设计开发上的应用进行了研究,并提出平台设计概要.在此基础之上,提出一种中医数据挖掘研究的思想方法:将中医问题(数据)封装、将数据挖掘方法(算法)封装,实现统一的接口,从而实现在某一类中医问题中尝试不同的数据挖掘方法、将某一种数据挖掘方法应用于不同的中医问题.基于上述思想方法,实现了中医数据挖掘平台,用于中医相关领域的数据挖掘研究.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号