共查询到19条相似文献,搜索用时 171 毫秒
1.
研究中医冠心病医案,高效挖掘有益信息规则问题,由于中医医案数据量大、关联性强,针对传统的关联规则挖掘算法处理中医医案数据时存在效率低、收敛速度慢及漏报规则等问题,提出一种小生境技术和基因表达式编程相结合的挖掘关联规则的方法。通过惩罚函数设置支持度阈值,利用小生境技术执行小生境演化、融合算法,结合基因表达式编程算法操作简单、鲁棒性强的优势搜索强关联规则,有效避免了算法早熟,解决了规则冗余。针对治疗冠心病的中医医案进行了验证性实验,实验结果表明,改进算法在提取有效信息的效率上有较大的提高,挖掘结果对冠心病中医临床诊治具有一定的参考价值。 相似文献
2.
为了提高关联规则挖掘算法处理大数据集的能力,在基因表达式编程进化算法(Gene Expression Program-ming)的基础上,提出了一个新的挖掘强关联规则的算法框架.主要贡献在于提出并实现了基于小生境技术的基因表达式编程进化算法NGEP,以用于挖掘关联规则.NEGP算法首先进行小生境演化,融合小生境并剔除同构的优秀个体,然后对小生境解进行笛卡儿交叉,以产生更好的结果.实验结果表明,与同类优秀的算法对比,NGEP算法的种群多样性与精确度都有很好的结果,并且在提取有效规则的效率上也有较大的提高. 相似文献
3.
在事务数据集中发现项目间的关联规则是数据挖掘的一个经典问题,但传统的关联规则挖掘方法对于大事务数据集而言,执行效率相对较低。已经有研究表明,采样技术能有效地改善挖掘效率。在分析现有采样方法的基础上,提出了一种新的基于采样的高效关联规则挖掘算法ESMA。该算法采用了更加有效的双向采样策略。通过实验分析表明,该算法明显地加快了大事务数据库中采样的速度,从而降低了CPU时间,而且具有很好的可扩展性。 相似文献
4.
5.
6.
针对传统数据关联挖掘过程只适用于单段数据集,导致内存负担重、挖掘频繁项集效率不高等问题,提出一种多段支持度数据频繁模式关联规则挖掘方法.运用多支持度算法对数据集逐步搜索,数据集按照数据项的MIS大小有序排列,采用最小值作为最小支持度,确保该算法的地推性.构建FP_ tree树,利用FP_tree算法对待选项实施剪枝,从而准确挖掘出频繁模式的关联规则.仿真结果证明,多段支持度数据频繁模式关联规则挖掘具有较好的性能,有效提高了关联规则的挖掘效率. 相似文献
7.
8.
飞行器遥测数据是飞行器状态的直接体现,对飞行器遥测数据的不断深入分析和研究,可为飞行器的安全性和稳定性提供有效保障;目前复杂飞行器的遥测数据存在试验数据量大、人工判读效率低、数据间关联关系复杂且不易梳理等问题;同时,数据智能化分析程度低,缺少对海量历史试验数据的有效利用;为克服现有技术不足,通过对飞行器遥测数据的关联规则挖掘方法进行研究,提出基于状态转换提取的关联规则挖掘算法,并与FP-Growth算法进行试验挖掘对比分析,实现对飞行器遥测数据参数的关联规则挖掘分析,有效地解决飞行器遥测数据间关联规则的梳理问题,试验结果准确率高,为飞行器工况与参数的关联规则挖掘提供重要参考意义. 相似文献
9.
《计算机应用与软件》2014,(1)
对垂直分布于不同站点的数据进行联合关联规则挖掘是一个重要的研究方向,然而已有的算法挖掘得到的都是全局单维关联规则,不能处理多维数据集并得到全局多维关联规则。针对此问题提出一种数据两方垂直分布条件下的多维关联规则挖掘算法TDDM(Two Part Vertically Distributed Data Mining),该算法结合数据立方体技术,直接在垂直分布于两方的数据上进行挖掘,得到多维关联规则。理论分析和实验结果表明,该算法可以有效挖掘数据两方垂直分布条件下的多维关联规则。 相似文献
10.
针对网络入侵攻击检测系统检测准确率与计算效率较低的问题,提出一种基于人工蜂群算法的分布式入侵攻击检测系统。将训练集划分为若干的子集,使用特征选择方法提取特征集中类内相关性高、类外相关性低的特征;对人工蜂群算法进行修改,通过引入全局搜索能力强的算法提高人工蜂群算法的性能;根据优化的特征子集与规则集对网络入侵攻击行为进行分类处理。基于网络入侵数据集的实验结果表明,该系统实现了较高的检测性能和计算效率。 相似文献
11.
12.
数据挖掘是一种新兴的信息处理技术,本文将其中的关联规则运用到中药化学数据的处理,对其中的中医药效、植物科属、化学成分的活性、中药提取物现代药理等数据进行了维间关联规则的挖掘,找到了一系列的强规则,并对这些规则进行了分析,得到了其中有趣的关联规则,同时该关联规则的结果也说明了中药和西药在药效概念上的差异。该结果对于中药现代化,植物化学等相关的研究提供了一种新的思路。 相似文献
13.
A novel self-learning expert system for diagnosis in Traditional Chinese medicine (TCM) was constructed by incorporating several data mining techniques, mainly including an improved hybrid Bayesian network learning algorithm, Naı̈ve–Bayes classifiers with a novel score-based strategy for feature selection and a method for mining constrained association rules. The data-driven nature distinguished the system from those existing TCM expert systems based on if-then rules to address knowledge elicitation problem. Moreover, the learned knowledge was provided in multiple forms including causal diagram, association rule and reasoning rules derived from classifiers. Finally, five representative cases were diagnosed to evaluate the performance of the system and the encouraging results were obtained. The results show that the prototype system performs well in diagnosis of TCM, and could be expected to be useful in the practice of TCM. 相似文献
14.
15.
中医药数据预处理方法的设计与实现 总被引:4,自引:2,他引:4
中药作为一种天然药物,它由我国传统使用的植物、动物和矿物药及其成药组成,由于中药文化的地区差异使得中药中的不确定性较高,因此将关联规则发现算法应用于原始中药专利数据库发现规则,存在一定的难度。阐述了一套规范原始中医药数据的处理方法,改进了数据质量,使得数据挖掘技术可以在预处理后的中药方剂数据库中成功地发现中药单方之间的配伍规律,为研制中药新药提供决策信息。 相似文献
16.
17.
18.
As an important part of traditional medicine, TCM (Traditional Chinese Medicine) has unique and distinct clinical effects in the aspect of disease diagnosis and treatment. Thousands of years of TCM treatment has accumulated abundant clinical data and medical literatures, including valued TCM theories and clinical practice rules. Researchers have conducted various methods such as clustering analysis, association rules and regression analysis to study TCM theory. However, none of them could reflect well the semantic complexity of TCM and systemic characteristics of TCM treatment. This paper conducted a research on the inherent rules of TCM clinic records with a topic model. On the basis of LDA model, weighted mechanism was adopted for each feature word to improve the distinguishing ability and interpretability between the topics. Meanwhile, the modeled topic is taken as the feature for the classification of SVM (Support Vector Machine) to improve the classification accuracy. The topic number of LDA topic model is confirmed by the KL distance and similarity between the topics. After analyzing the relationship between topic model and TCM differentiation and treatment, MULTI-RELATIONSHIP Topics LDA MODEL was proposed on the basis of LDA model and Author-topic model to automatically extract the topic structures between the four parties and explore the relationship of the multiple parties with clinical significance. In the meantime, relevancy between the parties and the feature word weighted mechanism are used to improve the MULTI-RELATIONSHIP Topics LDA MODEL and the classification accuracy of the topics. The experiments showed that analysis of clinical data with topic model can extract TCM treatment rules and provide a novel theoretical method for TCM clinical research. 相似文献
19.
针对关联数据集合呈现出的大数据特性和蕴含的语义信息,提出了首先建立关联数据集的模式级链接,再进行关联规则挖掘的方法。在同领域RDF数据集上定义RDF数据项模式并提出数据项模式的产生规则;利用RDF数据查询技术从数据项模式获得RDF数据项集合,进而再推导出特定领域内的关联规则。提出的基于关联数据RDF数据项模式的关联规则挖掘方法将关联规则挖掘扩展到同一领域内的数据集合而不再局限于单一数据集,同时给出了基于Hadoop的大规模RDF数据集上的关联规则挖掘的实现方案。实验结果验证了模式级链接对于关联规则挖掘的价值和所提方法的有效性。 相似文献