首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于单标记分类的降维及特征选择方法难以直接运用到多标记学习中,而将多标记学习问题独立分解为多个单标记学习问题再进行降维会丢失标记的相关性信息。为此,提出一种基于嵌入式特征提取的多标记分类算法,将非负矩阵分解引入到多标记学习过程中,在对原始多标记数据集进行特征提取的同时,减少冗余特征、不相关特征及高维特征对多标记分类的影响。在4个公开的标准数据集上进行对比实验,结果表明该算法能对数据进行有效降维,在准确度、精度、F度量值等评价指标上相比传统BR、CC、LM算法具有更好的分类性能。  相似文献   

2.
在多标记学习中,数据降维是一项重要且具有挑战性的任务,而特征选择又是一种高效的数据降维技术。在邻域粗糙集理论的基础上提出一种多标记专属特征选择方法,该方法从理论上确保了所得到的专属特征与相应标记具有较强的相关性,进而改善了约简效果。首先,该方法运用粗糙集理论的约简算法来减少冗余属性,在保持分类能力不变的情况下获得标记的专属特征;然后,在邻域精确度和邻域粗糙度概念的基础上,重新定义了基于邻域粗糙集的依赖度与重要度的计算方法,探讨了该模型的相关性质;最后,构建了一种基于邻域粗糙集的多标记专属特征选择模型,实现了多标记分类任务的特征选择算法。在多个公开的数据集上进行仿真实验,结果表明了该算法是有效的。  相似文献   

3.
在多标记学习框架中,特征选择是解决维数灾难,提高多标记分类器的有效手段。提出了一种融合特征排序的多标记特征选择算法。该算法首先在各标记下进行自适应的粒化样本,以此来构造特征与类别标记之间的邻域互信息。其次,对得到邻域互信息进行排序,使得每个类别标记下均能得到一组特征排序。最后,多个独立的特征排序经过聚类融合成一组新的特征排序。在4个多标记数据集和4个评价指标上的实验结果表明,所提算法优于一些当前流行的多标记降维方法。  相似文献   

4.
多标记学习是针对一个实例同时与一组标签相关联而提出的一种机器学习框架,是该领域研究热点之一,降维是多标记学习一个重要且具有挑战性的工作。针对有监督的多标记维数约简方法,提出一种无监督自编码网络的多标记降维方法。首先,通过构建自编码神经网络,对输入数据进行编码和解码输出;然后,引入稀疏约束计算总体成本,使用梯度下降法进行迭代求解;最后,通过深度学习训练获得自编码网络学习模型,提取数据特征实现维数约简。实验中使用多标记算法ML-kNN做分类器,在6个公开数据集上与其他4种方法对比。实验结果表明,该方法能够在不使用标记的情况下有效提取特征,降低多标记数据维度,稳定提高多标记学习性能。  相似文献   

5.
多标记分类任务中的数据通常是高维的,直接利用高维数据建模可能导致训练效率低下,模型复杂,同时可能影响分类效果.针对多标记数据,文中提出属性-标记矩阵的概念,建立基于标记关系的模糊粗糙集模型,设计此类模型的约简算法,用于多标记数据分类任务的特征选择.在8个公开的数据集上实验验证文中算法的有效性.  相似文献   

6.
传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模.为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签ReliefF和遗传算法的特征选择算法.该方法将ReliefF扩展成可以对特征子集进行评估的多标签ReliefF,特征选择过程首先使用遗传算法搜索特征子集,然后使用多标签ReliefF对特征子集进行评估.在三个多标签分类器上的实验结果表明,提出的特征选择算法可以显著地提升多标签分类器对传感器网络数据故障的检测性能.  相似文献   

7.
由于质谱数据的维数较高,处理时运算量也特别大,同时还降低分类精度.研究者提出一些降维方法,产生了较好的效果.一般降维方法分两类:特征提取和特征选择.两类方法各有优劣,本文提出对特征提取的主成分进行特征选择,提出了将几种特征提取方法与特征选择方法结合的框架,来对数据集进行维数约简.在三个质谱数据集上的实验结果证明新提出的框架对于质谱数据有好的效果,加入特征选择后,建模精度得到了提高.  相似文献   

8.
高斯过程隐变量模型(GPLVM)作为一种无监督的贝叶斯非参数降维模型,无法有效利用数据所包含的语义标记信息,同时其建模过程中假设观测变量的各特征相互独立,忽略了特征之间的空间结构信息。为解决上述问题,采用图像池化操作获得不同尺度的特征表示,利用线性投影方式将不同尺度的图像投影到低维隐空间进行特征融合,并将融合特征和数据标记分别作为输入和输出,构建多尺度多核高斯过程隐变量模型(MSMK-GPLVM),通过图像数据与数据标记的关联实现模型监督学习,同时对GPLVM和线性投影权重矩阵进行联合学习以提高分类性能。实验结果表明,MSMK-GPLVM能够有效利用图像空间结构信息和语义标记信息,相比其他隐变量模型具有更强的数据降维和分类能力。  相似文献   

9.
基于邻域粗糙集的多标记分类特征选择算法   总被引:4,自引:0,他引:4  
多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法以应对维数灾难问题,但对于多标记的属性约简和特征选择却鲜有研究.将粗糙集应用于多标记数据的特征选择中,针对多标记分类任务,重新定义了邻域粗糙集的下近似和依赖度计算方法,探讨了这一模型的性质,进而构造了基于邻域粗糙集的多标记分类任务的特征选择算法,并给出了在公开数据上的实验结果.实验分析证明算法的有效性.  相似文献   

10.
面对多标签的大数据集,传统的分类识别方法识别质量不高,现提出基于分类规则挖掘的数据多标记特征分层识别方法.利用改进后的LLE(局部线性嵌入)方法进行数据降维处理,搜索数据特征,并对数据多标记特征选择,构成特征子集,根据特征子集,利用分类规则挖掘方法构建一个分类识别模型,实现数据多标记特征分层识别.结果 表明,与传统方法相比,所研究方法识别下,汉明损失度最小,数据多标记特征分层识别准确度最大,说明上述方法的识别质量较高,达到了研究的预期目标,为数据利用和挖掘提供了参考和借鉴.  相似文献   

11.
Real estate is an important industry in most countries.However,the analysis of the real estate market is very challenging as the data are high dimensional and have complex spatial and temporal patterns.In this paper,we present a novel Web-based visual analytics system,which integrates state-of-the-art interactive visualizations to enable end users to create their own visualizations and gain insight into the real estate market.The system is implemented using the new features in HTML5,which are natively supported in current browsers.We adopt a coordinated view design in our system consisting of four major components:a map view to show the geographical information of houses,a stacked graph view to show the evolution of house sales over time,a pixel-bar view to visualize multiple attributes of houses,and a treemap view to present the hierarchical structure of the data.Novel clutter reduction methods and rich user interactions are further proposed to enhance the flexibility and analytical ability of the whole system.We have applied our system to real property market data and obtained some interesting findings.Moreover,feedback from the end users of our system is very positive.  相似文献   

12.
孙秀丽  姜学永  李明 《微机发展》2011,(9):145-147,152
为了更好地促进国粹中医药的研究发展,文中研究了关联规则及实现该技术的代表算法Apriori和FP-growth。收集了临床出现的各种中风症状,整理了历代医家在诊治中风过程中使用的方剂、药物,采用基于Apriori算法的关联规则技术对其挖掘,萃取出有利于医学研究的知识。通过挖掘得到的药物高频项集及药物之间的依赖关系,发现了一些治疗效果较好的药和药对;通过症状与药物之间的依赖关系,发现了治疗高频症状的核心药物;这将对中风的诊断和治疗提供有力的支持。  相似文献   

13.
对中医临床诊断数据的特性进行了研究,提出了病证及其特征数据(症状或体征数据)的一些特性指标:病证的相似度、复杂度、隐蔽度,特征数据的贡献度、常见度、显隐性.另外,研究了基于多维关联规则提取诊断经验的方法.在此基础上,研究了一种非充分条件下复杂数据智能化处理拓展算法,该算法的实现模型嵌入了模糊竞争神经网络.该算法在复杂的中医诊断数字化中得到了应用,结果表明,该算法可以较好地处理复杂数据.  相似文献   

14.
15.
数据挖掘技术在中医辅助诊断中被日益重视,计算机辅助诊断本质上是一个数据挖掘分类任务。针对中医临床数据的模糊性和不完整性,提出了一种基于特征提取的分类集成模型。这种模型能将扰动训练数据和扰动输入属性结合起来,生成精确且差异度大的个体分类器。与单个分类器和其他集成方法的对比实验,证明这种新模型在脾虚证辅助诊断上有更低的错误率。进一步的实验显示特征提取在这种新模型中对降低错误率有显著的作用。  相似文献   

16.
中医舌诊知识是中医学的一个重要组成部分,它可以为计算机自动诊断、中医智能教学、中医自然语言理解提供知识基础。介绍了中医舌诊本体,建立了九个中医舌诊本体类和一些相关的本体类,同时也获取了舌诊知识的一些公理。  相似文献   

17.
构建大规模的知识库是人工智能、自然语言理解等领域的基础任务之一。症状作为描述病人的主观感受和诊断疾病的重要依据,更是优化智能导诊、医学问答等任务的重要因素。该文在现有的医学症状知识库研究的基础上,结合症状的概念、特征及在医学诊断中发挥的作用,构建了一个公开的中文症状知识库。该知识库从症状的本体分类、相关疾病、发作部位及多发人群等层面对相关属性进行了详细描述,涵盖了8 772种症状,共计146 631条属性关系。所构建的症状知识库(CSKB)是中文医学知识图谱的重要组成部分,并为KBQA、知识推理及决策支持等应用提供了数据基础。  相似文献   

18.
Medical diagnosis using the tongue is a unique and important diagnostic method of traditional Chinese medicine (TCM). However, the clinical applications of tongue diagnosis have been limited due to two factors: (1) tongue diagnosis is usually based on the capacity of the eye for detailed discrimination; (2) the correctness of tongue diagnosis depends on the experience of physicians; and (3) traditional tongue diagnosis is always dedicated to the identification of syndromes other than diseases. To address these problems, in this paper, we present a tongue-computing model (TCoM) for the diagnosis of appendicitis based on quantitative measurements that include chromatic and textural metrics. These metrics are computed from true color tongue images by using appropriate techniques of image processing. Applying our approach to clinical tongue images, the experimental results are encouraging.  相似文献   

19.
The goal of this work is to propose novel acoustic parameters of voice for the purpose of providing a quantitative analysis of auscultation in traditional Chinese medical diagnosis. There is rare amount of available literature related to this topic. Four novel acoustic parameters, the average number of zero-crossings, the variations in local peaks and valleys, the variations in first and second formant frequencies, and the spectral energy ratio, are presented to analyze and identify the characteristics among non-vacuity, qi-vacuity, and yin-vacuity subjects. Among these acoustic parameters, two temporal parameters, the average number of zero-crossings and the variations in local peaks and valleys, outperformed other parameters in classifying both non-vacuity and deficient subjects. The spectral energy ratio was adequate for the classification between qi-vacuity and yin-vacuity patients. This research is a first step in an ongoing effort to modernize the auscultation in traditional Chinese medical diagnosis.  相似文献   

20.
贝叶斯分类算法在冠心病中医临床证型诊断中的应用   总被引:2,自引:0,他引:2  
在中医药临床个体化诊疗信息平台的基础上,使用中医证型的辨证相关因素,利用信息增益算法进行辨证属性选择,并分别采用朴素贝叶斯和强属性集贝叶斯网络算法建立了中医冠心病临床证型诊断模型。实验结果表明该分类算法在中医冠心病临床诊断模型中具有良好的分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号