首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
范明  刘艳霞 《计算机应用》2005,25(Z1):152-154
提出了一种新的稀有类分类方法,称作VeEPRC.该方法使用一种特殊的EP(基本显露模式,eEP)构造基于eEP的分类器,并对它们"装袋",建立有效的组合分类器VeEPRC.在UCI机器学习数据库的基准数据集上的实验表明,VeEPRC不仅对稀有类具有较高的召回率和精度,而且具有较高的分类准确率.  相似文献   

2.
显露模式(EP)是支持度从一个数据集到另一个数据集显著提高的项集. EP具有很强的区分能力,可以建立很好的分类器.提出了一种通过Boosting改进基于EP的分类器的算法BoostEP. BoostEP使用Boosting技术建立多个基于EP的基分类器形成组合分类器,并对每个基分类器预测加权投票得到未知样本的类标号.在UCI机器学习数据库的21个基准数据集上的实验表明,BoostEP的分类准确率足以与NB,C4.5,CBA和CAEP等优秀分类法相媲美.  相似文献   

3.
最小距离分类法和最近邻分类法是最简单、快速、有效的分类方法,但对噪声较敏感,对于训练样本很少或训练样本偏离类中心较远时,分类效果较差。针对这一问题,提出了基于均值更新(MU)的分类模型,通过不断扩大训练样本并更新均值中心来改善对测试数据的分类效果;并在此基础上提出了基于均值更新的最小距离(MU-MD)分类模型,利用MU的分类结果重新计算各类的均值,然后采用最小距离法对所有测试样本重新进行划分,以确定最终的类别归属,这样可以部分纠正MU分类过程中的错分,进一步提高分类效果。  相似文献   

4.
程玉胜  梁辉  王一宾  黎康 《计算机应用》2016,36(11):2963-2968
传统的文本分类多以空间向量模型为基础,采用层次分类树模型进行统计分析,该模型多数没有结合特征项语义信息,因此可能产生大量频繁语义模式,增加了分类路径。结合基本显露模式(eEP)在分类上的良好区分特性和基于最小期望风险代价的决策粗糙集模型,提出了一种阈值优化的文本语义分类算法TSCTO:在获取文档特征项频率分布表之后,首先利用粗糙集联合决策分布密度矩阵,计算最小阈值,提取满足一定阈值的高频词;然后结合语义分析与逆向文档频率方法获取基于语义类内文档频率的高频词;采用eEP分类方法获得最简模式;最后利用相似性公式和《知网》提供的语义相关度,计算文本相似性得分,利用三支决策理论对阈值进行选择。实验结果表明,TSCTO算法在文本分类的性能上有一定提升。  相似文献   

5.
基于组件技术的应用开发(CBD)可以有效地减少开发成本和复杂性,并可以很大程度地缩短开发周期,提高软件质量。其中一个关键的问题就是如何能使重用者能够在因特网上准确、快速地查找到适用的组件;而这取决于科学的分类方法对各种各样的组件进行分类和管理,以及高效准确的搜索查找方法。文章对传统的分面分类法(Facetedclassification)进行了修改和扩充,在此基础上提供了一个新的分类体系对组件库进行科学地分类和管理;同时针对组件查找问题,提出了体系分类法,并实现了一个基于此分类法的用于软件组件的专门搜索引擎。  相似文献   

6.
近年来,数据流挖掘已成为知识发现领域中的一个研究热点.数据流中数据的无限性和概念漂移等特征使得传统的分类算法不能很好地适用于数据流环境.提出了一种基于eEP的分类器集成算法CEEPCE(classification by eEP-based classifiers ensemble)对数据流进行分类.CEEPCE使用eEP建立基分类器,当新数据块流入时训练新的分类器,并调整集成分类器中的基分类器.依据基分类器在新流入数据上的分类误差对其进行加权,集成权重最高的若干个基分类器来分类未来数据.实验表明,与单分类器相比,CEEPCE具有更好的分类准确率,并足以与以C4.5为基分类器的集成方法相媲美.  相似文献   

7.
为了降低入侵检测系统的误报率和漏报率,我们将两阶段分类算法(Classification of Essential Emerging Pattern in Two Phases)CEEPTP应用到入侵检测中。该算法结合两阶段思想和基本显露模式eEP在分类方面的优势,使用两个阶段挖掘eEP并用于分类,分类时考虑第二阶段对第一阶段的修正作用,实验表明具有较好的分类结果。  相似文献   

8.
一种协调的科技文献分类方法   总被引:1,自引:0,他引:1  
科技文献之间的相互引证关系反映了一种科学交流活动,显示了科学文献之间(甚至是学科之间)的内在联系,而通过追溯文献之间的这种关系,可以改善和提高传统的基于内容的科技文献的分类的方法。论文利用有相互引证关系,有同引关系,以及有耦合关系的两篇文献一般是属于同一类的这一特点,提出了文献之间的引用相似度,同引相似度,耦合相似度这三个概念,再利用这三个概念生成了文献之间的“结构相似度”,并将它用于K-NN分类法中得出一种基于结构的分类法。最后,论文将这种基于结构的分类法和基于内容的NaveBayes分类法结合起来提出了一种新的协调分类法。  相似文献   

9.
基于MNF和SVM的高光谱遥感影像分类研究   总被引:3,自引:0,他引:3  
通过分析高光谱遥感影像分类的现状及遇到的困难,以OMIS1高光谱数据为实验数据,提出了基于最小噪声分离(Minimum Noise Fraction-MNF)变换和支持向量机(Support Vector Machine-SVM)的高光谱遥感影像分类方法。分类实验结果表明:与传统的最大似然分类法(Maxi mum Likelihood Classification-MLC)比较,该方法克服了Hughes现象,分类速度得以提高,总体分类精度达到94.85%,从而表明了该方法用于高光谱遥感影像分类的实用性和优越性。  相似文献   

10.
专利和期刊隶属于不同的知识组织体系,要实现专利与期刊文献的交叉浏览和检索必须解决两种分类法(中国图书馆分类法(CLC)和国际专利分类法(IPC))之间的映射问题。在调研现有分类法类目映射方法的基础上,讨论了基于机器学习实现中国图书馆分类法和国际专利分类法之间类目映射的方法。通过对中图法某个类目标识的语料进行训练得到该类目的分类器,然后用其对国际专利分类法标识的语料进行分类,对分类结果进行分析得出类目间的映射关系。对比实验证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号