首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
一种基于粒子群算法的分类器设计   总被引:7,自引:2,他引:7  
将粒子群算法应用于数据分类,给出了适用于粒子群算法的分类规则编码,构造了新的分类规则适应度函数来更准确的提取规则集,并通过修改粒子位置更新方程使粒子群算法适于解决分类规则挖掘问题,进而实现了基于粒子群算法的分类器设计。该文进一步用UCI基准数据集对作者提出的粒子群分类器进行了测试,并将几种不同速度与位置更新策略的粒子群算法分类器与遗传算法分类器进行对比,实验结果表明,这种粒子群分类器是一种有效、可行的分类器设计方案。  相似文献   

2.
该文提出一种基于语言知识评价的分类器集成方法,利用自动获得的搭配资源和人工评价规则,融合了基于支持向量机的最长名词短语识别结果和基于条件随机场的归约识别结果,进一步基于确定性规则有针对性地识别了分类器易出错的特殊结构,提高了对连续动词介词和连续名词造成的边界歧义的识别能力。实验取得了89.30%的正确率和89.62%的召回率,多词结构F1值较归约方法提高了0.75%。  相似文献   

3.
在分类器链方法中, 如何确定标签学习次序至关重要, 为此, 提出一种基于关联规则和拓扑序列的分类器链方法(TSECC). 首先结合频繁模式设计了一种基于强关联规则的标签依赖度量策略; 接下来通过标签间依赖关系构建有向无环图, 对图中所有顶点进行拓扑排序; 最后将得到的拓扑序列作为分类器链方法中标签的学习次序, 对每个标签的分类器依次迭代更新. 特别地, 为减少无标签依赖或标签依赖度较低的“孤独”标签对其余标签预测性能的影响, 将“孤独”标签排在拓扑序列之外, 利用二元关联模型训练. 在多种公共多标签数据集上的实验结果表明, TSECC能够有效提升分类性能.  相似文献   

4.
介绍了一种基于动态聚类的模糊分类规则的生成方法,这种方法能决定规则数目,隶属函数的位置及形状.首先,介绍了基于超圆雏体隶属函数的模糊分类规则的基本形式;然后,介绍动态聚类算法,该算法能将每一类训练模式动态的分为成簇,对于每簇,则建立一个模糊规则;通过调整隶属函数的斜度,来提高对训练模式分类识别率,达到对模糊分类规则进行优化调整的目的;用两个典型的数据集评测了这篇文章研究的方法,这种方法构成的分类系统在识别率与多层神经网络分类器相当,但训练时间远少于多层神经网络分类器的训练时间.  相似文献   

5.
目前常见的最近邻分类规则约减算法,只注重约减后分类器的分类精度和被约减的规则数量,而不注重约减效率和约减后分类器的泛化能力。针对该问题,提出了一种细胞自动机(cellular automata,CA)基础上的最近邻分类规则约减方法。该方法只保留不同类边界上的样本点,约减规则的数量可以由细胞自动机网格的粒度动态调节。其优势在于:在给定的大数据集前提下,可以利用较少的运行时间来约减给定的规则样本;可以利用积累或迭代的方式来分步获得原给定样本集的一致性子集。采用13个不同的数据集进行仿真实验,结果显示该算法简单、有效,较好地解决了大样本集的约减问题。  相似文献   

6.
多分类器组合是提高识别效果的一条有效途径。文中提出一种用于多分类器组合的改进贝叶斯规则,即首先通过对大量样本的统计获得有关每个分类器识别性能的先验知识,将其作为多分类器组合的依据。组合时对每个类设置不同的阈值,使组合效果得以改善,这些阈值可以通过训练获得。在数字识别中的应用结果表明,改进的贝叶斯规则可以使多分类器的组合结果识别率和置信度得到明显提高。  相似文献   

7.
介绍了一种进化式模糊分类系统.首先,介绍系统的基本特征及结构框架.然后,介绍了一种动态聚类算法,并运用动态聚类算法对输入的训练模式进行动态聚类,每一簇创建一条模糊规则.规则所对应的区域为类椭圆形区域.规则调整的策略是连续改变模糊分类规则的一个参数,使得分类系统对训练模式识别率不能再提高,对不能达到要求的调整,采用遗传算法进行调整.分析了规则调整的方法,给出了调整算法,也介绍了规则的插入和聚合策略.用两个典型的数据集来评测研究的系统,研究的分类系统在识别率与多层神经网络分类器相当,但训练时间远少于多层神经网络分类器的训练时间.  相似文献   

8.
混合的汉语基本名词短语识别方法   总被引:3,自引:2,他引:1       下载免费PDF全文
提出一种混合的汉语基本名词短语(BaseNP)识别模型,包括采用语法规则、统计方法和组合分类器方法。利用BaseNP词的信息、词性信息及上下文句法信息,构建组合分类器,提高判断的准确性。在中文树库(CTB5.0)上进行实验,F值达到了90.09%,证明该方法能有效地识别BaseNP。  相似文献   

9.
近年来规则引擎的研究取得了丰硕的成果,将其成果应用到各个方面为汉语复句处理带来了全新的思路与途径。将规则引擎用于复句关系词自动标识中,设计了规则引擎的结构,提出了关系搭配集的模式匹配策略、消除冲突规则的"消除包含最大化策略"以及最终结果集的"正覆盖"策略。在规则引擎中,3种策略的应用提高了复句关系词识别的效率与准确率。  相似文献   

10.
梁小寒  陈慧萍 《计算机工程与设计》2011,32(4):1319-1321,1325
为得到更高的分类精度和效率,提出了基于一个新的类的关联分类算法CACA(a new class based associative classifica-tion approach)。该方法使用基于策略的类来削减频繁模式的搜索空间;设计一个OR-Tree(ordered rule-tree)的有序规则树来存储规则和他们的信息并且重新定义一个紧凑集,以便构造的分类器也是紧凑唯一的;同步规则的生成和分类器的构造以缩小规则的挖掘空间以便加快规则的生成。实验结果表明,CACA算法在关联分类方法中具有更高的准确度和效率。  相似文献   

11.
基于概率测度的数据挖掘扩展模型研究   总被引:1,自引:1,他引:0       下载免费PDF全文
为了得到数据挖掘过程中分类规则的统计特征,论文提出了一种挖掘概率规则的新方法。首先在经典粗糙集概念的基础上分析概率规则的分类,并将其推广到不确定系统的集合等价关系中,即用条件概率的形式表示研究集合的上下近似空间;然后根据概率规则的测度从条件概率的角度利用条件属性的逼近精度的相关参数进行属性集的约简进而提取分类规则;最后给出了相关的仿真实验结果,结果表明带有概率测度的分类规则更合理。  相似文献   

12.
Functional data analysis is an active field of research in Statistics. This Special Issue on Statistics for Functional Data contains a selected set of contributions which covers a scope, as wide as possible, of this many-facetted discipline. The diversity of this field of statistics is highlighted by the wide scope of methodological problems discussed in this special issue. Also, the large set of applied scientific disciplines concerned with functional data appears through the numerous curves data set analyzed in these contributions. This introductory paper presents these contributions by emphasizing on how they are taking place in the actual development of statistical methods for analyzing functional data. A special, but not exclusive, place is given to the three more current kinds of problems: factorial analysis of functional data, regression with functional variables and curves classification. The links between functional data analysis and nonparametric statistics deserve a special attention.  相似文献   

13.
The k-nearest-neighbor decision rule is known to provide a useful nonparametric procedure for pattern classification. This rule is applied here to a vowel recognition problem and the effect of the number (k) of nearest neighbors, the size of the trained set and the type of the distance measure on vowel recognition performance is studied. It is shown that the vowel recognition performance remains approximately constant for all the values of k. The recognition performance initially improves with the size of the training set and then converges to an asymptotic value. Selection of a better distance measure leads to a significant improvement in vowel recognition performance.  相似文献   

14.
数据挖掘技术   总被引:13,自引:0,他引:13       下载免费PDF全文
数据挖掘技术是当前数据库和人工智能领域研究的热点课题,为了使人们对该领域现状有个概略了解,在消化大量文献资料的基础上,首先对数据挖掘技术的国内外总体研究情况进行了概略介绍,包括数据挖掘技术的产生背景、应用领域、分类及主要挖掘技术;结合作者的研究工作,对关联规则的挖掘、分类规则的挖掘、离群数据的挖掘及聚类分析作了 较详细的论述;介绍了关联规则挖掘的主要研究成果,同时指出了关联规则衡量标准的不足及其改进方法,提出了分类模式的准确度评估方法;最后,描述了数据挖掘技术在科学研究、金属投资、市场营销、保险业、制造业及通信网络管理等行业的应用情况,并对数据挖掘技术的应用前景作了展望。  相似文献   

15.
Density-based multiscale data condensation   总被引:10,自引:0,他引:10  
A problem gaining interest in pattern recognition applied to data mining is that of selecting a small representative subset from a very large data set. In this article, a nonparametric data reduction scheme is suggested. It attempts to represent the density underlying the data. The algorithm selects representative points in a multiscale fashion which is novel from existing density-based approaches. The accuracy of representation by the condensed set is measured in terms of the error in density estimates of the original and reduced sets. Experimental studies on several real life data sets show that the multiscale approach is superior to several related condensation methods both in terms of condensation ratio and estimation error. The condensed set obtained was also experimentally shown to be effective for some important data mining tasks like classification, clustering, and rule generation on large data sets. Moreover, it is empirically found that the algorithm is efficient in terms of sample complexity  相似文献   

16.
一种集成数据挖掘的自动视频分类方法   总被引:1,自引:0,他引:1  
针对自动视频分类工作中分类预测精度低的问题,提出了一种集成数据挖掘技术的自动视频分类方法。首先进行视频分割,形成了一个视频属性数据库;然后分别使用决策树、分类关联规则等技术对视频属性数据库进行数据挖掘,提取出决策树分类规则集和分类关联规则集;最后利用一个规则集的合并裁减算法来合并这两个分类预测规则集,形成最终的具有更高精度的视频分类规则集。通过实验验证了决策树分类预测规则和分类关联规则具有分类预测的一致性;同时实验表明,使用合并后的规则集比单独使用一个规则集来预测视频具有更高的预测准确率。  相似文献   

17.
王琦  李霞 《计算机工程》2012,38(9):46-48
分析分类规则内属性之间的相关性,提出一种分类规则约简方法。针对原始训练集构造FP树,获取相应的关联规则集,对关联规则后件属性(集),采用置信度α描述该属性(集)相对于其所在分类规则的重要程度。在分类规则集中,约简α值小于阈值?的属性,从而约简分类规则长度。利用UCI机器学习及SDSS DR7数据进行实验,结果表明该方法具有较高的分类效率。  相似文献   

18.
Experimental analysis of the performance of a proposed method is a crucial and necessary task in an investigation. In this paper, we focus on the use of nonparametric statistical inference for analyzing the results obtained in an experiment design in the field of computational intelligence. We present a case study which involves a set of techniques in classification tasks and we study a set of nonparametric procedures useful to analyze the behavior of a method with respect to a set of algorithms, such as the framework in which a new proposal is developed.Particularly, we discuss some basic and advanced nonparametric approaches which improve the results offered by the Friedman test in some circumstances. A set of post hoc procedures for multiple comparisons is presented together with the computation of adjusted p-values. We also perform an experimental analysis for comparing their power, with the objective of detecting the advantages and disadvantages of the statistical tests described. We found that some aspects such as the number of algorithms, number of data sets and differences in performance offered by the control method are very influential in the statistical tests studied. Our final goal is to offer a complete guideline for the use of nonparametric statistical procedures for performing multiple comparisons in experimental studies.  相似文献   

19.
关联分类通常产生大量的分类规则,导致在分类新实例时经常产生规则冲突问题。针对这种规则冲突问题,提出了一种基于改进关联分类的两次学习框架。利用频繁且互关联的项集产生分类规则改进关联分类算法,有效减少了规则数。应用改进的关联分类算法产生的一级规则一次性分离出训练集中规则冲突的所有实例。然后,在冲突实例上应用改进的关联分类算法进行第二次学习得到二级规则。分类新实例时,首先利用第一级规则进行分类。如果出现规则冲突,则利用第二级规则分类该实例。实验结果表明,基于改进关联分类的两次学习方法降低了规则冲突比率,并且显著提高了分类准确率。  相似文献   

20.
魏立力  韩崇昭 《计算机仿真》2007,24(5):72-74,106
近年来粗糙集数据分析已经成为定性数据分析的一个常用方法,而信息系统的属性约简是粗糙集理论的一个基本问题.粗糙集方法虽然不需要数据之外的其它信息,但所得结果同时也缺乏统计证据.文中运用非参数统计的思想研究了信息系统的属性约简问题,首先将原始信息系统整理成任意两个属性子集之间的列联表,然后给出了基于卡方统计量的属性相关性的一个新度量,基于此度量给出了信息系统属性约简的新方法.数值例子说明了该方法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号