首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
对支持向量机的多类分类问题进行研究,提出了一种基于核聚类的多类分类方法。利用核聚类方法将原始样本特征映射到高维特征进行聚类分组,对每一组使用一个支持向量机二值分类器进行分类,并用这些二值分类器组成决策树的节点,构成了一个决策分类树。给出决策树的生成算法,提出了利用交叠系数来控制交叠,从而克服错分积累,提高分类准确率。实验结果表明,采用该方法,手写体汉字识别速度和正确率都达到了实用的要求。  相似文献   

2.
手写混合字符集识别的多特征多级分类器设计   总被引:1,自引:0,他引:1  
吴丽芸  王文伟  张平  陈俊 《计算机应用》2005,25(12):2948-2950
针对常用的银行汉字和阿拉伯数字混合字符集的识别,提出了依据不同的分类要求,分别选取不同的分类特征,并采用先聚类再用多层感知器(MLP)神经网络分类的多级分类器进行识别的设计方法。实验结果表明,该方法用于手写体混合字符集的识别是行之有效的。  相似文献   

3.
结合距离分类器的神经网络手写体汉字识别   总被引:1,自引:1,他引:1  
手写体汉字识别技术中如何解决复杂的大类别识别问题,是汉字识别中的一个难点。该文介绍了基于笔划的手写体汉字特征抽取方法,提出了一种基于预分类的神经网络汉字识别方法,该方法用一个传统的距离分类器先对汉字进行预分类,神经网络根据预分类结果进行有选择的训练和识别,能有效解决神经网络大类别模式识别中的训练和分类问题,学习时间很短,识别效果较理想。  相似文献   

4.
在给定概率分布条件下对贝叶斯分类器进行改进,提出一种基于数据库的小本征值阈值重置的贝叶斯分类器。用一个阈值替代类协方差矩阵小于阈值的本征值,使给定数据库的分类错误率最小,是一种优于零子空间法的分类方法。通过在MNIST 6×104个手写体数字数据库的测试,识别率大于96%。对小字集手写体汉字进行的实验表明,识别率大于99%。  相似文献   

5.
手写体字符识别的多特征多分类器设计   总被引:4,自引:0,他引:4  
特征选取和分类器设计是字符识别系统设计的关键。文章针对手写体汉字和阿拉伯数字混和字符集的识别提出了依据不同的分类要求,分别选取不同的字符特征并采用神经网络多分类器进行识别的设计方法。实验结果表明,该方法用于手写体混合字符集的识别是行之有效的。  相似文献   

6.
SVM多值分类器在脱机手写体相似汉字识别中的应用   总被引:7,自引:0,他引:7  
相似字的普遍存在是影响脱机手写体汉字识别率低的主要原因之一。论文研究了支持向量机(SVM)多值分类器在手写相似汉字识别中的应用,所提出的方法采用了小波弹性网格技术提取汉字的特征,通过实验比较了三种不同的SVM分类器组合策略的分类效果。  相似文献   

7.
多分类器组合研究   总被引:2,自引:0,他引:2  
文章提出了一种多分类器的组合方法,它利用了参与组合的分类器提供的度量层次上的两类信息:对训练样本的决策信息;对待识样本的决策信息。首先对这两类信息进行集成,进而给出了组合分类器的判定规则。用该方法对手写体汉字作分类识别,实验结果显示,较之其它几种方法,它有更高的正确识别率。  相似文献   

8.
决策树支持向量机多分类器设计的向量投影法   总被引:2,自引:1,他引:1  
针对如何有效地设计决策树支持向量机(SVM)多类分类器的层次结构这个关键问题,提出一种基于向量投影的类间可分性测度的设计方法,并给出一种基于该类间可分性测度设计决策树SVM多分类器层次结构的方法.为加快每个SVM子分类器的训练速度且保持其高推广性,将基于向量投影的支持向量预选取方法用于每个子分类器的训练中.通过对3个大规模数据集和手写体数字识别的仿真实验表明,新方法能有效地提高决策树SVM多类分类器的分类精度和速度.  相似文献   

9.
本文提出一种基于小波包分解的手写体金融汉字识别算法。该算法首先对汉字图像进行小波包分解,利用基于节点子图像能量方差的准则选择适当的部分分解树;然后,将得到的子图像划分成多个局部窗口,计算局部窗口的能量值组成特征向量;再通过主成分分析(PCA)选择分类能力最强的一组特征,降低特征空间的维数;最后,用SVM多类分类方法进行分类判决。实验结果表明,该算法取得了较好的识别效果。  相似文献   

10.
模糊多分类器组合   总被引:4,自引:0,他引:4  
本文提出了一种多分类器的模糊组合方法,它利用了参与组合的分类器提供的两类信息:(1)在度量层次上,对未知模式的分类信息,(2)在符号层次上,训练样本的错分类分布信息.对参与组合的分类器提供的这两类信息进行模糊集成,组合分类器输出未知模式来自各类别的可能性度量.用该方法对手写体汉字作分类识别,实验结果显示,较之其它几种方法,它有更高的可靠性.  相似文献   

11.
Based on a recursive process of reducing the entropy, the general decision tree classifier with overlap has been analyzed. Several theorems have been proposed and proved. When the number of pattern classes is very large, the theorems can reveal both the advantages of a tree classifier and the main difficulties in its implementation. Suppose H is Shannon's entropy measure of the given problem. The theoretical results indicate that the tree searching time can be minimized to the order O(H), but the error rate is also in the same order O(H) due to error accumulation. However, the memory requirement is in the order 0(H exp(H)) which poses serious problems in the implementation of a tree classifier for a large number of classes. To solve these problems, several theorems related to the bounds on the search time, error rate, memory requirement and overlap factor in the design of a decision tree have been proposed and some principles have been established to analyze the behaviors of the decision tree. When applied to classify sets of 64, 450, and 3200 Chinese characters, respectively, the experimental results support the theoretical predictions. For 3200 classes, a very high recognition rate of 99.88 percent was achieved at a high speed of 873 samples/s when the experiment was conducted on a Cyber 172 computer using a high-level language.  相似文献   

12.
余敦辉  张笑笑  付聪  张万山 《计算机应用研究》2020,37(5):1395-1399,1405
针对网络中敏感词变形体识别效率不高的问题,提出了基于决策树的敏感词变形体识别算法。首先,通过分析汉字的结构和读音等特征,研究敏感词及变形体;其次,基于敏感词库构建敏感词决策树;最后,通过多因子改进模型,对微博等新媒体的文本敏感程度进行计算。实验结果表明,该算法在识别中文敏感词及变形体时,查全率和查准率最高分别可达95%和94%,与基于确定有穷自动机的改进算法相比,查全率和查准率分别提高了19.8%和21.1%;与敏感信息决策树信息过滤算法相比,查全率和查准率分别提高17.9%和18.1% 。通过分析,该算法对敏感词变形体的识别和自动过滤是有效的。  相似文献   

13.
A multistage classifier with general tree structure has been developed to recognize a large number of Chinese characters. A simple and efficient method of classifying the characters was achieved by choosing the best feature at each stage of the tree. The features used are Walsh coefficients obtained from two profiles of a character projected onto the X-Y orthogonal axes. Some algorithms for aligning the characters were compared and one of them was adopted in this recognition scheme. A high recognition rate of about 99.5 percent was obtained in an experiment with more than 3000 different Chinese characters.  相似文献   

14.
基于标点符号分割的汉语句法分析算法   总被引:6,自引:0,他引:6  
目前大部分句法解析器都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出单独解析块的概念,并且根据标点符号在句子中的特有特征和位置关系,给出了基于决策树算法(Id3)单独解析块识别方法,将标点融入汉语句法分析中。本文所用的实验数据(包括训练集和测试集)均来自中文宾州树库5.0。对句长大于40个词的汉语长句单独进行了实验,句法分析精度和召回率分别提高1.59%和0.93%,同时时间开销降低了近2/3。实验结果表明,标点对汉语长句句法分析非常有利, 系统性能获得了较大提高。  相似文献   

15.
In this paper, an off-line recognition system based on multifeature and multilevel classification is presented for handwritten Chinese characters. Ten classes of multifeatures, such as peripheral shape features, stroke density features, and stroke direction features, are used in this system. The multilevel classification scheme consists of a group classifier and a five-level character classifier, where two new technologies, overlap clustering and Gaussian distribution selector are developed. Experiments have been conducted to recognize 5,401 daily-used Chinese characters. The recognition rate is about 90 percent for a unique candidate, and 98 percent for multichoice with 10 candidates  相似文献   

16.
基于决策分类熵的决策树构造算法及应用   总被引:1,自引:0,他引:1  
董广  王兴起 《计算机应用》2009,29(11):3103-3106
为了更好地完成金融数据集上的分类挖掘任务,以粗糙集理论为基础提出决策分类熵的概念,进而以属性的决策分类熵为属性分裂度量提出基于决策分类熵的决策树构造算法,并针对过拟合问题提出一种抑制参数来实现树规模的良好控制。实例分析及金融数据集上的实验表明:相比经典的C4.5决策树算法,新算法能够较好地克服其缺点和不足,构建更优的决策树,能够更好地完成分类任务。  相似文献   

17.
杨静  张楠男  李建  刘延明  梁美红 《微机发展》2010,(2):114-116,120
主要研究了数据挖掘中决策树算法的基本思想和算法。针对目前钻井过程故障诊断的需求,结合决策树算法的特点,提出了一种基于决策树的钻井过程故障诊断专家系统模型。分析了钻井系统事故状态下的相关特征参数,并对基于决策树的钻井过程状态和知识获取进行了详细的论述。通过实例运用ID3算法实现了决策树的建立,为钻井过程故障诊断奠定了坚实的基础。最后提出了对算法的改进,综合对实际数据的处理结果表明,基于数据挖掘的决策树算法可以很好地识别钻井过程中的不同状态,能够实现故障诊断。  相似文献   

18.
ATM的应用日益广泛,如何部署一个利用率高的ATM已成为一个值得探讨的问题。运用数据挖掘知识和决策树ID3算法,可以对已经部署ATM的地区进行分析,从而找出高利用率ATM地区的特征,并建立ATM选点模型,作为金融机构在何处部署高效的ATM的参考。  相似文献   

19.
Determining the firm performance using a set of financial measures/ratios has been an interesting and challenging problem for many researchers and practitioners. Identification of factors (i.e., financial measures/ratios) that can accurately predict the firm performance is of great interest to any decision maker. In this study, we employed a two-step analysis methodology: first, using exploratory factor analysis (EFA) we identified (and validated) underlying dimensions of the financial ratios, followed by using predictive modeling methods to discover the potential relationships between the firm performance and financial ratios. Four popular decision tree algorithms (CHAID, C5.0, QUEST and C&RT) were used to investigate the impact of financial ratios on firm performance. After developing prediction models, information fusion-based sensitivity analyses were performed to measure the relative importance of independent variables. The results showed the CHAID and C5.0 decision tree algorithms produced the best prediction accuracy. Sensitivity analysis results indicated that Earnings Before Tax-to-Equity Ratio and Net Profit Margin are the two most important variables.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号