共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
3.
4.
在简要介绍系统构成的基础上,重点阐述了手写汉字切分、特征选择与提取、分类器设计及后处理,并探讨了今后的主要研究路线。 相似文献
6.
针对脱机手写体汉字特点,给出一种采用模糊支持向量机粗分类的方法。根据小波分解像素密度特征,利用模糊支持向量机对汉字进行粗分类。细分类识别提取外围特征,同时融合小波多网格特征,采用一对多算法进行细识别。仿真实验表明,该方法有较高识别率。 相似文献
7.
《图象识别与自动化》2010,(1):34-37
一、汉字识别
汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的贡献,并将继续发挥重要的、与其它文字形式难以取代的作用。然而,汉字是非字母化、非拼音化的文字, 相似文献
8.
以HCL2000手写汉字库为基础,构建了一个实验系统,对一级汉字库3 755个汉字,使用不同的汉字特征和不同的分类距离,进行了一系列比较实验,探讨了大字符集脱机手写体汉字识别的粗分类问题,得到了一些有用的结论. 相似文献
9.
10.
11.
本文通过分析传统汉字的结构模型所具有的优缺点,提出了建立脱机手写汉字统计模型的理论框架;并利用PCA技术发现大量数据规律性的能力,提出了一种基于PCA技术的脱机手写汉字的统计模型.与传统的结构模型相比,该模型避免了目前还无法解决的准确抽取结构基元的困难,通过以容易抽取的可重构的统计特征作为统计基元,并通过对统计基元变化的整体描述或者说对统计基元相互之间关系的描述,较好地建立了脱机手写汉字的统计模型.根据该模型得到的一些实验结果充分说明了其描述脱机手写汉字的有效性. 相似文献
12.
离线手写汉字的识别仍然是模式识别中的一个最困难的问题,而特征提取是解决这个问题的关键.本文提出一种基于多尺度小波分解的离线手写汉字的特征提取方法.通过表示为灰度图像的手写汉字的多尺度小波分解,能在不同尺度下抽取字符的特征.在较大的尺度下,抽取字符少量的结构特征,可用于在巨大的汉字候选类集合中进行字符的粗归类;在较小的尺度下,抽取字符的细节特征,可用于在较小的汉字候选类集合中进行字符的细归类(识别).这样一种从粗到细的策略,既减少了匹配的时间,又保持了识别的精度. 相似文献
13.
在模式识别统一信息熵理论的基础上,提出基于信息熵的模式特征选择方法。给出在不同情况下,特征选择条件的具体数学表达式,定义特征性能因子来体现某一个特征对模式类别的表征能力和对不同模式类别的区分能力。将提出的特征选择方法应用于静态手写汉字签名特征描述中,利用描述一个签名时不同特征所表现出来的权重值构成该签名的特征掩膜矩阵。对矩阵中的元素进行处理,获得不同书写者签名之间的整体差异度以及在某一具体特征上所表现出来的差异,从而确立一种静态手写汉字签名特征描述及相似度判定的方法,并通过仿真验证了算法的可行性和有效性。 相似文献
14.
介绍中文文本分类的流程及相关技术。在分析传统的文本特征选择不足的基础上,提出了基于粗糙集与集成学习结合的文本分类方法,通过粗糙集进行文本的特征选择,采用一种集成学习算法AdaBoost.M1来提高弱分类器的分类性能,对中文文本进行分类。实验证明,这种算法分类结果的F1值比C4.5、kNN分类器都高,具有更加优良的分类性能。 相似文献
15.
基于汉字原型的手写汉字识别 总被引:7,自引:1,他引:6
姜珊 《计算机研究与发展》1996,33(8):634-640
本文以现存三种汉字的计算机表示和两种传统的汉字结构分析方法进行评述,应用拓扑和几何的基本原理,分析了汉字结构及其制约关系,确定了四类组成汉字的基本关系,在此基础上实现了汉字原型,最后给出了汉字原型应用手写汉字识别的实例。 相似文献
16.
从计算机软件理论中的面向对象思想出发,分析汉字的抽象性、封装性、继承性、多态性等性质,提出汉字是一种面向对象的文字,并给出了解决汉字总量无限增长危机的方法。 相似文献
17.
针对传统的特征选择使用阈值过滤导致有效信息丢失的问题,提出一种粗糙集的文本特征选择方法。该方法以核为起点利用特征属性的重要性和依赖性作为启发式信息进行特征选择,使文本的特征维数得到一定程度的降低。实验表明,此算法不仅易于实现而且能够有效降低特征数目,提高分类效率。 相似文献
18.
提出一种计算机系统字库中没有的集外字输入和显示的方法,以解决汉语言文字信息化发展的需要。该方法首先对一些字形进行矢量描述生成动态描述库,在集外字的输入过程中以动态描述库为桥梁,通过对动态描述库的操作,用户可以按照自己的意愿来设计和输出各种汉字,包括古文字、异体字,和错别字以及合体字等。该方法还有效地解决了由于使用轮廓字形描述而存在的字形动态编辑和字形变换的困难。 相似文献
19.
20.
一种识别手写汉字的多分类器集成方法 总被引:6,自引:0,他引:6
根据多信源信息处理与字符识别的经验知识,提出了一个识别手写汉字的多分类器线性集成模型.这个模型不仅考虑到不同的分类器对不同字符识别能力的不同,而且还考虑了不同的分类器得出的输入字符与参考模板之间相似度的实际大小对判决的影响,及不同分类器提供的候选字符对判决的支持作用,更重要的是提供了一种通过监督学习,利用计算机程序自动计算模型参数的方法,因而实现了一个较好的集成系统.同时,本文还提供了三个用于集成的分类器,它们集成的结果充分显示了本方法的有效性。 相似文献