首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文为手写印刷体汉字分类提供了一种新的实用解决方法。本方法采用日本山本氏提出的用松驰匹配方法识别手写印刷体汉字的基本思想。给出了用汉字轮廓点的差分作为轮廓跟踪及折断点选择的算法,提高了轮廓折线化速度;分类是按汉字四周的外轮廓线分二级进行匹配的,提出了动态有序弹性匹配方法,使全域松弛匹配得以在局部区域进行,从而有效地提高了匹配速度;在进行第一级粗分类时,采用多个模板,有效地提高了按偏旁位置分布进行分类的正确率;最后利用内轮廓折线与字典逐字匹配,达到手写印刷体汉字识别的目的。本识别系统在386微机上用C语言编程实现,对国标一级3755个汉字进行了三万余字的识别试验,前十位的累计正确分类率达92%,第一位的累计正确分类率达84%。识别时间为每字1.8秒。  相似文献   

2.
本文讲述了一种将点阵汉字转换成轮廓汉字的方法及这种方法中使用的一些技术问题,并对编制的程序流程及使用方法作了说明,最后以3D Studio(3DS)软件为例讲述轮廓汉字在图形软件中的使用方法。  相似文献   

3.
本文进述了一种将点阵汉字转换成轮廓汉字的方法及这种方法中使用的一些技术问题,并对编制的程序流程及使用方法作了说明,最后以3DStudio(3DS)软件为例讲述轮廓汉字在图形软件中的使用方法。  相似文献   

4.
基于结构特征的汉字识别   总被引:2,自引:0,他引:2  
提出一种基于文字结构特征的神经网络手写汉字识别策略,根据所提取的文字笔画方向、基本轮廓和交叉点等特征,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别。该方法提取的笔画轮廓十分准确有效,对手写汉字的约束少,可识别的汉字数量大,在仿真实验中有效地识别了绝大多数手写汉字。  相似文献   

5.
特征融合用于手写体汉字识别研究   总被引:2,自引:0,他引:2  
分析了手写汉字特征的提取方法,提取具有一定互补性的轮廓方向特征和方向距离分布特征,并进行K-L变换降维处理,用多特征合成一个区分能力更强的新特征.讨论了RBF网络分类器特性,结合特征融合方法和模块RBF神经网络结构有机地构建一个小类别手写体汉字识别系统.实验表明,该系统可行和有效.  相似文献   

6.
笔划、部首、汉字是构成汉字的三级数据结构。本文介绍了一种利用曲线轮廓描述汉字字体的方法,即用三次Bezier曲线拟合笔划,由笔划构成部首,再由部首来构成汉字。并给出了用C语言描述的笔划、部首、汉字的数据结构以及Bezier曲线的采样点选取的算法。本文还给出了局部坐标和绝对坐标相互转换的方法。  相似文献   

7.
分析了手写汉字特征的提取方法,提取具有一定互补性的轮廓方向特征和方向距离分布特征,并进行K-L变换降维处理,用多特征合成一个区分能力更强的新特点。讨论了RBF网络分类器特性,结合特征融合方法和模块RBF神经网络结构有机地构建一个小类别手写体汉字识别系统。实验表明,该系统可行和有效。  相似文献   

8.
本文提出两种汉字预分类算法:四象限相对转动惯量法、投影轮廓的walsh特征法.并以之建立了一个实验系统,取得了满意的结果.  相似文献   

9.
本文提出两种汉字预分类算法:四象限相对转动惯量法、投影轮廓的Walsh特征法.并以之建立了一个实验系统,取得了满意的结果.  相似文献   

10.
Windows系统采用轮廓字形技术来生成字库 ,OpenGL是强大的图形生成工具。本文作者系统地探讨了如何使用OpenGL处理Windows字体的方法 ,用简单的方式实现了汉字生成 ,并以实例予以说明  相似文献   

11.
最大概率分词问题及其解法   总被引:10,自引:0,他引:10  
提出了一种新的汉族自动分词算法,该算法运用人工智能中的问题求解技术,先将汉族句子的切分问题归约为若干字段的切分问题,再用启发式状态空间搜索技术将每个字段分别转换为概率最大的词序列。  相似文献   

12.
基于可拓学理论的汉语词义消歧   总被引:1,自引:0,他引:1  
卢志茂  刘挺  李生 《哈尔滨工业大学学报》2006,38(12):2026-2029,2035
应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词义消歧知识的难题.实验证明,该方法用于汉语的词义消歧切实可行,平均正确率达到90.16%.  相似文献   

13.
近年来基于字的词位标注方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,基于字的词位标注汉语分词方法逐渐成为汉语分词的主要技术路线。该方法中特征模板选择至关重要,采用四词位标注集,使用条件随机场模型进一步研究基于字的词位标注汉语分词技术,在第三届和第四届国际汉语分词评测Bakeoff语料上进行封闭测试,并对比了不同特征模板集对分词性能的影响。实验表明采用的特征模板集:TMPT-10′较传统的特征模板集分词性能更好。  相似文献   

14.
给出了一个词库维护及检索系统,它采用基于PATRICIA tree的分词词典机制及灵活的词库维护及检索方法,不仅适用于传统的机械切分,更适合于串行和并行全切分.该词库系统已在一个全切分系统应用.  相似文献   

15.
改革开放以来,中西文化交流更加频繁,语言接触作为一种“催化剂”使我国的语言文字发生了多方面的变化,其中商标词也在悄悄发生着改变:从过去的汉语拼音商标词改进为正规的英语商标词;从过去的专有名词、普通名词商标词扩大到臆造词汇商标词。本文试图从社会语言学的角度对我国商标词的“欧化”现象进行初步探讨。  相似文献   

16.
通过一个简单的程序,把计算机中的英、汉字符集按内码编排为一个总字表.并可以计算出某一指定的档案中出现的英、汉字元的字频.这些信息的取得,对计算机信息处理都有重要的帮助.  相似文献   

17.
基于多特征的自适应新词识别   总被引:4,自引:0,他引:4  
为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统辅助的边界确认信息等,并直接从被抽取文本中自动训练识別模型.同时,新词识别过程在字串PAT-Array数据结构上进行,可以抽取任意长度的新词语.实验结果表明,该方法新词发现速度快、节省存储空间.  相似文献   

18.
汉语数字词初探   总被引:1,自引:0,他引:1  
数字词是由汉字中的数字直接组合而构成的词,它们或者不再表示数目,或者除了曲折地表示数目之外还有其他的意义,因此与直接、纯粹表示数目的数词有别。从《汉语大词典》及《现代汉语词典》所收录的数字词来看,数字词以双音节词为主,单义词、多义词在数量上基本持平。在内部构造上,数字词以联合型复合词居多,重叠式较少,派生词极少。数字词词义往往具有较强的理据性。  相似文献   

19.
提出了一个改进的书面汉语全切分算法,它通过确保每次切分位置的唯一性,克服了全切分中普遍存在的重复切分。实验证明,改进后的全切分算法效率平均提高80%以上。  相似文献   

20.
也谈字母词的使用   总被引:2,自引:0,他引:2  
作者举例说明目前字母词所带来的诸多危害,提出应对字母词进行规范化管理,字母词的使用不仅要看对象,而且要看场合。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号