首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
快速书面汉语自动分词系统及其算法设计   总被引:11,自引:1,他引:11  
本文针对机械分词,提出词典组织结构、改进的二分法检索、直接匹配算法,以及后缀分词算法。运用这些技术,正逆向切分可共用一部词典,并显著提高分词速度。  相似文献   

2.
提出了一种用于机器识字的汉字容错编码方法。该编码采用统计粗分类和结构细分类相结合的方法,定义了易于机器识别的汉字结构字元集,给出了笔划字元的顺序判断规则。构建了37类子结构的编码和冗余容错编码,建立了仿人构字的汉字编码规则和字典。仿真实验表明,这种编码方法易于机器识别,具有容错性,且拒识和误识率较低。  相似文献   

3.
针对传统的数据可信度评估模型存在分类适应性较差的问题,设计一种基于指数分层结构算法的数据可信度评估模型。分析实际数据资产管理过程,建立数据可信度评估指标体系;按照数据类型和数据间存在的周期性关系补充待评估数据中的缺漏数据,完成对待估数据的预处理;将数据归一化后生成数据集合,并根据数据间的相关系数建立亚超度量空间,生成指数分层结构树,结合层次分析法完成对可信度模型的设计。实验结果表明,与传统评估模型相比,所提模型的分类适应性更强,数据查全率更高,应用优势更明显。  相似文献   

4.
针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置字体下划线以嵌入水印。水印提取时不需要原始文档和原始水印,通过块校验和海明校验可将破坏的水印比特位进行恢复。实验结果表明该算法具有较好的透明性和鲁棒性。  相似文献   

5.
一种相似汉字的识别算法   总被引:7,自引:5,他引:7  
本文提出了一种通用的基于部分空间方法的相似汉字识别算法, 该算法无须事先确定相似字组, 也不必人工选择各个相似字组的部分空间, 能够自动决定待识别字是否需要进入相似字识别过程, 以及怎样选择部分空间。实验结果证明了本算法的有效性。  相似文献   

6.
基于汉字字型结构的文本数字水印算法   总被引:1,自引:0,他引:1  
提出一种基于汉字字型结构的文本数字水印算法。它是针对语言内容本身,不受文本格式变换的影响。基于对汉字字型结构的区分,计算文本中每个句子的特征值,并把得到的二进制特征值序列与水印信息的二进制序列作比较,然后通过改变一些特征值来嵌入水印。实验表明该算法具有嵌入水印简单、隐蔽性好,并且具有很好的鲁棒性和安全性。  相似文献   

7.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。  相似文献   

8.
晋钢  王蕾  王志英 《计算机科学》2009,36(12):231-234
静态数据流图是异步电路的一种抽象模型,具有灵活性高、易于理解的优点.基于静态数据流图的一种形式化的执行语义,提出了一种适合于性能分析的静态数据流图的Petri网模型,并基于该模型提出了一种性能评价方法.该方法具有速度快、灵活性高的优点,特别适合大规模异步电路设计早期的性能分析.该模型比静态数据流图的传统Petri网模型在规模上小一倍,而且避免了引入非标准的read-arc.通过实验,该模型和性能评价方法的有效性得到了充分的验证.  相似文献   

9.
本文简述了对于不认识的汉字如何进行查询与输入,并讨论了汉字国际化的一些问题。作者对解决汉字问题作了一些初步尝试,建立了一种全新的网络在线字海,用以更方便、快捷地查询、输入不认识的汉字。  相似文献   

10.
以UCDOS为例简要分析了该平台下的汉字输入码反查机制,给出了以此机制为基础实现在应用程序中获取汉字输入码的方法,从而为各种可操作的输入码对照表的生成提供了方便与可能。  相似文献   

11.
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题.首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到 目标汉字的形似字候选集.实验结果表明,该...  相似文献   

12.
本文针对基于手写体汉字的成绩单自动识别系统的实际需要,基于目前脱机手写体汉字识别技术的一些研究成果,提出一种新的基于聚类方法和多个分类器的线性集成的综合方法,并且采用分级判决策略,进上步降低误识率,实验结果表明,本系统具有较高的识别率和较低的误识率,并且具有较好的扩展性,具有实用的可行性。  相似文献   

13.
该文从数据结构的课程特点出发,根据学生的特性和目前教学中存在的问题,分析传统教学模式的不足,给出如何实施教学过程以提高教学效果的方法。  相似文献   

14.
杨晓江 《计算机工程》2003,29(21):154-155,F003
在计算机上演示汉字的规范书写过程,是许多汉语教学软件和电子汉语词典所追求的功能。提出了一种汉字智能书写的算法。该算法通过预制作收集并保存汉字的书写过程信息,书写时根据这些信息,动态地产生起笔落笔、速度变化、语音提示等各种书写效果.文中给出的算法预制作简单、数据量极小,适合于各种多媒体汉语教学软件和电子汉语词典中使用。  相似文献   

15.
This paper addresses the problems of maintaining the consistency of spatial data under recursive subdivision algorithms for artificial terrain generation. Fractal modelling techniques are outlined, with particular reference to those based on fractional Brownian motion, and included is a brief history of recursive subdivision techniques. Existing polyhedral data structures are reviewed and shown to be inadequate for maintenance of consistency as polygons are subdivided. A new edge-based data structure is presented which provides for the efficient use and consistent storage of spatial data under these conditions. The data structure is applicable to polygons of any order and allows neighbouring polygons of different order to be stored and subdivided. Artificial terrain is demonstrated from subdivision of the hexagon, of the quadrilateral and of a combination of hexagons, quadrilaterals and triangles.  相似文献   

16.
本文提出了一种用于机器识字的汉字容错编码方法。该编码采用统计粗分类和结构细分类相结合的方法,定义了易于机器识别的汉字结构字元集,给出了笔划字元的顺序判断规则。构建了37类子结构的编码和冗余容错编码,对易重码和误码的字做了特定的区分,建立了仿人构字的汉字编码规则和字典。仿真实验表明,这种编码方法易于机器识别,具有容错性,且拒识和误识率较低。  相似文献   

17.
介绍了8051单片机与T6963C控制的液晶显示器之间的接口电路,并基于C51开发语言,系统地讨论了液晶汉字/数字混合菜单的显示方法以及数据动态更新的实现方法。该方案已获应用,实际使用效果良好。  相似文献   

18.
提出一种基于混合距离树的高维书法字索引方法以加速检索.首先将n个书法字通过层次聚类聚成若干类,然后分别计算每个字对应的统一化始点距离和质心距离,最后将两者结合生成索引键值.给定一个查询字,借助混合距离树索引完成高维书法字的查询.实验证明,该方法能够取得较高的查询效率,特别适合海量书法字检索.  相似文献   

19.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。  相似文献   

20.
本文介绍了利用微型计界机现有输入设备书写汉字的一种学习软件之设计, 它接近真实的汉字书写练习, 有一定的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号