共查询到20条相似文献,搜索用时 0 毫秒
1.
快速书面汉语自动分词系统及其算法设计 总被引:11,自引:1,他引:11
本文针对机械分词,提出词典组织结构、改进的二分法检索、直接匹配算法,以及后缀分词算法。运用这些技术,正逆向切分可共用一部词典,并显著提高分词速度。 相似文献
2.
3.
针对传统的数据可信度评估模型存在分类适应性较差的问题,设计一种基于指数分层结构算法的数据可信度评估模型。分析实际数据资产管理过程,建立数据可信度评估指标体系;按照数据类型和数据间存在的周期性关系补充待评估数据中的缺漏数据,完成对待估数据的预处理;将数据归一化后生成数据集合,并根据数据间的相关系数建立亚超度量空间,生成指数分层结构树,结合层次分析法完成对可信度模型的设计。实验结果表明,与传统评估模型相比,所提模型的分类适应性更强,数据查全率更高,应用优势更明显。 相似文献
4.
针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置字体下划线以嵌入水印。水印提取时不需要原始文档和原始水印,通过块校验和海明校验可将破坏的水印比特位进行恢复。实验结果表明该算法具有较好的透明性和鲁棒性。 相似文献
5.
一种相似汉字的识别算法 总被引:7,自引:5,他引:7
本文提出了一种通用的基于部分空间方法的相似汉字识别算法, 该算法无须事先确定相似字组, 也不必人工选择各个相似字组的部分空间, 能够自动决定待识别字是否需要进入相似字识别过程, 以及怎样选择部分空间。实验结果证明了本算法的有效性。 相似文献
6.
基于汉字字型结构的文本数字水印算法 总被引:1,自引:0,他引:1
提出一种基于汉字字型结构的文本数字水印算法。它是针对语言内容本身,不受文本格式变换的影响。基于对汉字字型结构的区分,计算文本中每个句子的特征值,并把得到的二进制特征值序列与水印信息的二进制序列作比较,然后通过改变一些特征值来嵌入水印。实验表明该算法具有嵌入水印简单、隐蔽性好,并且具有很好的鲁棒性和安全性。 相似文献
7.
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。 相似文献
8.
9.
10.
以UCDOS为例简要分析了该平台下的汉字输入码反查机制,给出了以此机制为基础实现在应用程序中获取汉字输入码的方法,从而为各种可操作的输入码对照表的生成提供了方便与可能。 相似文献
11.
该文提出了一种字形相似度计算方法,旨在解决汉字中相似字形(称作形似字)的识别和查找问题.首先,提出了汉字拆分方法,并构建了偏旁部首知识图谱;然后,基于图谱和汉字的结构特点,提出2CTransE模型,学习汉字实体语义信息的表示;最后,将输出的实体向量用于汉字字形的相似度计算,得到 目标汉字的形似字候选集.实验结果表明,该... 相似文献
12.
本文针对基于手写体汉字的成绩单自动识别系统的实际需要,基于目前脱机手写体汉字识别技术的一些研究成果,提出一种新的基于聚类方法和多个分类器的线性集成的综合方法,并且采用分级判决策略,进上步降低误识率,实验结果表明,本系统具有较高的识别率和较低的误识率,并且具有较好的扩展性,具有实用的可行性。 相似文献
13.
该文从数据结构的课程特点出发,根据学生的特性和目前教学中存在的问题,分析传统教学模式的不足,给出如何实施教学过程以提高教学效果的方法。 相似文献
14.
在计算机上演示汉字的规范书写过程,是许多汉语教学软件和电子汉语词典所追求的功能。提出了一种汉字智能书写的算法。该算法通过预制作收集并保存汉字的书写过程信息,书写时根据这些信息,动态地产生起笔落笔、速度变化、语音提示等各种书写效果.文中给出的算法预制作简单、数据量极小,适合于各种多媒体汉语教学软件和电子汉语词典中使用。 相似文献
15.
This paper addresses the problems of maintaining the consistency of spatial data under recursive subdivision algorithms for artificial terrain generation. Fractal modelling techniques are outlined, with particular reference to those based on fractional Brownian motion, and included is a brief history of recursive subdivision techniques. Existing polyhedral data structures are reviewed and shown to be inadequate for maintenance of consistency as polygons are subdivided. A new edge-based data structure is presented which provides for the efficient use and consistent storage of spatial data under these conditions. The data structure is applicable to polygons of any order and allows neighbouring polygons of different order to be stored and subdivided. Artificial terrain is demonstrated from subdivision of the hexagon, of the quadrilateral and of a combination of hexagons, quadrilaterals and triangles. 相似文献
16.
17.
18.
提出一种基于混合距离树的高维书法字索引方法以加速检索.首先将n个书法字通过层次聚类聚成若干类,然后分别计算每个字对应的统一化始点距离和质心距离,最后将两者结合生成索引键值.给定一个查询字,借助混合距离树索引完成高维书法字的查询.实验证明,该方法能够取得较高的查询效率,特别适合海量书法字检索. 相似文献
19.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。 相似文献
20.
本文介绍了利用微型计界机现有输入设备书写汉字的一种学习软件之设计, 它接近真实的汉字书写练习, 有一定的应用价值。 相似文献