首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在手机中实现哈萨克文手写输入是新疆地区哈萨克族用户的需求.基于手机手写屏尺寸的局限性,哈萨克文在手机上以字母为单位输入.在研究了哈萨克文字母结构特征基础上,提出将哈萨克文字符分成主体笔画与附属笔画两部份.利用字符的笔画数做第一级分类,一笔以上的字符按附件二级分类.提取字符的笔画落笔抬笔象限、笔画x方向最大穿越次数、笔画环、笔画x、y方向变化次数及落笔、抬笔走势等20个特征为特征集.通过采集当前手写输入字符的xy坐标序列,提取相应的特征组成用二进制表示的特征数据,与样本库中的样本逐个异或运算比对,取运算后1的个数最少的样本为识别样本,经进一步检验后得到识别的字符及相近的侯选字符.  相似文献   

2.
新疆是个多民族聚居的地区,但是支持哈萨克文信息处理的手机却一直都是市场的空白。通过研究哈萨克文手机输入法,哈族用户可以很方便地操作手机的方寸键盘,快速、高效地输入文本信息,实现和家人、朋友的交流与沟通;同时这对发展少数民族地区通讯和经济也有着非常重要的意义。文中结合手机中多种文字输入的基本技术和方法,对哈萨克文手机输入法进行了研究。文章首先介绍了哈萨克语言的特点、手机输入法设计中的关键技术和根据哈萨克文的特征设计的哈萨克文手机键盘,接下来研究了词频的动态调整和词库的动态更新,并给出了实现其关键模块功能的程序流程图,最终实现了支持哈文和数字混合显示的智能手机输入法。  相似文献   

3.
本文对字符编码系统的共性技术和具有代表性的实际编码系统进行了研究,并对此进行了较深入的分析.  相似文献   

4.
陈翔 《微机发展》2013,(2):237-240
随着计算机网络技术的迅速发展,数字文本的取得已经变得非常方便,因为数字文本易于复制和更改的特性,使得版权保护的问题长期阻碍着数字出版行业的发展,然而文本水印技术的出现为解决这一问题提供了可行的方法。针对中文字符的特性,给出了一种利用人眼生理特性和中文字符的书写变化的文本水印方案。通过调整中文字符偏旁部首的位置关系,结合密钥,嵌入水印信息。经过实验分析:该算法具有鲁棒性强、隐蔽性高和抗攻击性强的特点。  相似文献   

5.
介绍了使用VC++实现转换文本文件字符编码的方法,可使文本文件的字符编码在Unicode、Big5、UTF8、GBK等编码之间实现自由转换.  相似文献   

6.
语言作为交流最基本的方式,在民族的发展过程中起着举足轻重的作用.哈萨克语作为语言的一种,对哈萨克民族的发展起着其应有的作用.但是由于历史的原因,哈萨克语在世界范围内形成了基于同一语言的两种文字形式这种特殊情况.这两种文字形式分别是以阿拉伯文字母为基础的哈萨克阿拉伯文字和以斯拉夫文字母为基础的哈萨克斯拉夫文字.这种特例,为哈萨克族科学技术的发展和文化的交流带来了不便,因此开发和完善哈萨克语这两种文字形式之间的计算机转换系统具有重要意义.本文将介绍用C#编写的哈萨克语的两种文字形式间的计算机自动转换程序,采用机器翻译的方法并在Windows环境下实现哈萨克语的两种文字形式间的智能转换.  相似文献   

7.
讨论了Java语言中字符的特殊表达形式,尤其是中文信息的表达处理,阐述了字符处理的关键是要将16位Unicode字符,转换为本地下层平台,也就是运行Java虚拟处理机的平台能够理解的字符形式。  相似文献   

8.
将文本分类理论应用于哈萨克语中,给出基于支持向量机的哈萨克文文本分类系统的设计思想.从哈萨克语言学的角度对哈萨克文分析,提出哈萨克文词干提取的方法.在对支持向量机的理论分析基础上,提出主动学习算法对支持向量机进行训练,使用训练后的分类器对新的文本进行分类.实验结果表明,该方法在哈萨克文文本分类中能获得可接受的分类性能.  相似文献   

9.
语言资源库是对各种语言信息进行深入研究的重要语料基础,阐述了哈萨克文语言资源库的研究和设计思路,介绍了语言资源库系统的总体框架、基本结构、功能模块以及实现方法等若干问题.  相似文献   

10.
Java程序国际化字符处理研究   总被引:2,自引:0,他引:2  
产品的国际化,必然要求软件产品具有处理多种字符集能力;Java的跨平台特性,要求产品能在各种平台上平滑运行 (Linux、Unix、Windos、Macos等);企业级系统经常需要跨跃多种数据库(MS SQLServer、Oracle、Sybase、mySQL)等.当平台或数据库变化时,程序可能出现乱字符,使字符无法正常显示.本文从实践的角度分析了出现乱字符的原因和解决方案.  相似文献   

11.
为了解决哈萨克文字不能在浏览器上正常显示的问题,提出一种嵌入字体的技术,有效解决这个难题。  相似文献   

12.
马玉芝  李俊 《计算机应用》2006,26(1):234-0236
随着无线技术的迅猛发展,移动终端越来越成为一个必不可少的通信工具,但是因为少数民族文字在字形上的特点使得其在显示时不存在确定的码位,因此成为手机上显示少数民族文字的瓶颈,导致目前仍然没有这样的产品出现。针对这个问题,阐述基于文字体系处理结构,支持Unicode标准的少数民族文字的处理方法以及在现有的Pango布局引擎中实现对少数民族文字的支持的技术,采用一种能很好的支持少数民族文字处理需求的文字技术——Open Type较好的解决了少数民族文字在手机上的显示问题。  相似文献   

13.
在ICU中实现少数民族文字的处理   总被引:9,自引:7,他引:9  
基于ISO/IEC 10646和UNICODE国际标准,用传统的字体技术(如TrueType)来实现少数民族文字处理所面临的一个“瓶颈”问题是:“变形显现字符”不存在确定的码位。这也是多年来民文系统重复开发、互不兼容的根本原因。本文基于ICU的文字处理体系结构,阐述了完全支持Unicode标准的少数民族文字(本文主要指蒙古文字、维文、藏文等)的实现方法。文中首先介绍了少数民族文字的特点,分析其与拉丁文、汉字在计算机输入、输出过程中的不同之处,并指出少数民族文字处理的难点。其次介绍了一种能满足少数民族文字处理需求的字体技术——OpenType。最后,阐述了文字处理引擎的工作原理,以及ICU中如何实现对少数民族文字的支持。  相似文献   

14.
传统蒙古文变形显示机制研究与实现   总被引:2,自引:2,他引:2  
多年来蒙古文处理系统重复开发、互不兼容的根本原因就是没有统一的标准:编码标准不统一、字库标准不统一、输入法不统一。随着国际化、多语言化的发展,开发基于ISOPIEC 10646 和UNICODE 国际编码标准、OpenType 智能字体技术的不同语言文字处理系统已经成为趋势。本文阐述了一个蒙古文显示系统,它完全支持Unicode 标准并使用了OpenType 技术自动进行字形选型,其实现是基于QT库的,但核心实现很容易移植到Pango ,ICU 等其他复杂文本布局(CTL) 处理项目中。  相似文献   

15.
哈萨克语的词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础。在传统的HMM的基础上改进了HMM模型参数的计算、数据平滑以及未登录词的处理方法,使之更好地体现词语的上下文依赖关系。利用基于统计的方法对哈萨克语熟语料进行训练,然后用Viterbi算法实现词性标注。实验结果表明利用改进的HMM进行词性标注的效果比传统的HMM好。  相似文献   

16.
由于手写哈萨克字符结构的特殊性,仅提取几种单一的字符特征进行识别时正确率较低,识别效果较差。由此采用改进的PCA方法定位单词基线位置,对每个字符提取包括笔画密度特征、投影特征、轮廓特征等在内的36种特征,使用K-W检验对各特征的分类能力进行比较,并采用线性判别函数进行分类,取得了较高的识别精度。实验结果表明,该系统针对脱机字符识别率达到94%以上。  相似文献   

17.
由于历史原因,哈萨克语(下面简称哈语)在不同的地区形成了不同的文字形式,哈萨克斯坦哈萨克人用斯拉夫字母为基础的斯拉夫字母哈萨克文,而中国哈萨克人用的是阿拉伯字母为基础的阿拉伯字母哈萨克文。为了方便两国之间经济文化的交流,开发自动转换系统具有重要意义。C#编写的哈萨克语两种文字间相互智能转换程序,采用基于规则的方法实现了哈萨克语两种文字形式间的智能转换,准确率达到95.5%。  相似文献   

18.
为了帮助汉语教学研究人员使用计算机有效处理错字,分析了汉语教学界对错字分类的研究成果,建立了一种适合计算机处理、以字形为依据的错字分类体系.基于Unicode5.1标准中表意文字变体序列标准(ideographic variation sequences,IVS),设计并实现了以正字为中心组织和管理错字,使用正字加IVS变体选择符表示错字编码,应用OpenType字体技术解决了错字的输入输出问题.实验结果表明,该错字处理方案是可行的,而且能够较好地支持错字的传输、共享和检索,以及错字与标准字符集内汉字同文显示.  相似文献   

19.
根据面向中西亚软件开发与出口的战略,需要开发适合在哈萨克斯坦国应用的哈文操作系统及应用软件。通过对哈萨克斯坦国目前使用的文字的调查与研究,总结出目前哈国使用的文字编码字符集、键盘布局,编制出哈萨克斯坦哈文输入法,实现了哈萨克斯坦哈文键盘输入,为开发哈萨克斯坦哈文操作系统提供了支持。  相似文献   

20.
方块苗文是民间苗文的代表,其信息处理研究对于保护民间苗族文化遗产和弘扬苗族文化有着重要意义。字库开发是方块苗文信息处理研究内容的重要部分。根据方块苗文字库开发的实际需要,该文以文字结构分析为基础,提出了基于Unicode标准的方块苗文编码方案设计思想,介绍了方块苗文字符字模制作的基本步骤,并以标签定义、操作符定义和变换规则定义为重点,探讨了基于OpenType技术的方块苗文字库设计和开发的方法。测试结果表明,方块苗文OpenType字库具有文件小、易扩充等优点,能够解决英文、汉字和方块苗文的混排问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号