首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。  相似文献   

2.
本文以五笔字型编码为例,介绍了在以SPDOS为中文操作系统的80286微机上,利用扩充内存安装字、词汇和短语混合编码的输入码-机内码对照表,建立新的输入法。对照表长达110KB,但本方法开销基本内存不足5KB。本文提供了一个缓解汉字信息处理对基本内存资  相似文献   

3.
众所周知,汉字输入系统的核心部分就是一张输入码对照表,内容一般包括汉字的编码,以及简码或重码的标志位等信息。用户通过键盘输入的字符,经过一系列的转换后与码表对照,得到相应的国标码,再转换为汉字输出,由此可见,码表是将输入码转换成汉字的唯一依据。 一般情况下,各种输入法软件都是将码表与输入程序放在一起,经汇编形成一个独立的可执行文件。但我们在开发自己发明的“五分钟码”输入软件的过程中,发现这种传统码表方式有以下缺陷: 一、不易修改汉字编码。我们知道,一个汉字编码方案发明之后,往往要经过长期不断的修改和完善,只要改动一个字根,就会牵扯到许多汉字的编码;其次,各汉字的简码级别、重码次序等也往往要再三斟酌,通  相似文献   

4.
基于自由拆分模式的彝文输入法设计与实现   总被引:1,自引:0,他引:1  
针对彝文输入法普遍存在重码率高、输入速度慢和编码规则难学易忘的缺点,提出了一套基于自由拆分模式的彝文形码编码输入法方案.从统计数据可看出:该方案快速、简单、易学,且具有极低的重码率.该方案在很大程度上解决了现有彝文输入法所存在的问题,优化程度明显提高,具有更强的可行性和实用性.  相似文献   

5.
本文以打印五笔字型输入码本为目的,简要地介绍了五笔字型系统的输入码表结构和一个用BASICA语言编制的五笔字型输入码本打印程序。  相似文献   

6.
正现在各种各样的输入法越来越多,但是即使是很多用户更换了输入法,他们的输入习惯也并不会改变。比如有的用户为了提高输入效率,喜欢使用双拼输入这种方式。但是由于双拼输入的方案比较多,并不是所有输入法都支持全部方案,这个时侯就需要根据自己的需求来自定义双拼方案。这里就以现在刚刚推出的"必应输入法"来操作。首先准备一张自己熟悉的双拼方案的码表,为自己双拼的设置  相似文献   

7.
一、输入法的分类 汉字输入无疑在汉字系统中占有举足轻重的地位,为了增强输入方法的易学易用性,以满足不同用户的需求,UCDOS 5.0对输入法进行了重大改进。总体来说,UCDOS 5.0的输入法可分为三大类,内部输入法、万能输入法和独立挂接输入法。 内部输入法包括:区位和预选字,这两种输入法是由系统键盘管理模块来实现的,因而只要系统键盘管理模块(KNL)一运行,这些输入法便可直接使用了,  相似文献   

8.
现在各种各样的输入法越来越多,但是即使是很多用户更换了输入法,他们的输入习惯也并不会改变。比如有的用户为了提高输入效率,喜欢使用双拼输入这种方式。但是由于双拼输入的方案比较多,并不是所有输入法都支持全部方案,这个时侯就需要根据自己的需求来自定义双拼方案。  相似文献   

9.
读编往来     
《计算机与网络》2013,(19):80-80
阳光大虾: 鼠标输入法是一种用偏旁部首联想偏旁部首或汉字的输入过程,该输入法采用了汉字模块积木技术发明专利方案,而且加上精确的定位显示输入,只要您用鼠标轻轻三两点就可输入想要的汉字,使98%的常用汉字用鼠标3点内实现输入,比手写和笔画输入要快数倍!  相似文献   

10.
正由于微软拼音输入法寄生于Windows有多年的历史,加之该输入法的智能学习、整句录入和其他一些可圈可点的优势,因此仍有一批用户在沿用此输入法。但非常遗憾的是,系统升级到Windows 8.1之后,许多人发现微软拼音输入法不好用了,新版输入法无论在设置还是使用上变得不太顺手,甚至原来一些好有的功能也没有了。那么,在不丢掉原来熟悉的输入习惯的情况下,有什么办法来更好地驾驭该输入法?或者有什么好的替补方案?  相似文献   

11.
蒙古文整词编码研究   总被引:4,自引:2,他引:2  
作者基于蒙古文黏着记录其词汇方式和按书面音节拼读书写整词规则,提出了蒙古文整词编码方法。本文依据可计算性理论,提出了拼音文字非键盘映射编码方法,将整词编码分为输写码与计算码。整词输写码设计模仿传统蒙古文整词固有拼读书写规则,达到了最佳人机键盘交互目的。整词计算码既可载荷整词复杂特征知识信息、又可保证信息的可计算性,从而为蒙古文整词复杂特征合一计算和并行处理奠定了可行性科学基础。  相似文献   

12.
水族文字被称为水书。为了满足水书研究者和出版业界的需要,设计了水字字符集的Unicode编码,利用字体制作软件建立了水字TrueType字库。该文提出了一种基于笔形特征的编码方法,依据编码规则取水字3个角的笔形组成有序序列,为水字编码。利用Windows系统的IMM-IME机制,实现了水字笔形输入法。  相似文献   

13.
中文Linux输入法引擎标准研究   总被引:1,自引:0,他引:1  
Linux系统的输入法存在多种框架和实现,以往的标准化努力没有给出令人满意的结果,输入法引擎(IME)接口标准化采用了新的路线,有助于开发可适用于不同框架的IME.在总结归纳现有输入法框架基础上,分析了对IME接口进行标准化的基本原理,详细说明了IME接口标准的重要特性和设计原则;相关的实体被划分到4个部分,使用时序图对不同部分的交互进行了细致的分析.标准的可行性需要IME示例实现进行证明,针对覆盖标准不同方面的3个示例实现给出了简要说明,其设计和实践可供开发符合标准的IME时参考.最后,对该标准的应用前景和进一步研究方向做出了展望.  相似文献   

14.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。  相似文献   

15.
刘政怡  李炜  吴建国 《微机发展》2006,16(12):43-45
汉字键盘输入法研究是自然语言处理的一个重要课题。由于输入法编程不同于一般的程序设计,属于系统级的多语言支持组件,只能按照系统定义的IMM-IME结构的规范,为用户界面和转换接口编写代码,完成IME用户界面的设计和输入编码到汉字字符的转换工作。文中在实现语句输入法的同时,对实现输入法必须掌握的IMM-IME结构、工作过程,及具体实现步骤进行综述,供相关领域的研究人员参考。  相似文献   

16.
在分析MiniGUI内与输入法相关消息处理流程的基础上,设计了多个特定功能的子输入软键盘模块,实现了类似手机上T9输入法的功能模块(支持鼠标点击或触摸屏)输入。设计的9键输入法解决了开源的MiniGUI图形库仅提供了标准PC键盘输入法不支持嵌入式GUI交互中自定义输入法的问题,可广泛应用于需要9键中英文输入和软键盘输入的嵌入式GUI系统。  相似文献   

17.
建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。  相似文献   

18.
王宇  李志诚  李凤亭 《微计算机信息》2007,23(32):199-200,271
本文重点研究了AVS—P2熵编码器的算法、结构以及利用FPGA实现的若干关键问题,给出了详细的块变换系数熵编码器硬件结构,并通过了仿真验证。实现中提出了一种新的2D—VLC码表存储结构和一种确定指数哥伦布码码长的方法,可以节省59%的码表存储空间和降低指数哥伦布码码长计算电路的硬件复杂度。  相似文献   

19.
以Word2Vec为代表的静态蒙古文词向量学习方法,将处于不同语境的多种语义词汇综合表示成一个词向量,这种上下文无关的文本表示方法对后续任务的提升非常有限。通过二次训练多语言BERT预训练模型与CRF相结合,并采用两种子词融合方式,提出一种新的蒙古文动态词向量学习方法。为验证方法的有效性,在内蒙古师范大学蒙古文硕博论文的教育领域、文学领域数据集上用不同的模型进行了同义词对比实验,并利用K-means聚类算法对蒙古文词语进行聚类分析,最后在嵌入式主题词挖掘任务中进行了验证。实验结果表明,BERT学出的词向量质量高于Word2Vec,相近词的向量在向量空间中的距离非常近,不相近词的向量较远,在主题词挖掘任务中获取的主题词有密切的关联。  相似文献   

20.
Sparse coding is an efficient way of coding information. In a sparse code most of the code elements are zero; very few are active. Sparse codes are intended to correspond to the spike trains with which biological neurons communicate. In this article, we show how sparse codes can be used to do continuous speech recognition. We use the TIDIGITS dataset to illustrate the process. First a waveform is transformed into a spectrogram, and a sparse code for the spectrogram is found by means of a linear generative model. The spike train is classified by making use of a spike train model and dynamic programming. It is computationally expensive to find a sparse code. We use an iterative subset selection algorithm with quadratic programming for this process. This algorithm finds a sparse code in reasonable time if the input is limited to a fairly coarse spectral resolution. At this resolution, our system achieves a word error rate of 19%, whereas a system based on Hidden Markov Models achieves a word error rate of 15% at the same resolution.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号