共查询到20条相似文献,搜索用时 171 毫秒
1.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。 相似文献
2.
本文以五笔字型编码为例,介绍了在以SPDOS为中文操作系统的80286微机上,利用扩充内存安装字、词汇和短语混合编码的输入码-机内码对照表,建立新的输入法。对照表长达110KB,但本方法开销基本内存不足5KB。本文提供了一个缓解汉字信息处理对基本内存资 相似文献
3.
众所周知,汉字输入系统的核心部分就是一张输入码对照表,内容一般包括汉字的编码,以及简码或重码的标志位等信息。用户通过键盘输入的字符,经过一系列的转换后与码表对照,得到相应的国标码,再转换为汉字输出,由此可见,码表是将输入码转换成汉字的唯一依据。 一般情况下,各种输入法软件都是将码表与输入程序放在一起,经汇编形成一个独立的可执行文件。但我们在开发自己发明的“五分钟码”输入软件的过程中,发现这种传统码表方式有以下缺陷: 一、不易修改汉字编码。我们知道,一个汉字编码方案发明之后,往往要经过长期不断的修改和完善,只要改动一个字根,就会牵扯到许多汉字的编码;其次,各汉字的简码级别、重码次序等也往往要再三斟酌,通 相似文献
4.
5.
本文以打印五笔字型输入码本为目的,简要地介绍了五笔字型系统的输入码表结构和一个用BASICA语言编制的五笔字型输入码本打印程序。 相似文献
6.
正现在各种各样的输入法越来越多,但是即使是很多用户更换了输入法,他们的输入习惯也并不会改变。比如有的用户为了提高输入效率,喜欢使用双拼输入这种方式。但是由于双拼输入的方案比较多,并不是所有输入法都支持全部方案,这个时侯就需要根据自己的需求来自定义双拼方案。这里就以现在刚刚推出的"必应输入法"来操作。首先准备一张自己熟悉的双拼方案的码表,为自己双拼的设置 相似文献
7.
一、输入法的分类 汉字输入无疑在汉字系统中占有举足轻重的地位,为了增强输入方法的易学易用性,以满足不同用户的需求,UCDOS 5.0对输入法进行了重大改进。总体来说,UCDOS 5.0的输入法可分为三大类,内部输入法、万能输入法和独立挂接输入法。 内部输入法包括:区位和预选字,这两种输入法是由系统键盘管理模块来实现的,因而只要系统键盘管理模块(KNL)一运行,这些输入法便可直接使用了, 相似文献
8.
现在各种各样的输入法越来越多,但是即使是很多用户更换了输入法,他们的输入习惯也并不会改变。比如有的用户为了提高输入效率,喜欢使用双拼输入这种方式。但是由于双拼输入的方案比较多,并不是所有输入法都支持全部方案,这个时侯就需要根据自己的需求来自定义双拼方案。 相似文献
9.
10.
正由于微软拼音输入法寄生于Windows有多年的历史,加之该输入法的智能学习、整句录入和其他一些可圈可点的优势,因此仍有一批用户在沿用此输入法。但非常遗憾的是,系统升级到Windows 8.1之后,许多人发现微软拼音输入法不好用了,新版输入法无论在设置还是使用上变得不太顺手,甚至原来一些好有的功能也没有了。那么,在不丢掉原来熟悉的输入习惯的情况下,有什么办法来更好地驾驭该输入法?或者有什么好的替补方案? 相似文献
11.
12.
13.
中文Linux输入法引擎标准研究 总被引:1,自引:0,他引:1
Linux系统的输入法存在多种框架和实现,以往的标准化努力没有给出令人满意的结果,输入法引擎(IME)接口标准化采用了新的路线,有助于开发可适用于不同框架的IME.在总结归纳现有输入法框架基础上,分析了对IME接口进行标准化的基本原理,详细说明了IME接口标准的重要特性和设计原则;相关的实体被划分到4个部分,使用时序图对不同部分的交互进行了细致的分析.标准的可行性需要IME示例实现进行证明,针对覆盖标准不同方面的3个示例实现给出了简要说明,其设计和实践可供开发符合标准的IME时参考.最后,对该标准的应用前景和进一步研究方向做出了展望. 相似文献
14.
隐马尔科夫模型(HMM)对序列数据有很强的建模能力,在语音和手写识别中都得到了广泛的应用。利用HMM研究蒙古文手写识别,首先需要解决的问题是手写文字的序列化。从蒙古文的构词和书写特点看,蒙古文由多个字素从上到下串联构成。选择字素集合和词的字素分割是手写识别的基础,也是影响识别效果的关键因素。该文根据蒙古文音节和编码知识确定了蒙古文字母集合,共包括1 171个字母。通过相关性处理、HMM排序筛选等手段得到长字素集合,共包括378个字素。对长字素经过人工分解,获得了50个短字素。最后利用两层映射给出了词转字素序列的算法。为了验证长短字素在手写识别中的效果,我们在HTK(hidden Markov model toolkit)环境下利用小规模字库实现了手写识别系统,实验结果表明短字素比长字素有更好的性能。文中给出的字素集合和词转字素序列的算法为后续基于HMM的蒙古文手写识别研究奠定了基础。 相似文献
15.
16.
黄健 《计算机工程与设计》2011,32(6):1975-1978
在分析MiniGUI内与输入法相关消息处理流程的基础上,设计了多个特定功能的子输入软键盘模块,实现了类似手机上T9输入法的功能模块(支持鼠标点击或触摸屏)输入。设计的9键输入法解决了开源的MiniGUI图形库仅提供了标准PC键盘输入法不支持嵌入式GUI交互中自定义输入法的问题,可广泛应用于需要9键中英文输入和软键盘输入的嵌入式GUI系统。 相似文献
17.
建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5 000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5 000样本,测试集Ⅱ包含14 085样本。该文利用蒙古文文字长度可变特征研究了自动错误检测算法,提高了字库的可靠性。在三种常用手写识别模型上评估了字库的性能,其中基于循环神经网络的模型表现出最佳性能,在字典受限条件下测试集Ⅰ的词错误率达到2.20%,测试集Ⅱ达到了5.55%。 相似文献
18.
19.
以Word2Vec为代表的静态蒙古文词向量学习方法,将处于不同语境的多种语义词汇综合表示成一个词向量,这种上下文无关的文本表示方法对后续任务的提升非常有限。通过二次训练多语言BERT预训练模型与CRF相结合,并采用两种子词融合方式,提出一种新的蒙古文动态词向量学习方法。为验证方法的有效性,在内蒙古师范大学蒙古文硕博论文的教育领域、文学领域数据集上用不同的模型进行了同义词对比实验,并利用K-means聚类算法对蒙古文词语进行聚类分析,最后在嵌入式主题词挖掘任务中进行了验证。实验结果表明,BERT学出的词向量质量高于Word2Vec,相近词的向量在向量空间中的距离非常近,不相近词的向量较远,在主题词挖掘任务中获取的主题词有密切的关联。 相似文献
20.
Sparse coding is an efficient way of coding information. In a sparse code most of the code elements are zero; very few are active. Sparse codes are intended to correspond to the spike trains with which biological neurons communicate. In this article, we show how sparse codes can be used to do continuous speech recognition. We use the TIDIGITS dataset to illustrate the process. First a waveform is transformed into a spectrogram, and a sparse code for the spectrogram is found by means of a linear generative model. The spike train is classified by making use of a spike train model and dynamic programming. It is computationally expensive to find a sparse code. We use an iterative subset selection algorithm with quadratic programming for this process. This algorithm finds a sparse code in reasonable time if the input is limited to a fairly coarse spectral resolution. At this resolution, our system achieves a word error rate of 19%, whereas a system based on Hidden Markov Models achieves a word error rate of 15% at the same resolution. 相似文献