排序方式: 共有140条查询结果,搜索用时 15 毫秒
71.
本文首先研究了维吾尔文的书写特点和手机混合输入法设计中的难点,然后设计实现了具有不同编辑方向的维、汉、英、多文种手机的混合输入和屏幕显示;详细讲解了支持多文种混合显示的雏吾尔文手机输入法技术,提出了菜单的多文种化等关键模块功能的实现方案。 相似文献
72.
论文在动态网页中,无本地输入法的情况下,研究了如何向网页中的文本框直接输入并提交维吾尔语文字的相关技术,其中包括了维吾尔文字符的Unicode编码方案设计、字符编码的转换技术、以及维吾尔文字符自动选型技术等,文中还给出了实现其关键模块功能的程序流程图和实现代码。 相似文献
73.
电子词典是在机器翻译系统中包含的信息量最大的一个部件,电子词典包的质量和容量直接限定机器翻译的质量和应用范围。与一般的电子词典不同,机器翻译词典每个词条都要比一般的电子词典增加词类信息、语义类别信息和成语等。文章以频率统计和频率分布统计作为维汉机器翻译词典的词条收录原则,统计维吾尔文中常用的单词数目,论述维汉机器翻译词典的设计思想,用BNF形式语言和Jackson图描述维汉机器翻译词典应包含的词条信息,最后介绍词典的具体构造方法、词条排序原则、索引表和属性库的数据结构和词典信息的查找方法。试验表明该词典在解决维吾尔语词汇歧义、结构歧义、提高汉语译文准确率等方面较为有效。 相似文献
74.
论文叙述了基于阿拉伯字母的维吾尔文、哈萨克文、柯尔克孜文的OMR信息采集系统的设计方法。首次提出了考试报名信息采集系统中采用的光标识别维吾尔文编码方案,以及开发工具PB10.0版本基于Unicode编码的维、哈、克文信息在数据库信息处理方面要求,光标识别维吾尔文编码的转换处理方法。论文提出的编码方案和转换方法,对基于阿拉伯字母的维、哈、柯文信息采集应用领域有一定的指导和参考意义。 相似文献
75.
目前针对印刷体维吾尔文档图像的切分研究主要集中在字母切分上,单词切分的文献较少,且存在着标点符号难处理,未合并被拆分书写的单词等问题,同时单词切分准确率有待进一步提高。在对文档图像进行投影处理的基础上,通过[K]均值聚类算法[(K]-means)对文本行中所有连体段之间的间隙进行聚类分析得出最佳的间隙判别阈值,然后对所有连体段进行筛选和粗略识别,并结合对间隙的阈值判别结果来确定单词的精确切分点和获取被拆分书写单词的位置信息。在选取的100张文档图像中测试时,结果表明该方法能有效去除标点符号对切分结果的影响,准确合并被拆分书写的单词,并且平均单词切分准确率保持在99%以上。 相似文献
76.
目前,维吾尔文命名实体识别研究主要集中在单类实体,且没有引入半监督学习方法,从而无法利用未标注语料的无监督语义和结构信息。该文以条件随机场为基本框架,提出了一种基于半监督学习的维吾尔文命名实体识别方法。通过引入词法特征、词典特征、以及基于词向量的无监督学习特征,对比不同特征对识别的影响,并对模型进行优化。实验表明,CRF模型融合多种特征时维吾尔文命名实体识别的F值达到87.43%,说明词法特征和无监督学习特征的有机结合,可以大大减少人工选取特征的工作量,同时也可提高维吾尔文命名实体识别的性能;CRF模型相比于神经网络模型,更适合用于实际应用中。 相似文献
77.
78.
79.
80.
通过分析维吾尔文字母自身的结构和书写特点,提出一种联机手写维吾尔文字母识别方案,并选择在手写汉字识别技术中所提出来的归一化、特征提取及常用的分类方法,从中找出最佳的技术选择。在实验对比中,采用8种不同的归一化预处理方法,基于坐标归一化的特征提取 (NCFE) 方法,以及改进的二次分类函数(MQDF)、判别学习型二次判别函数(DLQDF)、学习矢量量化(LVQ)、支持向量机(SVM)4种分类器。同时,再考虑字符在文档中的空间几何特征,进一步提高识别性能。在128个维吾尔文字母类别、38 400个测试样本的实验中,正确识别率最高达89。08%,为进一步研究面向维吾尔文字母特性的识别技术奠定重要基础。 相似文献