共查询到10条相似文献,搜索用时 15 毫秒
1.
结合网络上流通的拉丁化维吾尔文字特征,以拉丁化维吾尔文单词作为研究单位,首先,通过大规模文本语料库建立了固定词库、词首字母序列库、词尾字母序列库以及特殊词库等正规化规则库。然后,利用维吾尔单词中的字母序列结构特征和相邻字母上下文信息进行了拉丁化维吾尔文的正规化,同时引用最小编辑距离的方法进一步提高了正规化正确率,并用Visual C# 编程工具实现了基于规则的拉丁化维吾尔文的正规化算法。最后,给出了实验结果,并分析了结果不佳的原因及相应的对策。
相似文献
相似文献
2.
为研究开发维吾尔文摄像头取词翻译系统,解决其中维吾尔文字单词图像切分难题,提出一种印刷体维吾尔文字符自适应切分算法。针对摄像头取词图像特点,准确提取目标单词;利用维吾尔文单词基线以上的主体部分做像素积分投影,从投影结果中自动提取切分阈值;利用该阈值完成字符切分,达到自适应的效果。经过实验验证,该方法切分正确率达到了96%以上,针对不同图像具有较好的适应性,对维吾尔文摄像头取词翻译系统的研究具有促进作用。 相似文献
3.
本文描述了基于ASP.NET的SQL Server数据库中RTF文档存取的应用,讨论了在SQL Server数据库中存取RTF文档的方法,并给出了ASP.NET环境下对SQL Server数据库存取RTF文档的关键代码。 相似文献
4.
为解决维吾尔文文本分类中不平衡数据集问题,提出了一种改进的卡方特征选择方法.结合维吾尔文的语言特性对文本进行预处理,降低特征空间维度;运用卡方和逆文档频数相结合的方法进行特征选择,进一步降低特征空间维数;使用朴素贝叶斯分类器进行分类.在维吾尔文不平衡语料库上进行的实验表明,提出的特征选择方法在不平衡数据集中要优于卡方和信息增益特征选择方法. 相似文献
5.
维吾尔文字的连笔书写及字型变化的一些特征给识别带来一定的困难并会影响到识别的正确率.在分析了维吾尔文单词的组词规律及其字型结构特征基础上,采用一种基于区域分割模板匹配的识别方法,通过建立标准维吾尔文字母图像模板库,并与通过预处理所获得的待识别维吾尔文字母图像进行匹配.对一些相似度高且难区分的维吾尔文字母则采用提取这些相似字符的附属笔画部分的图像并对其按笔画的连通性、交叉性以及形态等特征进行附属笔画判定的方法来确定这些相似字符,从而较准确地实现了对维吾尔文印刷字符的识别.实验识别率达到94% 相似文献
6.
7.
8.
前阵子,腾讯的QQ增加了新的功能。就是发送RTF文档代码给对方,对方就可以收到经翻译后的RTF文档图象,可以让大家的留言生色不少哦~(QQ2000cBuild0825以上)但后来发现,如果发送端设置RTF字体过大的时候,接收就会非法操作而退出。今天为了各位兄弟姐妹们的QQ聊天伟大事业(^..^),就来跟大家一起探讨一下RTF代码的“奥秘”,和如何在QQ中使用RTF代码吧! 相似文献
9.
为提高维吾尔文档图像的检索效率,提出一种基于字符空间关系的关键词检索方法.通过对文档图像进行单词切分,提取切分后单词图像的字符空间位置特征,将提取的特征根据单词的连体段数目存储为多个特征文件,根据输入关键词图像的特征寻找对应的特征文件进行查询.从115张印刷体维吾尔文档图像切分后的24460张单词集中选取10张有丰富含... 相似文献
10.
阿布力米提·阿不都热依木 《计算机工程与设计》2005,26(11):2891-2892,2916
维吾尔文信息在计算机上的处理方法与维吾尔文处理系统采用的维吾尔文字符编码方案和维吾尔文字体文件的结构有非常密切的关系。在保留字体文件原有的所有语言支持功能的前提下制作符合国际UNICODE编码标准的字体文件是在Windows系列操作系流下开发维吾尔文信息处理平台的一个重要方面。讨论Windows上维吾尔文字符显示与维吾尔文字体文件结构之间的关系,深入分析Open Type字体与文本垂直显示和高级印刷功能有关的描述表,最后提出符合国际UNICODE编码标准的维吾尔文Open Type字体的制作方案。 相似文献