首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
引入排序码实现藏文字符的排序   总被引:1,自引:0,他引:1  
字符排序一般要遵循字典顺序并且需要为每个参与排序的字符赋予特定的排序码.藏文字符有两种编码方式:动态组合方式和静态组合方式,对于动态组合方式编码的藏文组合字符而言,仅仅根据构成它的字母来排序,则排序结果与字典顺序有较大的差异.文中分析了藏文字符的字典顺序,总结了藏文的字典顺序规律,提出了引入藏文字符集扩展集A中的UNICODE编码为排序码对藏文组合字符进行排序的观点,使得藏文组合字符的排序符合藏文字典顺序.  相似文献   

2.
DUCET为每个藏文字符规定了排序码,但部分藏文字母的排序码并不符合藏文字典的排序要求,根据藏文字典的字母顺序对DUCET做了以下修订:修订梵音藏文字母■的排序码;为占位元音■赋予了适当的排序码;修订了下加辅音■的排序码。通过这些修订DUCET能完全支持现代藏文音节、梵音藏文音节以及二者间的混合排序。  相似文献   

3.
Word是目前使用最广泛的应用程序之一,对目前的绝大多数用户来说Word几乎接近完美,但对少数藏文研究工作者来说依然存在不足,其中藏文排序在Word中尚未实现,该文提出一种实现在Word中藏文能同其他文字一样实现排序的算法。  相似文献   

4.
基于DUCET的藏文排序方法   总被引:1,自引:0,他引:1  
DUCET为每个藏文字符规定了排序码,但藏文音节的拼写复杂性使得藏文排序不能直接应用这些排序码,提出了基于DUCET的藏文音节排序方法,主要思想是首先,将二维的藏文音节转化成一维的字母串;其次,从DUCET中查出每个字母的排序码,得到藏文音节对应的排序码串;最后,通过比较排序码串实现藏文音节间的排序。还讨论了藏文音节与一般藏文字母串以及藏文字符串与外文字符串间的比较规则。  相似文献   

5.
6.
目前藏文预训练模型主要使用音节作为藏文单词表示。采用音节嵌入构建藏文单词表示,会存在藏文单词表示不完整且鲁棒性不高的问题。为了应对这一挑战,提出了一个名为藏文字符感知的预训练模型,该模型融合藏文字符、字丁和音节三个维度的特征,从藏文更细粒度的信息表征藏文单词特征。利用原始数据集和对抗性拼写错误测试集,评估了所提出的方法在藏文自动分词和命名实体识别任务上的性能。实验结果表明,该方法可以同时提高藏文预训练语言模型的性能和鲁棒性。  相似文献   

7.
构成藏文音节的字母具有一定的顺序,ISO/IEC 10646(Tibetan)中每个藏文字符规定了排序码,但是藏文音节的构造复杂性使得藏文不能直接按构成藏文音节的字母顺序来排序,也不能直接应用这些排序码,提出了基于ISO/IEC 10646(Tibetan)的藏文排序算法,主要思想是:从文本中读入藏文音节,并把它转化为一维的字母串;识别基字及调整构成藏文音节的字母(构件)顺序,并且在缺构件位置上添加相应的空格符;用快速排序法对藏文音节串进行排序;构成藏文音节的字母(构件)顺序调回到原来的顺序,去除空格符,并输出。  相似文献   

8.
论藏文的序性及排序方法   总被引:7,自引:10,他引:7  
为解决藏文排序问题,本文提出藏文的构造序和字符序概念,并在此基础上提出解决藏文词典序的计算机方案。文章对各类藏文构造及字符进行了分析和赋值,给出了藏文计算机排序的技术流程图。  相似文献   

9.
一种符合ISO14651语义的藏文排序实现方法   总被引:9,自引:4,他引:9  
本文介绍了一种实现藏文字典序排序的方法,它针对藏文“大字丁字符集”编码方案。通过引入有(无)前加基字符的概念,它把待排序的藏字预处理为有(无)前加基字符、前加字符、基字(基字符或者字丁)、后加字符、再后加字符串后,再行比较,从而避免拆分字丁。本实现方法符合ISO/IEC14651标准语义。  相似文献   

10.
为了使得藏文字符特征向量维数少、存储空间小、运算速度快及区分相似字能力高,基于图像投影法提出一种基于极坐标投影变换的脱机手写藏文字符特征提取方法。将脱机手写藏文字符图像进行预处理后得到大小、位置统一的二值图像,并定位二值图像的极点;求出二值图像中所有值为1的点对应的极坐标后将其进行投影变换得到投影向量,即作为脱机手写藏文字符的特征向量。使用KNN分类器对30 000个脱机手写藏文字进行实验,其中80%的样本作为训练数据,20%的样本作为测试数据,识别率达到了96.32%。结果表明该方法的有效性、计算简单及达到了较好的识别效果。  相似文献   

11.
基于ISO/IEC 10646标准的藏文编码转换的设计与实现   总被引:2,自引:0,他引:2  
目前,国内少数民族地区的书报印刷行业大多使用北大方正、华光藏文排版系统。这些软件的编码各异,致使有限的藏文资源无法实现交换和共享,造成这种现象的原因是各种软件编码体系不一致。解决这个问题的根本途径是将各种不同体系的藏文编码转换为符合国际标准的编码。该文以华光Windows藏文字符编码为例,首先对每个藏文字符进行构字分析,然后采用分表分组技术构造出每个字符符合ISO/IEC 10646标准的编码序列,最后采用hash技术优化查询算法,实现非标准的藏文字符编码向标准编码序列转换。  相似文献   

12.
本文简要描述了在工业气体行业高速发展的背景下,一种气体分段计量系统的设计,包括系统产生的背景、设计的目的、系统的结构、实现的功能、系统特点及应用领域等。  相似文献   

13.
超快速排序算法   总被引:1,自引:0,他引:1  
快速排序算法结构简单,平均性能较佳;基数排序性能较稳定。结合快速排序和基数排序,提出超快速排序算法,通过理论分析和实验表明,新算法的性能优于快速排序算法和基数排序算法。  相似文献   

14.
排序是计算机科学中一个非常重要的问题.提出了一种基于分布计数的基数排序方法,给出该算法定义、算法描述、算法正确性证明和算法分析;讨论了基于该排序算法几个关键问题的解决方法.算法理论分析和实验结果研究均表明该算法时间复杂度为O(N),速度优于快速排序,是一种高效的排序方法.  相似文献   

15.
葛浩  杨传健 《微机发展》2008,18(2):122-125
排序是计算机科学中一个非常重要的问题。提出了一种基于分布计数的基数排序方法,给出该算法定义、算法描述、算法正确性证明和算法分析;讨论了基于该排序算法几个关键问题的解决方法。算法理论分析和实验结果研究均表明该算法时间复杂度为O(N),速度优于快速排序,是一种高效的排序方法。  相似文献   

16.
随着移动互联网的迅速发展,Android平台也得到迅速普及,该移动平台上的应用日臻完善。通讯录作为人们之间联系方式存放的介质,自然成为必不可少的应用。而其中联系人的显示顺序则成为了开发者备受关注的话题,提出了一种新的排序方法,借助数据库的排序语句,方便高效地实现了将汉字按照拼音首字母自增的方式进行排序,该方法使用起来便捷、高效,避免了程序中引入第三方jar包所导致的程序臃肿问题。  相似文献   

17.
本文通过对冒泡排序的讨论,指出其效率不高的缺陷,提出了局部冒泡排序算法,并编程予以实现,其效率较传统的冒泡排序算法有一定程度的提高。同时对冒泡排序和局部冒泡排序算法进行了分析和性能对比测试,对局部冒泡排序算法的时间性能作出了评价。  相似文献   

18.
黄福员  聂瑞华 《微机发展》2003,13(11):26-27,66
通过对传统冒泡排序算法的讨论,指出其效率不高的缺陷,提出了局部冒泡排序算法,并编程予以实现,其效率及性能较传统的冒泡排序算法有一定程度的提高。同时采用随机及特殊数据在计算机上对传统冒泡排序和局部冒泡排序算法进行了分析和性能对比测试,对局部冒泡排序算法的时间性能作出了评价,指出了局部冒泡排序算法的特点及优势。通过实验证明了局部冒泡排序算法较传统冒泡排序算法在时同性能上有了一定的改进。  相似文献   

19.
高效快速排序算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
快速排序是排序算法中性能较好的一种,但存在对数据有序或者基本有序的情形下的性能瓶颈问题。为此,对比效率同为O(nlbn)的其他排序算法,提出一种新的高效快速排序算法。理论分析和实验数据表明,其性能优于原有的快速排序算法,并且在数据基本有序的状况下依然具有高性能和较强的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号