首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
藏文字形结构计量统计分析   总被引:2,自引:0,他引:2  
本文通过对藏文词典的统计,计算出现代藏字在藏文中的使用频度,并对藏字分别进行了部件和字丁层面上的分析,得出藏字构字方面的特征。同时依据藏字声母和韵母的结构方式的统计结果,揭示了藏字在声韵母方面的特性,为藏文的研究和信息化处理提供了一些基础数据。  相似文献   

2.
为解决乌金印刷多字体藏文的文本识别以字丁识别为主、识别字体类别单一或较少、无法实现端到端的藏文文本行识别等问题,根据藏文文字的书写特点,在基于分割的文本检测方法DBNet上,对比在MobileNetV3和ResNet34两种骨干网络下CRNN、Rosetta和RARE这3种端到端的文本识别算法;提出一种将常用74个藏文字符作为端到端文字识别的转录字典策略,提出一个针对藏文文本识别的评价指标。实验结果表明,以ResNet34为骨干网络的CRNN文本识别方法在测试集上的综合表现最佳。  相似文献   

3.
现代藏字全集的属性统计研究   总被引:10,自引:1,他引:10  
藏文基本属性的研究是藏文信息处理技术的基础,现代藏字的研究是藏文信息处理的重点。藏字全集是有限集,为了更好地研究现代藏字,本文以现代藏字为研究对象,按照现代藏文文法的规律,对全部现代藏字用计算机辅助统计了藏字全集的个数、藏字的字长、藏字的结构方式、位置特征、字符频度以及所有现代藏字中的整基字丁,并且简要地分析了这些数据。这些数据可以较全面地反映现代藏字的本质特征,可为藏文研究和藏字信息处理提供基础数据。  相似文献   

4.
“藏文—梵文”包括500多个现代藏文、6 000多个梵音藏文,在文字识别领域属于大类别的字符集,所以联机手写样本采集是庞大而复杂的工程。鉴于此,提供了一种基于部件组合的“藏文—梵文”手写样本生成方法,主要包括: (1)确定“藏文—梵文”字符集和部件集;(2)获取“藏文—梵文”字丁的部件位置信息;(3)采集联机手写“藏文—梵文”部件的样本;(4)生成联机手写“藏文—梵文”字符集样本库。该文为联机手写“藏文—梵文”识别的研究提供字符训练样本库和测试样本库,提高了手写梵音藏文样本采集效率,解决了样本数量及多样性问题,降低了样本采集成本,为进一步联机手写梵音藏文识别的研究与系统开发奠定了基础。  相似文献   

5.
一种符合ISO14651语义的藏文排序实现方法   总被引:9,自引:4,他引:9  
本文介绍了一种实现藏文字典序排序的方法,它针对藏文“大字丁字符集”编码方案。通过引入有(无)前加基字符的概念,它把待排序的藏字预处理为有(无)前加基字符、前加字符、基字(基字符或者字丁)、后加字符、再后加字符串后,再行比较,从而避免拆分字丁。本实现方法符合ISO/IEC14651标准语义。  相似文献   

6.
从无结构文本中抽取实体与实体之间的关系是自然语言处理领域的重要研究内容,同时也为构建知识图谱、问答系统等应用提供重要支撑。基于联合模型的实体关系抽取任务将实体识别和关系抽取同时进行,克服了传统实体关系抽取任务中先识别句子中的实体,然后再进行实体关系判断这两次任务中的错误累加。该文针对藏文语料匮乏、实体识别准确率不高等问题,提出了基于联合模型抽取藏文实体关系的方法。基于藏文实体关系抽取任务,提出以下方案: ①针对藏文分词准确率不高的问题,对藏文进行字级和词级两种方式进行预处理,并给出对比实验,结果表明采用字级处理方式较词级处理方式效果有所提高。②藏文是一种语法规则比较强的语言,名词、格助词等能明确指示句子各组块之间的语法和语义结构关系,因此该文将藏文的词性标注特征加入到藏文的字词向量中,实验结果证明了方法的有效性。③该文借鉴了联合模型处理的优势,提出基于联合模型处理方式,采用端到端的BiLSTM框架将藏文实体关系抽取任务转变为藏文序列标注的问题,实验结果表明,该文的方法较传统的基于藏文处理方式,如SVM算法和LR算法,准确率提高了30%~40%。  相似文献   

7.
拼写检查作为文本处理中的重要内容,在字处理软件、文字识别、语音识别、搜索引擎等领域具有广泛的应用。该文以藏文语音特性建立的字组织法为依据,以藏文音节规则为模型,提出了藏文音节规则模型(TSRM)的藏文音节拼写检查算法,并通过2组实验验证了算法的有效性。在没有考虑梵音转写藏文的情况下,拼写错误检查的准确率可以达到99.8%。  相似文献   

8.
字是语言文字的基本组成单位,字形结构统计研究是自然语言处理的基础,为字属性分析、输入法设计、排序、语音合成和字符信息熵研究等提供理论依据。该文通过分析藏文字形结构的特征,对藏文字的字形结构分成独体字和合体字,合体字按其构件的结构位和所含构件数进行分类。设计了藏文字形结构统计系统模型和算法,从约含8 500万藏文字的450M语料中对藏文字形结构进行统计,建立了藏文字形结构分布统计表,并对统计结果进行了分析。  相似文献   

9.
针对从互联网获取的一份包含19万藏文网页,总计427万句、9 328万音节字的藏文文本语料,该文按照预定的规则对其中的藏文音节拼写错误情况进行了统计与分析。数据显示,在语料中出现的共计20 743个藏文音节中,含有拼写错误的音节共有9 700个,占藏文音节总数的46.762 8%,错误音节在语料中共出现27 427次,仅占0.030 8%,说明这份语料的文本质量是相当高的。文中还详细统计了各种不同表现形式的错误音节所占比重,并分析了导致拼写错误的四个主要原因: 一是输入了多余的元音符号;二是音节点或句尾空格缺失;三是同一字丁/字符存在多种表达形式;四是错误地使用了相似字符。  相似文献   

10.
藏文识别的预处理   总被引:9,自引:2,他引:7  
预处理是整个文字识别系统的重要组成部分,预处理性能的优劣将直接影响整个识别系统的性能,根据藏文字在字形和书写方式上的特点,实现了一种适用于藏文识别的预处理技术,整个预处理过程包括二值化、版面分析、倾斜校正、字符切和归一化,在预处理过程中还提取了一此圾关字丁的基本特征,这些特征充分反映了藏文的特点,具有良好的稳定性,可以用于识别系统的粗分类和后处理。  相似文献   

11.
文章主要对元计算环境中任务调度进行了深入分析与研究。先概述了元计算系统对于科学领域的贡献,分析了元计算环境的特点;然后对元计算环境中的调度算法进行了分类说明,并对几种典型的调度算法行了具体的分析,评价了其特点与不足之处;最后分析了新兴的元计算环境—校园级元计算环境面临的挑战,借鉴各种调度算法,提出了与之相适应的任务调度策略,对其可行性进行了分析,并简要概括了其创新性。  相似文献   

12.
基于粘贴模型的巨大并行性,分别给出了线性全排列和圆周全排列问题的粘贴DNA算法;分析了两类问题的DNA算法的不同之处;通过一个实例给出了实验操作步骤,并对生化实验进行了模拟,得出了正确的结果,从而证明了算法的可行性。最后,对算法的操作复杂度进行了分析。  相似文献   

13.
根据安全协议的Horn逻辑扩展模型和相应的安全协议验证方法,提出了自动构造不满足安全性质的安全协议反例的求解策略,并给出了重要定理的证明,设计了一系列自动构造协议攻击的构造算法,并在基于函数式编程语言Objective Caml开发的安全协议验证工具SPVT中实现了这些算法,给出了主要算法的优化方法,详细分析了主要算法的时间复杂度,从理论上证明了算法是线性时间算法.最后,用SPVT对一些典型的安全协议进行了验证,得到了不安全协议的反例,并对反例进行了分析.得到的反例非常方便于阅读,与Alice-Bob标记非常接近,从而使任何领域的专家都可以用这种形式化的方法检查安全协议是否存在真实的反例.  相似文献   

14.
1 引言小波理论在图像压缩中已有成功的应用。在小波压缩系统中,有两个因素是至关重要的:一是小波滤波器,二是压缩编码算法。随着小波变换进入JPEG2000,与小波变换相配套的零树编码算法写进MPEG-4,小波理论在图像压缩中也占有越来越重要的地位。基于提升算法的第二代小波变换也日益受到研究者的广泛关注。与第一代小波变换相比,提升算法具有快速、高效的优点,并且提升滤波器的设计可直接在空域中完成。第一代小波变换可通过因数分解转换为提升方案,例如著名的Cohen和  相似文献   

15.
本文将以单步法中的广义 α族积分器和多步法中的BDF族积分器为主要讨论对象,详细介绍大型多体系统动力学软件中常见类型的积分器的算法细节.每族积分器都给出了不止一套计算公式,而且其对应求解微分代数方程组(DAE)的index可以为1、2或者3.除此以外,本文还着重介绍了微分代数方程组的误差估计、变阶变步长策略等关键技术;并讨论了大型DAE问题求解过程中的初始条件分析、Jacobian矩阵复用等重要环节的算法实现;对于BDF积分器族,文中还详细描述了高阶格式的非绝对稳定性、速度变量的误差估计等瓶颈问题的解决方案.全文以多体系统动力学软件的积分器程序实现为目标,强调在满足给定精度的条件下,如何提高计算效率和保证仿真运行的鲁棒性.另外,本文也简要介绍了在某些应用场合中有很大潜力的显式积分器族.通过分析和比较,文中还将指出各种算法的优缺点以及可能的改进方向,希望能够为研究人员和程序开发者提供一定的参考.由于篇幅限制,本文只列出了几个标准的算例比较,作为文中内容的补充;并给出了几种积分器性能比较的一般性结论.文中几乎所有方法都经由作者程序实现、测试和比较,并且相关算法的实现细节也都已尽量列出,可以很容易地编程实现并应用到实际问题的求解中去.  相似文献   

16.
基于贝叶斯滤波理论的自主机器人自定位方法研究   总被引:2,自引:0,他引:2  
针对自主机器人定位问题,研究了基于贝叶斯滤波理论的自定位方法,从概率表达的角度介绍了贝叶斯滤波方法各种不同的实现形式,分析了各种不同定位方法的性能,指出了它们的优缺点,并对每种方法的改进方法进行了探讨和分析,最后总结了定位方法的基本特点,并对贝叶斯滤波理论在自主机器人领域中的应用前景进行了展望,探讨了未来的发展方向。  相似文献   

17.
粒子滤波算法综述   总被引:110,自引:5,他引:110  
对粒子滤波算法的原理和应用进行综述.首先针对非线性非高斯系统的状态滤波问题.阐述粒子滤波的原理;然后在分析采样-重要性-重采样算法基础上.讨论粒子滤波算法存在的主要问题和改进手段;最后从概率密度函数的角度出发.将粒子滤波方法与其他非线性滤波算法进行比较.阐明了粒子滤波的适应性.给出了粒子滤波在一些研究领域中的应用.并展望了其未来发展方向.  相似文献   

18.
首先陈述消息在VC编程中的作用、理解消息机制的重要性;然后介绍消息的分类,包括其作用、产生方式和处理方式的不同。重点举出VC编程中的关键的机制作为例子,一方面对消息机制的实质有深刻理解,另一方面也对VC编程中的基本模式有所领会。最后给出几个实用小技巧和VC编程中容易出现的问题及其解决办法。基本概括了VC编程中基本技能。  相似文献   

19.
数字喷泉码和网络编码都是提高网络传输效率的有效技术方法,两者的有机结合形成的网络喷泉码具有重要的理论意义和应用价值。本文首先对数字喷泉码的最新研究进展进行了综述,分别介绍了几类常见的数字喷泉码的相关研究工作;其次对当前网络喷泉码的研究现状进行了系统的总结,重点介绍了同构网络喷泉码、异构网络喷泉码和无线网络喷泉码的相关理论及其最新研究成果,并分析了研究中存在的问题;最后对网络喷泉码的相关理论及其应用的发展趋势进行了分析和展望。  相似文献   

20.
多生物特征识别技术综述   总被引:3,自引:0,他引:3  
介绍了生物认证的发展状况和多生物特征提出的背景,提出了多生物特征认证的整体框架和具体参数的表征,并对不同的整合方法做了比较,分析了各自的优缺点。提出了最后关于多生物特征识别发展的看法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号