共查询到20条相似文献,搜索用时 125 毫秒
1.
藏文拉丁转写的研究与实现 总被引:3,自引:2,他引:1
藏文拉丁转写是研究藏文化和进行藏文术语交流的重要工具。介绍了一种基于藏文编码字符集基本集和藏文编码字符集扩充集A,实现藏文拉丁转写的方法。通过引入垂直预组合的概念,将藏文由复杂文本变为简单文本,从而简化了拉丁转写的处理过程,降低了算法复杂度。详细讲述了算法的原理及在OpenOffice.org中的实现。 相似文献
2.
随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一。该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统。文章通过对小字符集编码方案的特征分析,同时根据藏文正字法知识,提出了基于小字符集编码的藏文拉丁转写算法,并对具体算法策略进行了分析和说明,最后在Windows平台进行了程序的实现。藏文拉丁转写方案的设计与实现,可以解决藏文多编码系统之间的兼容性问题。
相似文献
相似文献
3.
方言转换系统实现了普通话到济南话、沈阳话和西安话的实时语音转换.北方方言之间的差异主要体现在声调上,声调是属于音节的,因此声调转换模式转换是以音节为单位实施的.主要研究了方言转换系统中关键技术:连续语流音节切分算法.提出了一种基于自动机的逐级音节切分算法,分为语段切分、音节切分自动机和切分点自动校正三部分.该算法在误差48ms时,正确率达到72.55%,并成功支持了方言转换中的基频模式转换. 相似文献
4.
改革开放后,新疆与国内以及国际交往越来越频繁。新疆少数民族人名汉字音译转写缺少统一标准,维吾尔人名汉字音译转写时,在户口上是一种写法,在身份证上另一种写法,在护照上更不一样的用字写法,机票、汇款单等又是一种写法。为解决这些问题,前人作了研究并取得了一定成果以及使用维吾尔人名汉语音译撰写系统来规范维吾尔人名汉语音译。但是这些成果正确率只有52%。利用规则和维吾尔人名特征相结合的方法,提高系统自动维吾尔人名汉语音译正确率30%。介绍该领域研究进展,通论维吾尔音节切分与维吾尔人名特征相结合方法。陈述基于字形的DOM音译框架解决的问题,介绍基于音节切分的维吾尔人名汉字音译转写的实现方法,给出了实验结果与分析。 相似文献
5.
6.
该文采用联合熵算法(Union Entropy,UE)初步确定了蒙古文停用词,接着从初步确定的蒙古文停用词中去掉蒙古文实体名词及同形异义词,再通过对英文停用词和蒙古文停用词的词性比较,确定了蒙古文停用词表。最后用蒙古文停用词表和英文停用词表进行了文档信息检索的对比实验。实验结果表明,用该文所述方法确定的蒙古文停用词表进行蒙古文文档检索,比用英文停用词翻译成蒙古文进行蒙古文文档检索的准确率更高。 相似文献
7.
8.
在流密码中,常将拉丁方作为改善输入序列平衡性的平衡编码环节,但缺乏相应的理论研究.提出了度量随机变量均匀性的新指标--均匀偏差系数,给出了计算拉丁矩、拉丁方和线性布尔函数输出变量的均匀偏差系数公式,证明了拉丁矩能够改善某一路输入序列的平衡性,拉丁方能够有效改善两路输入序列的平衡性,最后给出了两个例子验证了线性布尔函数和拉丁方能够有效改善输入序列的平衡性. 相似文献
9.
10.
由于传统蒙古文显示排版具有特殊性,字符集纳入国际编码标准相对滞后,造成目前主流开发平台上既没有一套完善的支持蒙古文特点的UI组件,也没有形成成熟的蒙古文UI组件扩展方法。通过研究解析Java Swing和Android UI组件的架构,找出一种有效支持蒙古文特点的UI组件扩展方法。使用该方法对Swing和Android UI常用组件进行了扩展。测试结果表明扩展后的组件具有支持国际编码标准及符合蒙古文特点的显示和编辑功能,能满足互联网和移动平台蒙古文应用软件开发的需要。 相似文献
11.
12.
音节是泰语构词和读音的基本单位,泰语音节切分对泰语词法分析、语音合成、语音识别研究具有重要意义。结合泰语音节构成特点,提出基于条件随机场(Conditional Random Fields)的泰语音节切分方法。该方法结合泰语字母类别和字母位置定义特征,采用条件随机场对泰语句子中的字母进行序列标注,实现泰语音节切分。在InterBEST 2009泰语语料的基础上,标注了泰语音节切分语料。针对该语料的实验表明,该方法能有效利用字母类别和字母位置信息实现泰语音节切分,其准确率、召回率和F值分别达到了99.115%、99.284%和99.199%。 相似文献
13.
14.
15.
16.
文章提出了一种MR图像增强的新算法。首先由多阈值分割算法将图像分割为不同的区域,然后统计出各区域的灰度均值和方差,由这两个特征构造各区域的累积指数非线性变换,并分别对相应区域进行增强。实验表明,用该算法增强后的MR图像在视觉上增强了图像对比度,加强目标的细节,还可以去除部分噪声,在实现上缩短了CPU时间。 相似文献
17.
蚕茧计数时,面对蚕茧粘连情况,常见的膨胀腐蚀方法并不能很好地将蚕茧分割开来,针对这一情况,提出了一种基于距离变换的粘连蚕茧分割方法。对蚕茧图像进行锐化处理,利用最大类间方差法对图像二值化,对其进行距离变换,再进行归一化,同时进行阈值化二值分割,采用形态学膨胀处理,进行连通域标记,统计连通域个数。实验结果表明,该算法能有效地分割粘连的蚕茧,能够实现对蚕茧的准确计数,计数准确率达99%以上。 相似文献
18.
动态分段模型的研究和在TerraGIS中的实现 总被引:2,自引:0,他引:2
论文首先对广泛应用于交通地理信息系统中的基于路径、区段、量度、事件的动态分段技术和动态分段模型进行了深入的分析和研究,而后在此基础上提出并实现了TerraGIS上的交通数据模型。 相似文献
19.
20.
基于编码—解码(端到端)结构的机器翻译逐渐成为自然语言处理之机器翻译的主流方法,其翻译质量较高且流畅度较好,但依然存在词汇受限、上下文语义信息丢失严重等问题。该文首先进行语料预处理,给出一种Transformer-CRF算法来进行蒙古语词素和汉语分词的预处理方法。然后构建了基于Tensor2Tensor的编码—解码模型,为了从蒙古语语料中学习更多的语法和语义知识,该文给出了一种基于词素四元组编码的词向量作为编码器输入,解码阶段。为了进一步缓解神经网络训练时出现的词汇受限问题,该文将专有名词词典引入翻译模型来进一步提高翻译质量和译文忠实度。根据构建模型对不同长度句子进行实验对比,表明模型在处理长时依赖问题上翻译性能得到提高。 相似文献