排序方式: 共有108条查询结果,搜索用时 15 毫秒
1.
2.
《Planning》2019,(21)
藏文真词检错是藏文文本校对研究的重点和难点,也是藏文信息处理技术的基础工作。文章通过研究藏文词语中数词的合成方式、搭配规律,分析了常见的数词合成词法错误,设计并实现了基于规则的藏文数词合成检错算法,经测试数词合成错误的检错成功率达到100%。 相似文献
3.
《Planning》2019,(1)
对西藏高等农业院校在校藏族大学生的调查显示,学生普遍存在学习困难现象,汉语水平低是造成这一现象的主要原因。学生期望在大学课堂能采用藏汉双语教学,希望能够得到藏汉两种文字编写的教材。笔者建议学校今后逐步增设藏汉双语教学课程,强化藏、汉语语言学习,加强藏汉双语教学队伍的建设,积极编撰藏汉双语教材,开展藏汉双语教学研究,配套藏汉双语教学的相关政策,以提高教学质量,培养合格人才。 相似文献
4.
5.
基音周期是表征激励源特征的一个重要参数,在藏语语音处理的研究中具有非常重要的意义.本文首先介绍了基于倒谱分析法进行基音周期检测的基本原理,并在此基础上对藏语语音的基音周期检测进行了仿真研究,同时指出了几个应该注意的问题. 相似文献
6.
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征, 提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F1值为99.4%。 相似文献
7.
藏语词性标注技术在藏文信息处理领域中占有十分重要的地位,本文主要对基于hmm的藏语词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注。 相似文献
8.
神经网络机器翻译是最近几年提出的机器翻译方法,在多数语言对上逐渐超过了统计机器翻译方法,成为当前机器翻译研究前沿热点。该文在藏汉语对上进行了基于注意力的神经网络机器翻译的实验,并采用迁移学习方法缓解藏汉平行语料数量不足问题。实验结果显示,该文提出的迁移学习方法简单有效,相比短语统计机器翻译方法,提高了三个BLEU值。从译文分析中可以看出藏汉神经网络机器翻译的译文比较流畅,远距离调序能力较强,同时也存在过度翻译、翻译不充分、翻译忠实度较低等神经网络机器翻译的共同不足之处。 相似文献
9.
藏文黏着语是在藏文文字的发展过程中,由于发音需要或者语法需求而产生的.黏着语的存在会对藏文信息处理中的文本规范化带来阻碍.文章通过对黏着语产生的背景和意义进行了解,按照黏着语不同的形成原因进行分类处理,最终实现黏着语的规范化处理. 相似文献
10.
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性.选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典.讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集.建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案. 相似文献