排序方式: 共有108条查询结果,搜索用时 15 毫秒
11.
自然语言处理用藏语格助词的语法信息研究 总被引:2,自引:1,他引:1
该文主要探讨了藏语格助词的语法信息、语义信息、功能结构等内容,从而为建立藏语格助词的语法属性库提供详实的参数。这对句子进行分析与描述,观察句子歧义都有着重要的意义。 相似文献
12.
基音周期是表征激励源特征的一个重要参数,在藏语语音处理的研究中具有非常重要的意义.本文首先介绍了基于倒谱分析法进行基音周期检测的基本原理,并在此基础上对藏语语音的基音周期检测进行了仿真研究,同时指出了几个应该注意的问题. 相似文献
13.
藏语词性标注技术在藏文信息处理领域中占有十分重要的地位,本文主要对基于hmm的藏语词性标注技术进行了研究,所实现的词性标注系统主要通过隐马尔科夫模型对训练语料库进行数据统计,获取词性和词汇概率信息,并采用Viterbi算法进行标注。 相似文献
14.
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征, 提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F1值为99.4%。 相似文献
15.
随着英汉语音识别技术的不断发展,对少数民族语言语音识别技术的研究也紧跟其后并取得了一定的成果.藏族人民是中华民族大家庭中不可或缺的一员,藏语语音识别技术研究是语音识别技术研究中不可缺少的重要部分.文章首先对国内藏语言语音识别的研究历程及研究改进之处进行了梳理,其次从藏语言本身的文字特点以及发音特点和要素出发详细介绍了藏语语音识别研究中使用到的基于模板匹配、统计概率模型以及人工神经网络3种方法,并对3种方法各自的特点和适用范围进行了总结归纳,最后从藏语言语音识别研究进展和各识别方法的自身特点出发探讨了语音识别研究中存在的难点问题,并展望了其未来发展的方向. 相似文献
16.
由于藏汉平行语料匮乏,导致藏汉神经网络机器翻译效果欠佳,该文提出了一种将藏语单语语言模型融合到藏汉神经网络机器翻译的方法,首先利用神经网络实现藏语单语语言模型,然后使用Transformer实现藏汉神经网络机器翻译模型,最后将藏语单语语言模型融合到藏汉神经网络机器翻译中。实验表明,该方法能显著提升藏汉神经网络机器翻译质量。基线系统藏语到汉语的BLEU值为21.1,汉语到藏语的BLEU值为18.6,融合藏语单语语言模型后,藏语到汉语的BLEU值为24.5,汉语到藏语的BLEU值为23.3,比原有基线系统的BLEU值分别提高了3.4和4.7。 相似文献
17.
神经网络机器翻译是最近几年提出的机器翻译方法,在多数语言对上逐渐超过了统计机器翻译方法,成为当前机器翻译研究前沿热点。该文在藏汉语对上进行了基于注意力的神经网络机器翻译的实验,并采用迁移学习方法缓解藏汉平行语料数量不足问题。实验结果显示,该文提出的迁移学习方法简单有效,相比短语统计机器翻译方法,提高了三个BLEU值。从译文分析中可以看出藏汉神经网络机器翻译的译文比较流畅,远距离调序能力较强,同时也存在过度翻译、翻译不充分、翻译忠实度较低等神经网络机器翻译的共同不足之处。 相似文献
18.
藏文黏着语是在藏文文字的发展过程中,由于发音需要或者语法需求而产生的.黏着语的存在会对藏文信息处理中的文本规范化带来阻碍.文章通过对黏着语产生的背景和意义进行了解,按照黏着语不同的形成原因进行分类处理,最终实现黏着语的规范化处理. 相似文献
19.
文章通过收集整理藏语拉萨话的音系,归纳出对应的音系特征,依据SAMPA的设计原则并参照汉语和藏语的国际音标,最终设计并实现了藏语拉萨话机读音标系统.藏语机读音标的设计可以为藏语语音工程的实现打下坚实的基础,可以真正地实现文音转换功能. 相似文献
20.
藏语声纹识别技术的研究刚刚起步,建设一个用于藏语声纹识别的语料库迫在眉睫。结合藏语特点,设计、建立了一个面向藏语声纹识别的语料库。语料库包含文本相关、文本无关两部分,文本语料来自新闻报刊、文学类、教育类、科技类、佛学类、历史类和传统文化五明类等文献资料,录音者由来自多个不同藏语方言地区的50人组成,产生了语音语料9 500条,为藏语的声纹识别研究奠定了一定的基础。 相似文献