排序方式: 共有111条查询结果,搜索用时 15 毫秒
1.
2.
该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体化效果比分步进行的效果好,准确率、召回率和F值分别提高了0.067、0.073和0.07。但词级标注模型难以解决词边界划分的一致性和未登录词的问题。基于此,作者提出可以利用字性和字构词的规律预测合成词的词性,既可以融入语言学知识又可以减少由未登录词导致的标注错误,实验结果证明,作为词性标注的后处理模块,基于字性标注的词性预测准确率提高到了0.916,这个结果已经比分词标注一体化结果好,说明字性标注对纠正词性错误标注有明显的效果。
相似文献
相似文献
3.
文章通过收集整理藏语拉萨话的音系,归纳出对应的音系特征,依据SAMPA的设计原则并参照汉语和藏语的国际音标,最终设计并实现了藏语拉萨话机读音标系统.藏语机读音标的设计可以为藏语语音工程的实现打下坚实的基础,可以真正地实现文音转换功能. 相似文献
4.
自然语言处理用藏语格助词的语法信息研究 总被引:2,自引:1,他引:1
该文主要探讨了藏语格助词的语法信息、语义信息、功能结构等内容,从而为建立藏语格助词的语法属性库提供详实的参数。这对句子进行分析与描述,观察句子歧义都有着重要的意义。 相似文献
5.
藏文黏着语是在藏文文字的发展过程中,由于发音需要或者语法需求而产生的.黏着语的存在会对藏文信息处理中的文本规范化带来阻碍.文章通过对黏着语产生的背景和意义进行了解,按照黏着语不同的形成原因进行分类处理,最终实现黏着语的规范化处理. 相似文献
6.
基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。被广泛应用到语音合成、语音识别等领域。本文介绍了一种基于AMDF的语音基音周期检测方法,较好的提取了语音的基音周期。 相似文献
7.
8.
基音周期是表征激励源特征的一个重要参数,在藏语语音处理的研究中具有非常重要的意义.本文首先介绍了基于倒谱分析法进行基音周期检测的基本原理,并在此基础上对藏语语音的基音周期检测进行了仿真研究,同时指出了几个应该注意的问题. 相似文献
9.
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F1值为99.4%。 相似文献
10.
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性.选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典.讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集.建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案. 相似文献