期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

于洪志高璐李永宏郑文思《中文信息学报》2012,26(4):66-73

该文选取具有代表意义的藏语卫藏方言的拉萨话、安多方言的夏河话以及康方言的德格话进行语言调查;整理归纳藏语三大方言音系,包括单辅音、复辅音、单元音、复合元音和辅音韵尾,以及三大方言声调;依照SAMPA的规则建立适合于藏语三大方言的机读音标,并设计了SAMPA_ST的自动标注系统,实现文音转换功能,为语音的韵律特征分析和语音工程的研究提供依据。相似文献

2.

面向汉语统计参数语音合成的标注生成方法

下载免费PDF全文

郝东亮杨鸿武张策张帅郭立钊杨静波《计算机工程与应用》2016,52(19):146-153

针对汉语统计参数语音合成中的上下文相关标注生成,设计了声韵母层、音节层、词层、韵律词层、韵律短语层和语句层6层上下文相关的标注格式。对输入的中文语句进行文本规范并利用语法分析获得语句的结构和分词信息;通过字音转换获得每个汉字的声韵母及声调;利用TBL（Transformation-Based error driven Learning）算法预测输入文本的韵律词边界和韵律短语边界。在此基础上,获得输入文本中每个汉字的声韵母信息及其上下文结构信息,从而产生统计参数语音合成所需的上下文相关标注。设计了一个以声韵母为合成基元的普通话的基于隐Markov模型（HMM）的统计参数语音合成系统,通过主、客观实验评测了不同标注信息对合成语音音质的影响,结果表明,上下文相关的标注信息越丰富,合成语音的音质越好。相似文献

3.

基于词向量的藏文词性标注方法研究

郑亚楠珠杰《中文信息学报》2017,31(1):112-117

藏文词性标注是藏文信息处理的基础,在藏文文本分类、自动检索、机器翻译等领域有广泛的应用。该文针对藏文语料匮乏,人工标注费时费力等问题,提出一种基于词向量模型的词性标注方法和相应算法,该方法首先利用词向量的语义近似计算功能,扩展标注词典;其次结合语义近似计算和标注词典,完成词性标注。实验结果表明,该方法能够快速有效地扩大了标注词典规模,并能取得较好的标注结果。相似文献

4.

基于规则与统计相结合的藏文文本自动查错方法研究

完么扎西尼玛扎西《中文信息学报》2022,36(2):69-75

针对目前藏文文本自动查错方法的不足,该文提出了一种基于规则和统计相结合的自动查错方法.首先以藏文拼写文法为基础,结合形式语言与自动机理论,构造37种确定型有限自动机识别现代藏文字;然后利用查找字典的方法识别梵音藏文字;最后利用互信息和t-测试差等统计方法查找藏语词语搭配错误和语法错误等真字词错误,实现藏文文本的自动查错... 相似文献

5.

基于互联网搜索与反馈验证的图像自动标注

下载免费PDF全文

俞建松曹冬林李绍滋林达真《计算机工程》2012,38(24):211-215

基于网页的图像自动标注存在图像与文本的关联假设问题,而基于内容的方法则存在数据规模小的问题。为此,将基于内容和基于网页的自动标注方法相结合,提出基于互联网搜索和反馈验证的图像自动标注方法。利用网页关联文本从互联网搜索结果中提取候选标注词,根据候选标注词在搜索得到图片的内容特征进行反馈验证。实验结果表明,该方法具有大规模标注能力,准确率比基于网页的图像自动标注方法提高了7.92%。相似文献

6.

中文文本词性自动校对系统的实现

钱揖丽郑家恒《电脑开发与应用》2004,17(1):25-27

提出了一种从正确标注的训练语料中自动获取兼类词词性较对规则的方法 ,并设计和实现了相应的词性自动校对系统。通过对中文文本进行自动校对 ,进一步提高其词性标注质量相似文献

7.

藏语拉萨话单音节嗓音声学参数分析

陈小莹艾金勇于洪志《中文信息学报》2015,29(3):184-189

该文对藏语拉萨话单音节的嗓音特征进行了实验研究,实验首先对藏语拉萨话单音节进行语音标注,然后根据语音标注的位置信息,利用对应的程序提取音节结构中的元音和辅音的嗓音声学参数,对基频、开商和速度商分别统计分析,并做了显著性分析。实验结果表明不同元音和辅音的嗓音参数与发声方式以及其在音节中位置有关,元音和音节结构的不同会显著影响开商和速度商的值,但对于基频数据的影响并不显著。同时嗓音参数之间也存在一定的关联性,即基频和开商、速度商之间是反比关系,开商和速度商之间是正比的关系。相似文献

8.

利用SAMPA实现藏语的字音转换

下载免费PDF全文

刘博杨鸿武甘振业郭威彤《计算机工程与应用》2011,35(35):117-121

机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)即计算机可读的音标,用计算机可读的ASCII字符表示语言的发音。提出了一种藏语的SAMPA标注的设计方案SAMPA-T(Tibetan),以藏语拉萨话为例列出了它们的辅音和元音对应的国际音标与SAMPA-T标注,并实现了面向SAMPA-T的藏语字音转换,可应用于藏语语音合成等藏语语音信息处理中。相似文献

9.

信息处理中藏语虚词“na”和“la”的标注研究

才让三智多拉《数字社区&智能家居》2011,(10)

藏文信息处理已经从最初字处理转向了自然语言处理的阶段。现如今正逐步向句法分析、语句分析、自动文摘、自动分类和机器翻译迈进。但是这些都基于词的层面上研究处理,而词则受许多格标记和虚词的制约。因此,在藏文信息处理中对格标记的分词标注更是一件棘手和复杂的事。该文通过研究藏文信息中的兼类虚词na和la,提出了如何在不同的语境中,处理和解决这类词性的标注问题。相似文献

10.

藏语判断、存在动词识别策略

李琳龙从军《中文信息学报》2013,27(4):59-63

判断动词与存在动词在藏语中使用频度高,兼类现象频繁,在不同语境下具有不同的含义。既可以表示判断、存在和领有意义,也可作为语法标记表达复杂的体貌、示证意义。判断、存在动词的多功能性给藏文文本分词标注、句型识别等工作带来较大的困难。借助藏语语法的研究成果和真实藏文文本,我们对这两类词的上下文语境进行了分析和归纳,进而提出了辨别这两类词的方法。首先,考察判断动词和存在动词在不同语境下的左右特征词;然后,建立了识别规则库,从肯定与否定两个方面判别其词性并标注。相似文献