排序方式: 共有34条查询结果,搜索用时 15 毫秒
21.
22.
为解决识别哈萨克语基本短语的问题,提出一种基于条件随机场模型的哈萨克语基本短语自动识别方法。利用基于贪心策略的特征模板自动选择算法,结合哈萨克语基本短语的特点,从众多上下文特征中选取出合适的特征;每次从备选特征模板中挑选出局部最优的特征模板项,加入到最终的特征模板中,进一步提高识别准确率。实验结果表明,该方法的识别准确率和召回率分别达到了89.01%和84.07%。 相似文献
23.
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型之一。从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统。分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价。 相似文献
24.
由于哈萨克语构词法的特点,九个元音的声频特性在语音识别中具有重要的作用。该文采用实验语音学的基本理论和方法,研究了哈萨克语多音节词中的元音格局。针对从语音库中挑选的1 062个多音节词,分别对其词首、词腹和词尾音节中的元音共振峰频率值进行统计,并采用Joos方法详细地归纳和分析了哈萨克语词首、词腹和词尾音节元音格局以及存在的差异,绘制出了哈萨克语多音节词元音的共振峰模式。该项研究结果对哈萨克语的语音研究及应用具有较高的参考价值。 相似文献
25.
26.
27.
针对哈萨克语文本中人名构成特点,提出了一种基于位置概率模型的哈萨克语人名可信度计算方法,构建了一个哈萨克语人名识别系统.系统分为训练和识别两个模块,识别过程是:首先从训练语料中提取特征进行训练,得到一个特征训练模型,然后利用训练好的特征模型及少量的附加规则,对测试文本中的人名进行识别,实验结果表明此方法可行. 相似文献
28.
随着信息技术的不断发展,新的术语层出不穷。在信息技术术语的哈文翻译中由于缺乏统一性和存在的混乱性,在哈文信息技术的教学和研究方面引起很多不必要的误解。本文通过译例分析阐述了哈萨克语信息技术术语翻译的规范化和统一化的必要性,并探讨和分析了如何规范IT术语哈译的问题。 相似文献
29.
<正>新疆哈萨克族人因生活在边疆的寒冷地带,又以牧业为主,养成了喜爱肉食的习惯,主要以羊肉、马肉、牛肉为主。肉类有煮、烤、熏三种吃法,最普通的是手抓肉、烤全肉、熏马肉。熏马肉可谓是哈萨克族美食中的一绝。哈萨克语叫苏热特,产自美丽的伊犁大草原,以素有天马之称的伊犁马为原料。主要熏制技 相似文献
30.
该文阐述了基于统计方法进行哈萨克语IT领域术语识别的研究,并在已有的训练语料基础之上,采用最大熵模型进行标注识别和结合人工方式对错误识别结果进行后处理的分析实验,阐述了该平台的研究和设计思路,系统的总体框架、基本结构、功能模块以及实现方法等相关的问题。实验结果显示该方法识别哈萨克语IT领域术语是有效的,封闭测试结果达到了82.6%。
相似文献
相似文献