排序方式: 共有39条查询结果,搜索用时 15 毫秒
1.
通过研究大量包含歧义的短语实例,分析计算机处理过程中遇到的短语结构边界判定的歧义问题。针对"v+n+n"这种常见的歧义格式,采用条件随机场模型进行消歧。结合哈萨克语的语言特点,提出基于哈萨克语词尾的类别及位置信息来构建特征模板的方法。以新疆日报(哈语版)2008年30天的数据统计为实验语料,加入消歧策略后名词短语和动词短语的识别准确率分别达到87.23%和97.46%;召回率分别达到80.12%和95.80%。实验结果表明,将提取出的特征引入到条件随机场模型后,系统的准确率、召回率和F值均有所提高。 相似文献
2.
以哈萨克语基本名词短语识别为目标,实现了哈萨克语基本名词短语自动识别系统。采用基于规则自动识别及人工标注的方法建立基本名词短语标注语料库,在此基础上,采用统计和规则相结合的识别方法,利用互信息进行基本名词短语边界预测,然后根据哈萨克语基本名词短语构成规则对预测边界进行调整,加入标注符,得到最终的识别结果。实验结果表明,两种方法封闭测试的识别精确率分别为80.2%和82.5%。 相似文献
3.
词性标注在自然语言信息处理领域中扮演着重要角色,是句法分析、信息抽取、机器翻译等自然语言处理的基础,对于哈萨克语同样如此。在基于词典静态标注的基础上分析了隐马尔科夫模型HMM(H idden M arkovModel)模型参数的选取、数据平滑以及未登录词的处理方法,利用基于统计的方法对哈萨克语熟语料进行训练,然后用V iterb i算法实现词性标注。实验结果表明利用HMM进行词性标注的准确率有所提高。 相似文献
4.
《Planning》2013,(1)
委婉语是由于禁忌、出于避免刺激、表示尊重或保护自我而采用不直接表达且使人感到动听愉悦的说法。在哈汉两种语言中,委婉语所具有的社会功能基本相同,所以其所蕴含的意义也基本一致。人们在交际和交流中通过使用委婉语,达到使双方感到愉快、胜利的效果。本章对比分析了中文和哈萨克语里使用的跟女性有关的委婉语。 相似文献
5.
6.
《Planning》2019,(9):199-200
学习任何一门语言最重要的就是对其语法的攻克,而哈萨克语名词的"格"在语法中具有特殊地位,且在日常交往中起到很重要的作用。本文在对向格的表义特点及对其用法进行了研究分析,以便零基础学生理解与使用。 相似文献
7.
以哈萨克语通用词汇自动提取为目标,在传统的词语领域使用度的基础上运用改进的词语领域通用度公式进行哈语词汇通用度的计算,使改进的公式对哈语通用词汇的排序位置有更大的影响。基于通用词汇的三大特征:领域通用性、地域通用性、时间通用性,采用统计的方法考察哈语词汇的通用程度,在哈语词频统计的基础上实现了哈语词汇的通用度统计。实验结果表明改进的词语领域通用度计算公式在提取哈语通用词汇时对词语排序位置的影响力度比传统的词语领域使用度计算公式更大。 相似文献
8.
本文实现了一个哈萨克语信息技术领域术语管理系统,阐述了哈萨克语信息技术领域术语管理系统的研究和设计思路,系统的总体框架、基本结构、功能模块以及实现方法等相关的问题。 相似文献
9.
哈萨克语动词短语自动识别研究与实现 总被引:1,自引:0,他引:1
由于哈萨克语基本动词短语Kz Base VP的组成结构比较复杂,并且存在歧义情况和训练语料规模不够大等问题,所以既不能直接使用基于规则的方法,又不能直接使用基于统计的方法来进行处理。所以提出了一种规则与最大熵相结合的方法对哈萨克语基本动词短语(Kz Base VP)进行识别。在该混合策略系统中,根据专属Kz Base VP的特点构建了Kz Base VP搭配规则集,通过规则集对无歧义的Kz Base VP进行标注,其正确率为85.43%;运用基于统计的最大熵模型对存在歧义的Kz Base VP进行识别,根据哈萨克语的单词、词性、词缀和上下文信息等来设计最大熵模型的特征模板,并对模型进行了改进,在解码中选取概率最大的前n个上下文信息分别加入到下一个VP的特征向量中,以此类推直至文本结束,最终选出一条概率最优的VP标注。实验证明,在封闭和开发测试条件下对基本动词短语的识别准确率分别为97.23%和93.22%。 相似文献
10.
以哈萨克语基本名词短语识别为目标,采用基于规则的方法,从基本名词短语结构语法模型出发,利用哈萨克语基本名词短语的词性标记信息及构形附加成分信息,建立了基本名词短语规则集,设计了哈萨克语基本名词短语自动识别系统,实现了对30万词级哈萨克语语料库的基本名词短语标注。实验结果表明,该方法可行,识别精确率达到80.8%。 相似文献