首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
藏汉机器翻译技术跟汉英机器翻译技术有所不同,其中,很重要的一个方面,藏语更依赖于格助词等虚词在句子中的作用,格助词种类繁多,用法差异很大。针对藏语格助词进行分析,在藏语短语句法树库的基础上,加入了藏语本体特征的语义信息,形成融合藏语语义信息的藏汉机器翻译方法。通过对比基于短语和句法的实验分析,该方法可以很好地应用于藏汉机器翻译系统。  相似文献   

2.
现代藏语动词的句法语义分类及相关语法句式   总被引:1,自引:3,他引:1  
本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则。本文区分了藏语12大类动词,各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种类型藏语句式的语法结构框架,包括句子的语序、词格标记和句法助词。动词的句法语义分类结果可以直接应用于藏语语法信息词典的构建,是藏语计算处理的重要基础。  相似文献   

3.
藏语句子分割是藏语自然语言处理中的一项重要且基础性的研究工作。该文根据藏语句子结构特征,在分析藏语句子分割规则与难点的基础上,提出一种融合依存句法的藏语句子分割模型。该模型首先通过词嵌入和藏语依存句法信息嵌入将输入序列映射成实值向量;然后构建融合藏语依存句法的双向LSTM,拼接词语和句法信息特征,提高上下文时序特征的学习能力;最后利用CRF预测出最佳句子分割点。通过对比实验,验证了该模型对藏语句子分割的有效性。实验结果表明,该模型的F1值为99.4%。  相似文献   

4.
藏语语料库词类描述方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
藏语词类的基本属性描述是藏语语料库多级加工的基础,根据藏语语料库多级加工的实际需要,通过对藏语词类的语法、语义信息的描述和藏语词语后添加方式的分析,可以为计算机对藏文的词语搭配结构、语法信息、语义信息和词类标记进行自动处理提供一个切实可行的方法。  相似文献   

5.
朱臻  孙媛 《中文信息学报》2015,29(6):220-227
该文提出了一种基于SVM和泛化模板协作的藏语人物属性抽取方法。该方法首先构建了基于藏语语言规则的模板系统,收集了包括格助词、特殊动词等具有明显语义信息的特征建设模板并泛化。针对规则方法的局限性,该文在模板的基础上,采用SVM机器学习方法,设计了一种处理多分类问题的层次分类器结构,同时对多样化的特征选取给予说明。最后,实验结果表明,基于SVM和模板相结合的方式可以对人物属性抽取的性能有较大提高。  相似文献   

6.
藏语句子边界的正确识别是藏文文本处理首先要解决的问题。而藏语书面语中标点符号的特殊性是造成藏语句子边界识别困难的主要原因。该文主要对现代书面藏语中常见的以藏语助动词结尾的藏语句子边界识别进行研究,结合藏文标点符号的特点提出藏语助动词结尾句子边界识别方法。  相似文献   

7.
一种创建事件模式的新方法   总被引:1,自引:0,他引:1  
马彦波  张蕾 《微机发展》2005,15(1):20-23
信息抽取系统中,通常需要创建大量的模式,因此创建模式是信息抽取系统中的一个关键问题。文中对创建事件模式,提出了一种新方法———根据格语法变换创建事件模式。通过对一类动词(含有施事格、受事格、时间格、处所格)的变换方法的研究,给出了这种变换方法的形式化描述,从而为抽取句子层事件提出了一个通用的方法,并且该方法是与领域无关的。通过一个信息抽取系统实例,验证了该方法是可行的、有效的。  相似文献   

8.
信息抽取系统中,通常需要创建大量的模式,因此创建模式是信息抽取系统中的一个关键问题.文中对创建事件模式,提出了一种新方法--根据格语法变换创建事件模式.通过对一类动词(含有施事格、受事格、时间格、处所格)的变换方法的研究,给出了这种变换方法的形式化描述,从而为抽取句子层事件提出了一个通用的方法,并且该方法是与领域无关的.通过一个信息抽取系统实例,验证了该方法是可行的、有效的.  相似文献   

9.
短语作为语言分析的一个层次,占有十分重要的位置。有效的短语分析对降低其后句法分析的难度,缩小句法分析器的搜索空间,提高机器翻译的翻译正确率是很有帮助的。而目前面向信息处理的藏语短语的研究刚刚起步,有待于进一步发展。 该文在藏语短语与藏语句子的界线研究的基础上,根据藏语信息处理的特点和要求,按照语法功能和便于计算机自动分析和处理的原则对短语进行分类,并规定了信息处理中藏语短语类别单位的标记代码。  相似文献   

10.
格作为解释以谓词为中心·反映其它成分以何种关来伴随述语的语义关来的工具, 对于研究分析表面结构规范、语法多‘ 现比较明显的自然语言昨常有利。本文以韩国语为研究对家, 利用格文法对其句子进行分析研究, 总结出了韩语句子的三个特点, 在充分论证的基础上, 提出了韩语句子的格规则等。本文目的在于建立韩语的句子模型, 即格模型。  相似文献   

11.
该文提出了一种规则和藏字语法分析相结合的藏字自动校对算法, 不使用藏字字典和大规模语料库。通过研究藏字构字语法,得到藏字的结构特征,进而对藏字的字母组合进行分段处理,简化藏字构字复杂度,研究出各分段部分的构字规则,然后按照规则进行字的校对。实验表明,系统对现代藏文字的查错率达100%。  相似文献   

12.
随着藏语语音合成研究的深入,藏语同形异音词的读音问题成为影响合成系统自然度和可懂度的主要障碍。藏语同形异音词与汉语中多音词的性质有所不同,仅仅依靠词典不一定能解决问题。该文从藏语本身独有的语言规则和语音特点出发,依据《藏汉大词典》,在其所列出的常用藏语同形异音词的基础上,共收集整理了465个同形异音词,然后从372 320个句子文本中统计出了同形异音词在藏语文本中的出现频率及不同读音的使用频率,并深度辨析了藏语同形异音词的构词形式、分类以及在具体文本中出现的形式,最后结合实例提出了具体的消歧方法及实验结果,为语音合成系统的前端文本分析模块提供了有力依据。  相似文献   

13.
才藏太 《计算机工程与应用》2012,48(26):127-130,147
随着自然语言信息处理的不断发展和完善,大规模语料文本处理已经成为计算语言学界的一个热门话题。一个重要的原因是从大规模的语料库中能够提取出所需要的知识。结合973前期项目《藏文语料库分词标注规范研究》的开发经验,论述了班智达大型藏文语料库的建设,分词标注词典库和分词标注软件的设计与实现,重点讨论了词典库的索引结构及查找算法、分词标注软件的格词分块匹配算法和还原算法。  相似文献   

14.
藏文地名识别是藏文命名实体识别中必须要解决的问题。通过分析藏文地名的特点及识别难点,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别,通过实验,验证了6种特征对藏文地名识别的有效性。实验结果表明该方法对藏文地名识别的准确率、召回率和[F]值分别达到了96.12%、81.92%和88.45%,实验结果与已有的系统相比,取得了较好的效果。  相似文献   

15.
藏文计算机通用键盘布局与输入法研究   总被引:9,自引:0,他引:9  
为了改进现有各种藏文计算机键盘布局与输入法,本文依据键盘布局的基本理论、若干原则、相关科学数据和基于藏文语料库的字符、部件、音节、词汇统计数据,遵循藏语语法规则及其特殊性,在对键盘键位的属性进行专门研究的基础上,研制出“一键多符”和“一键到位”的智能化藏文计算机通用键盘布局与输入法,其藏文文本的键盘输入速度和效率成倍提高,对藏文印刷、办公自动化和信息处理具有广泛的使用价值。  相似文献   

16.
藻饰词语义网络的构建研究   总被引:1,自引:0,他引:1  
藻饰词作为一种藏语词汇的特殊的语言表达形式,涉及到藏民族的生活的方方面面.随着藏语信息化的发展成为藏文信息处理中所关注的问题.首先对藏语藻饰词概念进行了界定,结合实例分析了藻饰词,进一步探讨了藏文藻饰词的语义网络的构建,即藻饰词语义场的结构与组织方法.从而更多的为计算机提供藻饰词的语义、语用层面上的信息.  相似文献   

17.
在现代藏文自动校对中,对音节字()的校对是其基础。现代藏文二维的书写格式和独特的文法,还有格助词的黏着现象、音节字搭配规则和音节字中真词和非词错误等众多问题,使得对藏文自动校对的研究有别于英语和汉语的自动校对。针对现代藏文中音节字的特点,通过音节字预处理、字表匹配、混淆集匹配、二元接续关系、最小编辑距离法等方法对现代藏文音节字的自动校对进行详细论述。  相似文献   

18.
以语言学的理论和方法为主导,在藏文信息处理中引入了藏语词语的信息化和形式化,并对构建的信息库进行了结构上的总体设计,从而制定了信息处理用藏语词语信息库的构建原则及收词规则,即一形一项、一时(式)一项、一义一项。为此构建了以藏文词汇为主的音、形、义等的信息库。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号