首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于概率上下文无关文法的句法分析歧义消解新模式   总被引:2,自引:1,他引:2  
基于自然语言句法歧义消解常用的一种概率模型-概率上下文无关文法,融入上下文相关的概率信息,提出一种新的歧义消解计算模式,该模式经测试可以有效地提高句法分析中歧义消解的正确率。  相似文献   

2.
中文词法分析与句法分析融合策略研究   总被引:4,自引:2,他引:2  
利用外部资源是提升句法分析性能的一种有效方法。本文利用中文词法分析器这一外部资源,提出了一种通用转换方法将中文词法分析器与句法分析器有机地融合在一起。通过基于转换的错误驱动学习和条件随机场解决不同切词、词性标注标准间的转换问题。在句法分析方面,本文提出了多子模型句法分析器,将中心词驱动模型和结构上下文模型有效结合在一起。融合后的中文句法分析性能在宾州中文树库1.0版①测试集上F1值达到了82.5%的最好水平。  相似文献   

3.
层级分类概率句法分析   总被引:3,自引:0,他引:3  
对已有的句法分析中引入知识的方法进行了归纳分析,认为多种句法分析方法都可被看作是基于特征标记的分类,然后分析了其中的欠分类和过分类问题.在此基础上,提出一种层级分类短语结构文法和一种层级分类概率句法分析方法(hierarchically classified probabilistic context-free grammar),并设计了一种通过对实例进行聚类来消除句法规则的分类歧义方法.还进一步将层级分类扩展到概率上下文相关句法分析方法,利用上下文相关性的层级分类来解决引入上下文相关时的数据稀疏性问题.通过上述一系列方法有效地克服了过分类与前分类之间的矛盾.  相似文献   

4.
基于词性和语义知识的汉语句法规则学习   总被引:6,自引:0,他引:6  
本文提出了一种汉语句法规则学习的新方法。本方法的特点是:在规则的学习和表示上都利用了词性、语义以及上下文相关的信息。它不仅能自动学习上下文无关的二元规则,而且还能自动发现词类搭配中的歧义结构,并利用语义和上下文相关信息将歧义规则在句法分析之前进行排除。实验结果表明,该方法较好地解决了汉语句法规则的自动获取及排歧问题并极大地降低了句法分析的难度,显示了很好的应用前景。  相似文献   

5.
校园导航系统Easy Nav的设计与实现   总被引:10,自引:0,他引:10  
本文介绍了校园导航口语对话系统EasyNav的设计与实现。在分析了口语对话系统的特点和要求之后,我们提出了适合于对话系统的基于规则的语言理解流程。在这一流程中,句法分析使用GLR分析器处理上下文无关文法(CFG),获取句子结构特征以便为语义分析服务,句法规则照顾到覆盖率和准确率间的平衡。语义分析使用考虑句法约束条件的模板匹配方法,以获取话者意图为目标,并消除句法分析引入的歧义。这一设计的优点是系统容易搭建,也容易扩展。  相似文献   

6.
《计算机科学与探索》2017,(7):1114-1121
句法分析是自然语言理解的一项基础技术,是迈向深层语言理解的基石。目前常用的句法分析方法的语法模型建立在上下文无关文法的假设上。事实上,短语结构树的节点之间具有很强的上下文相关性,充分利用结构信息,可进一步提高句法分析的准确性。融合了句法结构树中的多结构信息(在非终节点中增加父亲节点及左、右姐妹节点等标记)以加强语法规则的上下文约束,并采用结构化支持向量机的方法对句法进行了分析。实验表明,该融合多结构信息的句法分析方法可以消解结构歧义,提升句法分析精确率和F1值。  相似文献   

7.
RNA二级结构预测问题是生物信息学的一个研究重点。该文主要利用自然语言理解中旬法分析的方法来研究RNA二级结构预测。使用基于角色反演算法建立起来的,采用概率上下文无关文法进行分析的句法分析器,来预测RNA二级结构。结合传统Chart算法分析器和广义LR算法分析器的优点,建立角色反演句法分析器;根据RNA二级结构的构建方法建立相应的概率上下文无关文法;给出对RNA二级结构进行预测的具体实例。  相似文献   

8.
本文论述了一种基于二元组合文法的汉语句法结构分析的消除歧义方法。首先给出了二元组合文法的基本概念以及基本思想,然后研究了概率上下文无关文法独立性假设的限性,并针对局限性引入了基于二元组合文法的上下文相关的概率信息,同时提出了一种新的计算分值模式。实验结果证明,这种方法对句法分析过程中的歧义消解是有效的。  相似文献   

9.
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的句法分析。针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词子语类信息的词汇化概率句法分析方法。论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法。实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG。实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高。同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件。  相似文献   

10.
郑伟发 《福建电脑》2009,25(7):71-72
本文采用中科院句法分析树库所采用的短语标记,基于汉语句子结构中上下文相关的特点,计算隐马尔科夫模型的观察概率,并利用隐马尔科夫模型构建汉语自动句法分析模型,从浅层到完全对句法进行分析;同时,利用规则集和最大成组法对划分歧义进行制约和优选。实验证明,该算法能有效地消除歧义并提高句法分析正确率。  相似文献   

11.
随着社会的发展,语言也在不断地发展变化。为了切实掌握维吾尔语当前使用情况,及时把握维吾尔语年度用词的第一手资料,对网络媒体的现代维吾尔语用词进行研究。首先对现代维吾尔语词语的结构进行分析,并给出描述现代维吾尔语词法的结构模型;然后介绍调查使用的语料媒体来源、应用领域、采集的语料时间跨度与统计方法以及统计结果讨论。  相似文献   

12.
面向自然语言信息处理的维吾尔语名词形态分析研究   总被引:2,自引:3,他引:2  
名词是人类语言中的基本词类之一。维吾尔语是一种形态变化很复杂的语言,其中名词是一种形态变化复杂的词类。因此名词的形态分析研究无论在语法研究还是在语言信息处理中都非常重要。本文对维吾尔语名词的形态变化(名词的数、人称、格等语法范畴)进行了形式化的描述和分析。指出了维吾尔语名词的基本形态参数,总结出参数的组配规律并统计了其类型,探索了维吾尔语名词的削尾方法。这些工作将为维吾尔语名词形态处理提供有效的方法和新的思路。  相似文献   

13.
维吾尔语的手语合成有助于改善维吾尔族聋哑人与听力正常人进行自然交流,也可以应用于计算机辅助维吾尔哑语教学、维文电视节目播放等方面。维文手语库是维吾尔语手语合成的基础。通过分析维吾尔手语的特点,采用关键帧插值技术来控制VRML虚拟人的手势动作,利用Visual C++和OpenGL环境实现了一个维吾尔文的手势编辑系统,通过手势运动数据驱动虚拟人来实时显示当前的手势状态。通过该系统,收集了常用的维吾尔语词汇及32个维吾尔字母的手势运动数据。  相似文献   

14.
现代维吾尔语语音识别研究尚处于超始阶段,在此介绍了基于中心距离连续概率模型(CDCPM)的维吾尔语非特定人语音识别。CDCPM用中心距离正态(CDN)分布描述模型特征空间,去掉了HMM的状态转移概率矩阵A,对HMM进行了简化和改进。在维吾尔语综合语音库上进行的实验表明:恰当地估计模型状态数和模型混合密度数,当模型数为525个,模型状态数为16,混合密度数为24,维吾尔语非特定人语音识别首选正识率达到97.90%(集内)和94.76%(集外),取得了较好的识别效果。同时,指出了进一步开展维吾尔语语音识别研究的几个问题。  相似文献   

15.
维吾尔文,汉文和英文等多文种办公套件,对少数民族地区信息化的发展,起着重要作用。该文首先介绍了维吾尔文的特点,然后分析并实现了永中集成Office维吾尔文版设计中的自动选形、按音节断行和自动拉长等处理维吾尔文的关键技术。这些关键技术在维吾尔文版Office中应用后,通过测试能使维吾尔文排版非常规整。同时这些关键技术对维吾尔文文字处理,对其他维吾尔文软件的开发都有普遍地指导作用。  相似文献   

16.
维吾尔语词切分方法初探   总被引:11,自引:9,他引:11  
维语词的词干-词附加成分切分、音节切分的规律对维吾尔语自然语言处理方面提供更多方便。本文提出了以“词=词根+附加成分”结构。维语附加成分种类繁多,连接形式各式各样,在句子中起着非常重要的作用,同时有相当的规律性。本文提出了维语中可能出现的基本语音规律的处理方法,如:语音同化、音节切分、语音和谐规律处理。本文对维文词的词法和语音法结构进行了归纳,提出了维语词切分的一些规律和实现方法。以新疆高校学报为语料来测试,对规则词准确率达到95%。  相似文献   

17.
论文叙述了基于阿拉伯字母的维吾尔文、哈萨克文、柯尔克孜文的OMR信息采集系统的设计方法。首次提出了考试报名信息采集系统中采用的光标识别维吾尔文编码方案,以及开发工具PB10.0版本基于Unicode编码的维、哈、克文信息在数据库信息处理方面要求,光标识别维吾尔文编码的转换处理方法。论文提出的编码方案和转换方法,对基于阿拉伯字母的维、哈、柯文信息采集应用领域有一定的指导和参考意义。  相似文献   

18.
针对LibreOffice套件维吾尔文版本中存在的维吾尔文断行问题,进行了深入的分析和研究,归纳出一系列的维吾尔语断行规则,同时注重对行宽度、美观的需求,探讨了连接字形左边或右边、加连接字符进行拉长、音节符等问题。基于对开源办公软件LibreOffice的本地化框架研究,提出了按音节断行技术和自动拉长技术,设计出维吾尔文的基于音节的断行算法,并使该算法在维吾尔文LibreOffice中得以应用。  相似文献   

19.
在研究Windows CE.Net维语化的过程中碰到的一个难点就是嵌入式平台维语输入问题。在桌面环境下,维语的输入己经非常成熟,但基于Windows CE.NET的嵌入式环境中维文输入是个难题。本论文提出基于软键盘的维语输入法,解决了无键盘的嵌入式环境下的维语输入问题。这种方案具有简单,实用,稳定性好的特点。  相似文献   

20.
维吾尔文手机输入关键技术研究与实现   总被引:2,自引:4,他引:2  
维吾尔文,汉文和英文等多文种手机,对于发展少数民族地区通讯和经济,有非常重要的实用和商业价值。针对以上实际情况,本文首先研究了维吾尔文的书写特点、手机输入法设计中的难点、以及不等宽、不同输入方向的汉、英、维多文种信息的屏幕混合显示问题。根据维吾尔文的特征和手机显示屏幕的物理特征设计了维吾尔文的手机键盘布局,实现了支持多文种混合显示的维吾尔文手机输入法,给出了实现其关键模块功能的程序流程图。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号