首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
Parsing is a fundamental problem in natural language processing. This paper presents a critical overview of the state-of-the-art in statistical parsing technology, including the primary statistical theory, statistical models and the parsing evaluation. At last we give our point on the statistical parsing direction.  相似文献   

2.
在概述统计句法分析主要特征的基础上,对目前主流分析方法进行了深入分析,提出了实用化的基于统计的句法分析器必须引入结构信息、上下文信息、词汇信息以及语义信息才能提高性能和可靠性的观点。总结了基于统计的汉语句法分析方法当前的研究现状,最后探讨了基于统计的汉语句法分析方法的不足之处和发展趋势。  相似文献   

3.
基于动作建模的中文依存句法分析   总被引:1,自引:0,他引:1  
决策式依存句法分析,也就是基于分析动作的句法分析方法,常常被认为是一种高效的分析算法,但是它的性能稍低于一些更复杂的句法分析模型。本文将决策式句法分析同产生式、判别式句法分析这些复杂模型做了比较,试验数据采用宾州中文树库。结果显示,对于中文依存句法分析,决策式句法分析在性能上好于产生式和判别式句法分析。更进一步,我们观察到决策式句法分析是一种贪婪的算法,它在每个分析步骤只挑选最有可能的分析动作而丢失了对整句话依存分析的全局视角。基于此,我们提出了两种模型用来对句法分析动作进行建模以避免原决策式依存分析方法的贪婪性。试验结果显示,基于动作建模的依存分析模型在性能上好于原决策式依存分析方法,同时保持了较低的时间复杂度。  相似文献   

4.
依据剪接位点附近存在的序列保守性出现了多种机器学习识别方法,如基于统计概率的方法、基于隐马尔可夫模型(Hidden Markov Model,HMM)的方法和基于支持向量机(Support Vector Machines,SVM)的方法等,这些方法识别精度较高,但算法过程复杂。基于剪接位点附近碱基之间的相关性和统计特征,构造了一种固定位点上碱基间的网络结构图,并在此网络结构图的基础上提出了基于概率统计特征的剪接位点识别计算公式,利用N269数据库对识别方法和其他传统方法的性能进行了比较。实验结果表明,基于概率统计特征的方法预测人类的剪接位点,有较好的预测效果,与其他的一些算法相比,表现出参数少,精度高等优点。  相似文献   

5.
句法分析是自然语言处理领域中重要的基础研究问题之一。近年来,基于统计学习模型的句法分析方法研究受到了广泛关注,多种模型与算法先后被提出。从采用的学习模型和算法类型着手,该文系统地对各种主流和前沿方法进行了归纳与分类,着重对各类模型和算法的思想进行了分析和对比,并对中文句法分析的研究现状进行了综述;最后,对句法分析下一步的研究方向与趋势进行了展望。  相似文献   

6.
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用Inside-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。  相似文献   

7.
基于统计的汉语组块分析   总被引:10,自引:6,他引:10  
刘芳  赵铁军  于浩 《中文信息学报》2000,14(6):28-32,39
组块分析是一种大大降低句法分析难度的有效手段。本文针对汉语普遍规律,提出了一套符合汉语语言特点的汉语组块体系,并在此基础上设计实现了一种统计与错误驱动相结合的、能够分析有限层次的组块自动识别算法。实验证明,该方法能够有效地处理真实文本中的浅层分析问题,具有较好的准确率和鲁棒性。  相似文献   

8.
利用中间图形系统实现基于特征的信息建模   总被引:3,自引:0,他引:3  
探讨了利用一个中间图形系统,通过特征识别实现基于特征的产品信息建模。通过各应用领域中不同特征集之间的映射实现集成的基本思想,以箱体零件为对象实现了CAD与CAPP的集成。  相似文献   

9.
一种新的基于信息论的PCA特征压缩算法   总被引:5,自引:0,他引:5  
利用Shannon信息论理论,针对矩阵本征值的内在特性,提出了广义信息函数(GIF)、信息率(IR)和累计信息率(AIR)概念,用它度量了特征压缩的程度,建立了一种新的基于信息论的PCA特征压缩算法,并进行了仿真应用,为特征压缩提供了一种新的研究方法.  相似文献   

10.
基于局部优先的汉语句法分析方法*   总被引:24,自引:1,他引:24  
提出了一种利用局部优先信息对汉语分析算法进行优化的新方法,通过利用从语料库中自动获取的结构优先关系数据作为优先判断依据.此方法使目前的汉语概率分析器的整体效率提高了近30%,显示了很好的应用前景.  相似文献   

11.
人体解析因其潜在的应用前景,成为计算机视觉领域重要的研究内容之一.虽然Segnet对全局与局部信息有较好的学习,但该网络只是进行简单的下采样和上采样操作,忽略了特征信息之间的交换学习,本文提出一种基于多层次深度特征交换网络(DFEnet)的人体解析方法.DFEnet网络既兼顾不同分辨率下高维特征学习,又可以满足不同分辨率下的特征交换学习.在DFEnet提取完人体语义特征后,空洞沙漏池化会对提取后的特征进行多尺度学习.在LIP数据集上的实验结果表明本文提出的方法具有更好的解析结果,与SS-JPPnet相比提高了1.4%MIoU,超过Segnet近26.51%MIoU.  相似文献   

12.
在对Dan Bikel基于Collins中心词驱动概率句法分析模型实现的句法分析器进行深入研究分析的基础上,对其进行了两个方面的改进。一是通过提供N-best词性候选序列,改进原模型在词性方面的处理,改善了句法分析的结果;二是在该模型中引进单独的基本名词短语识别,从而降低句法分析的复杂度,提高了效率,其中,针对中文的特点,通过对BaseNP的概念进行一系列的扩展,深入研究了基于不同层次概念的BaseNP对句法分析的影响并探讨更适合中文句法分析的BaseNP定义。利用改进的句法分析模型进行中文句法分析实验,实验结果表明,改进模型可以缩短分析时间26%,提高F值4.4个百分点,交叉括号平均减少18%。  相似文献   

13.
结合结构下文及词汇信息的汉语句法分析方法   总被引:2,自引:0,他引:2  
针对句法分析中上下文无关语法模型对句子信息利用的不足,通过融入结构下文和部分词汇信息,提出两种基于概率上下文无关语法模型的短语结构消歧方法,以达到消解结构歧义的目的;引入分层分析的算法,通过损失一定的时间效率使得在提高分析准确率的同时保证分析结果的全面性。实验结果表明,融入结构下文及词汇信息的汉语句法分析方法,利用了更多的句子信息,与上下文无关语法相比有着更强的消歧能力。  相似文献   

14.
针对传统CAD不能提供材料等非几何信息,且无法实现异种材料物体间的布尔运算,提出了一种可应用于构造异种材料物体的特征布尔运算,包含了由材料决定的布尔差和交运算及新的布尔复形并运算,由特征合并和特征抽取两步完成;并给出了该运算的几何实现、实现算法及实例.  相似文献   

15.
同时跟踪具有丰富表情的人脸多个特征是一个有挑战性的问题.提出了一个基于时空概率图模型的方法.在时间域上,使用几个相互独立的Condensation类型的粒子滤波器分别跟踪人脸的每个特征.粒子滤波对独立的视觉跟踪问题非常有效,但是多个独立的跟踪器忽视了人脸的空间约束和人脸特征间的自然相互联系;在空间域上,事先从人脸表情库中学习人脸特征轮廓的相互关系,使用贝叶斯推理一信任度传播算法来对人脸特征的轮廓位置进行求精.实验结果表明,文中算法可以在帧间运动较大的情况下,鲁棒地同时跟踪人脸多个特征.  相似文献   

16.
目前,大部分句法分析都忽略标点符号这一重要的句法特征或者只进行非常简单的处理。本文根据标点符号的句法结构特性,提出规则分层的方法,将标点融入汉语句法分析中。利用标点符号的分割作用,将长句分成一个个小的句子的序列,并对每个小的句子单元进行句法和结构分析,再根据已经抽取出来的类型规则进行二次句法分析,从而得到一个完整的句法分析树。实验表明,这种方法不但解决了部分长句无法正确得到句法树的难题,而且分析的歧义减小了,效率得到了提高。  相似文献   

17.
概率句法分析器(PCFG Parser)是基于概率规则集的上下文无关文法的句法分析器。规则集主要是针对词类和短语类。然而事实上,词性相同而词汇不同,其所常用的句法规则也通常不同。目前NLP研究的一个趋势和热点就是词汇化的句法分析。针对概率句法分析独立性假设中缺乏词汇化的缺陷,本文将谓语动词的子语类信息与概率句法分析结合起来,提出一种基于动词子语类信息的词汇化概率句法分析方法。论文建立了基于汉语动词子语类框架的统计句法分析模型,并且针对动词子语类框架难以获取的问题,提出一种词汇化概率句法分析与动词子语类框架获取的互动方法。实验利用这种互动的方法获取了汉语中十个常用高频动词的概率化子语类信息,并结合原有的概率句法分析器PCFG实现了一个基于动词子语类信息的概率句法分析器原型系统S-PCFG。实验证明了基于动词子语类信息的概率句法分析对自然语言句法分析的准确率和速度均有所提高。同时分析了新的概率句法分析器的不足之处,为进一步的改进提供条件。  相似文献   

18.
孙季丰  智平华 《计算机工程》2003,29(7):13-14,75
研究了基于内容的图像检索系统和技术的若干问题。首先叙述了基于内容的图像检索的系统模型和特点,接着针对颜色、纹理和形状进行了概率特征提取、相似度量等的进一步具体分析讨论。展示了基于以上理论知识的一些实际工作,介绍了基于颜色和纹理检索的改进实验结果。  相似文献   

19.
形状特征局部操作在实体造型中的实现   总被引:1,自引:0,他引:1  
文章介绍了实体造型中形状特征的局部操作,研究了包含形状特征描述的数据结构,分析了形状特征的分类、框架、特征间的联系及有关操作,分析了欧拉运算及实现思路,在此基础上对实体造型进行局部操作,提高了造型中的运算效率,也对特征造型作了相应的探讨。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号