首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理据,并探讨了“依句辨品”和“指称化”等汉语词类相关理论在中文信息处理中的实现方式。  相似文献   

2.
梳理了汉语语法学界对“句式”这一术语的认识分歧;从中文信息处理角度分析了当前本领域句法分析和树库构建缺乏句式结构的现状;对黎氏语法形式化研究作了一个最新的综述,指出其在句式结构方面的优势和仍存在的不足;以黎氏语法图解法为原型改造设计出一种新型的汉语图解析句法,具体包括图形化的句法结构表示和结构化的XML存储格式。  相似文献   

3.
潜在语义分析在中文信息处理中的应用   总被引:11,自引:2,他引:11  
潜在语义分析是一种关于自然语言信息提取和再现的理论方法,它通过代数的方法提取语义空间中潜在结构。论文叙述了潜在语义分析的基本理论方法,概述了这种方法所建立的潜在语义空间的数学意义;然后通过一个简单示例说明LSA在中文信息处理中的分析方法,并通过分析结果中文本间、词汇间关联度的变化来说明LSA在中文信息处理中的重要意义。  相似文献   

4.
为支持基于句式结构的大规模树库建设与研究,该文设计了人机结合的可视化语法图解标注系统,通过句式结构的框架约束和词汇知识库的底层支持有效规范了标注结果的结构层次和词性标记,在一定程度上保证了树库标注的一致性和高效率。该文从实践角度介绍了基于句式结构的语法图解标注系统在辅助构建大规模汉语树库中的操作模式和功能。  相似文献   

5.
基于语法信息的汉语韵律结构预测   总被引:8,自引:4,他引:8  
韵律结构的预测, 主要包括短语的自动切分和重音的等级分布两个大的方面。本文在概述汉语韵律结构的基础上, 根据从自然话语中获得的韵律结构与句法结构和词性的关系, 用一种新的方法,通过文本分析,全面地预测韵律边界的位置分布及其等级差异,并进一步预测重音的位置分布及其等级差异。  相似文献   

6.
SSD模型及其在汉语词性标注中的应用   总被引:1,自引:0,他引:1  
该文提出了一种以符号解码与数值解码并举的SSD(Symbol-and-Statistics Decoding Model)模型,该模型被用于汉语词性标注任务,其标注正确率在封闭测试中达到97.08%,开放测试中达到95.67%,较二阶HMM的95.56%和94.70%都有较为显著提高。SSD模型的正确率虽然不及最大熵模型和CRF模型,但它的训练时间远少于后者,说明SSD模型在处理自然语言中的特定任务时是一种较强的实用模型。  相似文献   

7.
并行程序中的语法制导及其应用   总被引:1,自引:1,他引:0  
语法制导的程序设计环境是一个包括有编辑、执行和查错等工具系统的交互式程序设计环境.在借鉴了串行程序设计环境中语法制导思想的基础上,提出了在并行C 程序中实现语法制导的思路和方法,解决了实际中遇见的一些新问题.在实际开发过程中这些方法和技术被证明是有效和可行的.  相似文献   

8.
语音语法是ASR的重要参考依据,在基于VoiceXML的语音增值业务中应用越来越广泛。本文首先介绍VoiceXML与语法的关系,然后描述了语音识别原理,并推导出常用的Nuance语法形式逻辑表达式。在此基础上,我们成功构建了一个极具应用价值和市场前景的VAD系统,并着重阐述了其中语音语法的应用。  相似文献   

9.
工业机器人的一个发展趋势是具备良好的人机界面,而自然语言理解控制将是最理想的人机接口技术。本文以自然语言理解技术中的格语法为理论基础,结合工业机器人的特点,提出了一种有效的汉语句子分析算法。通过应用于装配机器人,验证该算法的可行性。  相似文献   

10.
介绍了范畴的基本定义,说明范畴论和传统集合论的区别,并结合实例,讨论了范畴语法在自然语义分析中的简单应用。  相似文献   

11.
该文提出了以谓词为核心的块依存语法,以谓词为核心,以组块为研究对象,在句内和句间寻找谓词所支配的组块,利用汉语中组块和组块间的依存关系补全缺省部分,明确谓词支配关系。根据块依存文法体系,目前共标注2 199篇文本,涵盖百科、新闻两个领域,共约180万字语料。该文简述了块依存文法的原则,并对组块及其依存关系进行了定义。该文详细介绍了标注流程、标注一致率、数据分布等情况。基于现有的树库,该文发现汉语中有约25%的小句是非自足的,约有88%的核心谓词可支配1~3个从属成分。  相似文献   

12.
The paper presents some main progresses and achievements in Chinese information processing. It focuses on six aspects, i.e., Chinese syntactic analysis, Chinese semantic analysis, machine translation, information retrieval, information extraction, and speech recognition and synthesis. The important techniques and possible key problems of the respective branch in the near future are discussed as well.  相似文献   

13.
《信息处理用GB13000.1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而,在实际运用上却存在着部件数量太大,部件定义难以操作,部件拆分组合不易掌握等难处。造成困难的原因主要有: (1) 基础部件主要靠列表来确定, (2) 部件强调按理切分和成字组合, (3) 过多依赖“组字能力”的判别, (4) 过分注重部件数量的限制。要走出“难”的困境,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明,这种方法是行之有效的。  相似文献   

14.
中医药古文献语料库设计与开发研究   总被引:1,自引:2,他引:1  
专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。  相似文献   

15.
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用Inside-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。  相似文献   

16.
无模型自适应控制(Model-Free Adaptive Control,MFAC)作为一种不依赖于系统数学模型、简单、有效具有广泛适用性的先进控制方法,已经在很多的复杂过程中得以应用,取得了良好的控制效果;针对中药生产浓缩过程中受控对象的特点,将MFAC的基本模型进行了改进和组合,给出了更适应中药浓缩过程的控制方案,并将控制方案应用于工程实践,运行结果表明该控制方法能较好的控制蒸发过程中的温度及压力,保证稳定的双效循环蒸发,控制效果良好.  相似文献   

17.
在“现代汉语句法语义信息语料库”的基础上,我们将相对独立的句型系统、句模系统和句干系统有机整合在一起,建立了一个有层级体系的句系系统。并将[P]、[SP]、[SPO]、[PO]定义为基础句型,利用解析法,考察了基础句型对应的高频句模在复杂句模生成机制中的主体作用,此外还考察了补语、状语同语义成分的对应情况。通过寻求简单句型和复杂句型、简单句模和复杂句模之间的组合映射规律,从而找到句型句模对应机制研究的一个新的突破点。  相似文献   

18.
哈萨克文信息处理的现状和发展方向   总被引:1,自引:0,他引:1  
在信息日趋网络化的时代,作为中文信息处理中的子项哈萨克文信息处理技术也开始一步一步地进入研究当中,该文介绍了哈萨克文信息处理技术的现状、研究发展方向和一些关键概念、基本要素以及今后哈萨克文信息处理技术发展中存在的和需解决的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号