首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 921 毫秒
1.
以维吾尔语小学语文教材语料为验证对象,利用从语法语义相结合角度制定的《现代维吾尔语词干词类标注标记集》,对维吾尔语小学语文教材词干进行了词性标注,验证该标记集规范的可行性、适应性和可靠性。首先介绍小学语文教材电子语料库;其次讨论《信息处理用现代维吾尔语词干词类标注标记集》的基本情况和多策略现代维吾尔语词干标注系统模型设计与算法;最后分析现代维吾尔语词性标注标记集验证结果,并验证《信息处理用现代维吾尔语词干词类标注标记集》的科学性,补充和改正部分词类的语义分类及标注代码,提出了规范的扩充建议。  相似文献   

2.
该文阐述了对词一级的维吾尔语框架语义网络构建过程中,制订和规范化维吾尔语框架语义角色的语义类型和标注标记符集、短语类型和标注符号集、句法功能的标注符号集的研究。研究内容对基于阿拉伯字符的维吾尔语框架语义成分的依存关系、语义角色分解与自动识别技术,语义角色知识库的构建和自动标注等相关技术提供基础研究服务。  相似文献   

3.
该文从蒙古文信息处理角度出发,着重参考了其他语言语义角色标注的理论方法和蒙古语语义角色相关研究成果,结合蒙古语依存句法树库的特征,通过手工标注分析研究,制定了基于依存语法的蒙古语语义角色分类及其标记。  相似文献   

4.
远程监督是关系抽取领域重要的语料扩充技术,可以在少量已标注语料的基础上快速生成伪标注语料。但是传统的远程监督方法主要应用于单语种文本,维吾尔语等低资源语言并不能使用这类方法得到伪标注语料。针对上述问题,提出一种针对维汉的跨语言远程监督方法,在无语料的情况下利用现有的汉语语料进行维语语料的自动扩充。将远程监督视为文本语义相似度计算问题而不是简单的文本查找,从实体语义和句子语义2个层面判断维语和汉语句子对是否包含同一关系,若为同一关系则将已有的汉语标注转移到维语句子上,实现维语语料从零开始的自动扩充。此外,为有效捕获实体的上下文和隐藏语义信息,提出一种带有门控机制的交互式匹配方法,通过门控单元控制编码层、注意力层之间的信息传递。人工标记3 500条维语句子和600条汉语句子用于模拟远程监督过程并验证模型的性能。实验结果表明,该方法 F1值达到73.05%,并且成功构造了包含97 949条维语句子的关系抽取伪标注数据集。  相似文献   

5.
语义角色标注研究对自然语言处理具有十分重要的意义。英汉语语义角色标注研究已经获得了很多成果。然而藏语语义角色标注研究不管是资源建设,还是语义角色标注的技术探讨都鲜有报道。藏语具有比较丰富的句法标记,它们把一个句子天然地分割成功能不同的语义组块,而这些语义组块与语义角色之间存在一定的对应关系。根据这个特点,该文提出规则和统计相结合的、基于语义组块的语义角色标注策略。为了实现语义角色标注,文中首先对藏语语义角色进行分类,得到语义角色标注的分类体系;然后讨论标注规则的获得情况,包括手工编制初始规则集和采用错误驱动学习方法获得扩充规则集;统计技术上,选用了条件随机场模型,并添加了有效的语言特征,最终语义角色标注的结果准确率、召回率和F值分别达到82.78%、85.71%和83.91%。  相似文献   

6.
提出了一种词汇和本体概念间的语义相似度计算方法。该方法利用编辑距离和维基百科从语法和语义两方面综合考虑词汇和概念间的语义相似度。在领域本体的指导下,将方法应用于语义标注过程,建立词汇与本体概念之间的映射。在标注过程中建立知识库,提高算法性能,实验结果说明该方法是行之有效的。  相似文献   

7.
词语隐喻意义的机器识别和正确翻译是机译的难点。提出了语义语法模式的概念、提取方法以及一种基于语义语法模式集、固定搭配集和变量表示库的英语隐喻识别与汉译的合一算法。语义语法模式集包括语法隐喻模式集、词汇隐喻模式集、字面意义模式集、短语模式集、构句模式集等子集。以人体词为研究对象,构建了英语人体词的语义语法模式集、固定搭配集和变量表示库。实验表明,该方法能有效解决英语人体隐喻的识别与汉译问题。  相似文献   

8.
手语是一门语言,手语语言学家从语言学的角度,对手语做了类似"语法"的总结而形成了音韵标注理论.针对目前中国手语无符号标记体系的现况,首先,根据中国手语的特点并结合汉语的语言习惯,文中提出了中国手语音韵标记体系.其次,针对目前音韵标注只给出一些形式化的描述或简单的手工标注的现况,文中借助基于数据手套的中国手语识别系统,提出了以手形数据模板与拉班舞谱相结合的方法,将上述的标记体系在计算机上以自动标注的方式加以实现.最后,针对数据手套的中国手语识别系统缺少先验信息的现况,应用上述音韵标记体系构建具有先验语义信息的易混词集,在构建的过程中说明并分析了音韵标记体系具备语义识别能力.实验表明,在基于统计识别的易混词集与基于先验语义信息的易混词集的识别效果相比较,在不改变统计模型的条件下,可以不同程度地辅助HMM,SOFM/HMM,Effort提高识别率.  相似文献   

9.
设计并实现一个词汇知识获取及语义计算平台VKASCP,以及自然语言处理所需要的基础功能模块。系统主要功能模块包括合成词识别、合成词词性标注及分词修正、主题词提取、词汇语义计算,以及基于主题词集的自动文摘和文本相似度计算。VKASCP融文本语料库、词汇知识库于一体,为词汇知识获取及语义计算提供了一个良好的研究平台,并为今后构建词汇语义知识库打下了坚实的基础。  相似文献   

10.
句法分析是自然语言处理的基础技术,主流的由数据驱动的神经网络句法分析模型需要大规模的标注数据,但是通过人工标注扩展树库成本很高,因此如何利用现有标注树库进行数据增强成为研究焦点。在汉语句法分析的数据增强任务中,对于给定的标注树库,要求数据增强所生成的句子满足如下条件:第一,要求生成句具有多样化且完整的句法树结构;第二,要求生成句具有合理的语义。对此,我们首次提出基于词汇化树邻接语法的数据增强方法。针对第一个需求,该文设计实现基于词汇化树邻接语法的词汇化树抽取算法与句法树合成算法,基于该语法可以在句法树之间进行“接插”和“替换”的操作,从而推导生成新的句法树,并且用语言学的知识保证生成句符合语法规则且具有完整的句法树结构。针对第二个需求,该文利用语言模型对生成句进行语义合理性评估,选取语义合理的句子作为最终的增强数据,从而获取高质量的标注树库。我们以汉语为例开展研究,在汉语树库CTB5上进行句法分析的数据增强评测实验。实验结果显示,在小样本(CTB5的20%)实验中,通过该方法得到的增强数据使依存句法分析和成分句法分析的精度分别提高1.39%和2.14%。在鲁棒性实验中,该文通过构建扩展...  相似文献   

11.
该文在南京师范大学语言科技研究所《元语言研究》项目组的研究成果上,对其建构的释义元语言系统进行简单介绍并通过软件对《释义元语言词表》、《现汉受限词汇表》、《释义元语言微型词典》等若干词表作了查询、增补、修改等一系列功能,以完成对释义元语言和释义词的完善工作。  相似文献   

12.
This paper describes two steps in the generalization of supervisory control theory to situations where the specification is modeled by a deterministic context free language (DCFL). First, it summarizes a conceptual iterative algorithm from Schneider et al. (2014) solving the supervisory control problem for language models. This algorithm involves two basic iterative functions. Second, the main part of this paper presents an implementable algorithm realizing one of these functions, namely the calculation of the largest controllable marked sublanguage of a given DCFL. This algorithm least restrictively removes controllability problems in a deterministic pushdown automaton realizing this DCFL.  相似文献   

13.
由于微机的功能不断扩大,微机CAD用户不断增加,为适应微机CAD软件开发的要求,我们对微机CAD系统中的用户界面进行了研究.本文主要介绍菜单设计原理和方法,如主菜单和子菜单之间的结构关系.菜单项的定义和设计、菜单与应用程序之间的接口关系以及如何保存和恢复被菜单覆盖掉的屏幕上的有关信息等.本系统的程序采用C语言编写,可在286、386或486微机上运行,使用较为方便.  相似文献   

14.
New methods of documenting languages with digital technologies has led to a multitude of different formats that are difficult to reuse over time. To overcome the problems surrounding the portability of digital language documentation, linguists are in the process of formulating best-practice recommendations to increase the likelihood of their work's long-term survival. This paper describes the implementation of a comprehensive set of current best-practice recommendations pertaining to content, format, discovery, access, citation, preservation, and rights in the context of the language documentation efforts of the Texas German Dialect Project. This project is different from others in that it is not primarily concerned with digitizing and archiving existing recordings. Instead, the archive it is creating is the end-result of a research project whose workflow begins with data-collection in the filed and ends with depositing digitized and annotated language materials in a web-accessible digital archive of Texas German. This paper shows how a number of conflicting best-practice recommendations can be resolved, thereby satisfying the diverse needs of academic research, teaching, and outreach to the community. As such, the results reported here are an important contribution to the search for strategies guaranteeing the long-term survival of digital language documentation resources.
Hans Christian BoasEmail:
  相似文献   

15.
古汉语双字词自动获取方法的比较与分析   总被引:1,自引:0,他引:1  
词汇的自动获取在自然语言生成、计算词典编纂、句法分析以及语料库语言学等领域均有着重要的研究价值。该文针对古汉语双字词的自动获取问题,以《史记》全文语料为例,分别应用基于频率、互信息、假设检验的统计方法获取古汉语双字词,并结合人工标注结果进行了详细的比较和分析,评价了各方法的优缺点及可靠性,为不同应用背景下的古汉语双字词自动获取提供了相应的解决方案。  相似文献   

16.
多层DGMM识别器在中国手语识别中的应用   总被引:4,自引:0,他引:4  
吴江琴  高文  陈熙霖  马继涌 《软件学报》2000,11(11):1430-1439
手语是聋人使用的语言,是由手形动作辅之以表情姿势由符号构成的比较稳定的表达系统 ,是一种靠动作/视觉交际的语言.手语识别的研究目标是让机器“看懂”聋人的语言.手 语识别和手语合成相结合,构成一个“人-机手语翻译系统”,便于聋人与周围环境的交 流.手语识别问题是动态手势信号即手语信号的识别问题.考虑到系统的实时性及识别效率, 该系统选取Cyberglove型号数据手套作为手语输入设备,采用DGMM(dynamic Gaussian mixt ure model)作为系统的识别技术,并根据中国手语的具体特点,在识别模块中选取了多层识 别器,可识别中国手语字典中的274个词条,识别率为97.4%.与基于单个DGMM的识别系统比 较,这种模型的识别精度与单个DGMM模型的识别精度基本相同,但其识别速度比单个DGMM的 识别速度有明显的提高.  相似文献   

17.
汉语比较句识别研究   总被引:2,自引:0,他引:2  
比较是常见的表达方式,提取事物之间的比较关系是一项新颖而有实用价值的研究。识别自然语言中的比较句,是提取比较关系的一个重要步骤。目前还没有针对汉语比较句的自动识别研究,语言学上比较句的哪些特征能够应用到自动识别上来是一个亟待研究的问题。该文讨论了汉语比较句的范畴、外延和特征,定义了汉语比较句识别的任务,并提出用SVM分类器将汉语句子分为“比较”和“非比较”两类。该文比较了比较句的语言学特征和统计特征,包括特征词、序列模式等在分类中的作用。实验结果表明:基于类序列规则的SVM分类器能够有效地识别汉语比较句,效果优于传统基于词的文本分类。  相似文献   

18.
基于自动问答系统的信息检索技术研究进展   总被引:2,自引:0,他引:2  
汤庸  林鹭贤  罗烨敏  潘炎 《计算机应用》2008,28(11):2745-2748
自动问答是根据用户以自然语言提出的问题给出一个明确的答案。近年来,自动问答越来越受到信息检索和自然语言处理的研究者的关注。典型的自动问答系统通常包含问题分析、文段检索和答案选择等部件。介绍了自动问答的最新研究进展和相关国际会议情况,着重阐述问题分类、查询扩展、文段检索和答案选择这四个热点技术的主要功能和常用方法,最后提出存在的一些问题和展望。  相似文献   

19.
As a marked increase in the number of musculoskeletal disorders was noted in many industrialized countries and more specifically in companies that require the use of hand tools, the French National Research and Safety Institute launched in 1999 a research program on the topic of integrating ergonomics into hand tool design. After a brief review of the problems of integrating ergonomics at the design stage, the paper shows how the "Quality Function Deployment" method has been applied to the design of a boning knife and it highlights the difficulties encountered. Then, it demonstrates how this method can be a methodological tool geared to greater ergonomics consideration in product design.  相似文献   

20.
于剑 《自动化学报》2016,42(5):668-669
讨论了语言的三指功能(指名、指物、指心)与图灵测试的关系,指出早期的人工智能研究一般假设语言三指等价,因此致力于实现其中之一的功能.如果一个功能实现了,其他两个功能也就实现了, 比如图灵测试将智能的表现限定在指名功能里.但是,现代科学已经证明,语言三指不一定等价.这给人工智能的研究带来很大挑战,本文罗列了一些开放性问题,如对话的理论计算机制等.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号