期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李琳龙从军《中文信息学报》2013,27(4):59-63

判断动词与存在动词在藏语中使用频度高,兼类现象频繁,在不同语境下具有不同的含义。既可以表示判断、存在和领有意义,也可作为语法标记表达复杂的体貌、示证意义。判断、存在动词的多功能性给藏文文本分词标注、句型识别等工作带来较大的困难。借助藏语语法的研究成果和真实藏文文本,我们对这两类词的上下文语境进行了分析和归纳,进而提出了辨别这两类词的方法。首先,考察判断动词和存在动词在不同语境下的左右特征词;然后,建立了识别规则库,从肯定与否定两个方面判别其词性并标注。相似文献

2.

现代藏语动词的句法语义分类及相关语法句式 总被引：1，自引：3，他引：1

江荻《中文信息学报》2006,20(1):39-45

本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则。本文区分了藏语12大类动词,各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种类型藏语句式的语法结构框架,包括句子的语序、词格标记和句法助词。动词的句法语义分类结果可以直接应用于藏语语法信息词典的构建,是藏语计算处理的重要基础。相似文献

3.

句类中E块的作用及其判定策略 总被引：1，自引：0，他引：1

王厚峰《计算机科学》2000,27(5):64-67

1 引言在一个句子中,谓语起着极其重要的作用。多年来,无论是以句法分析为主的自然语言处理,还是以语义分析为主的自然语言理解,都把对谓语的确定作为句子分析的关键因素。首先,从句子的构成形式上看, 可以通过谓语的类型,判断句子是无宾语,单宾语,还是双宾语,甚至是小句作宾语;其次,从意义上看,又可以通过它得到句子的主语和宾语所具备的基本语义信息,是人还是物,是具体概念还是抽象概念,或者,从格的角度讲,是施事格还是受事格等。HNC理论同样肯定谓语所起的作用,同时认为,一方面“谓语”的内涵过泛,另一方面对谓语的复合构成缺乏深层的揭示。为此,它引入了表示特征的E(igen)语义块基元的概念, 由它构成特征语义块EK。同时还引入了三类广义对相似文献

4.

利用主语和谓语的句法关系识别谓语中心词 总被引：4，自引：0，他引：4

李国臣孟静《中文信息学报》2005,19(1):2-7,41

谓语中心词识别对于整个句子的句法分析起着重要的作用。目前已有的谓语中心词识别方法,利用谓语中心词候选项的静态语法特征和动态语法特征来确定谓语中心词。在此基础上,本文提出一种利用句子的主语和谓语之间的句法关系来识别谓语中心词的方法。该方法除了利用谓语中心词候选项的静态语法特征和动态语法特征外,还利用主谓语之间的句法关系识别谓语中心词。实验表明,与传统方法相比,这种方法对谓语中心词的识别正确率可以提高3%左右。相似文献

5.

法语无人称句的构成与用法分析

郑贞爱《计算机科学》2008,(3)

法语无人称句是由纯粹的无人称动词、相对的无人称动词以及从有人称动词借用的无人称动词构成.无人称句中,一般情况下,中性代词il为形式主语,而真正的主语是动词后面的名词、不定式和从句等,动词只用第三人称单数形式.从无人称动词、某些有人称动词构成的无人称句、某些代动词构成的无人称句以及半无人称句四个方面,通过例句阐述了无人称动词及无人称句的构成、特点与用法. 相似文献

6.

汉语块扩句的自动分析

韦向峰张全《计算机科学》2010,37(4):183

块扩句是一类概念预期知识十分明确的句子。基于概念层次网络理论介绍了块扩句对应的块扩句类,总结了能够激活块扩句类的典型块扩动词。根据块扩动词的概念知识得到句子的特征语义块及块扩句类,依据块扩句类的知识对句子进行检验后可给出句子句类的分析结果。在已有的句类分析系统的基础上对真实语料中的块扩句进行了自动分析,实验表明正确率达到了71.29%,错误主要来自特征语义块动词辨识、动词多句类代码等。正确分析块扩句将有助于解决汉语句子的多动词处理难点。相似文献

7.

基于特征结构的汉语连动句语义标注研究

陈波姬东鸿吕晨《中文信息学报》2013,27(5):60-67

对汉语特殊句型的语义分析是当前中文信息处理的难点之一。现有的传统语义分析方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联。该文以汉语连动句为例,提出了基于特征结构模型的语义标注方法,探讨了连动句的语义标注模型,并在此基础上建构了一个大规模的汉语语义资源。结果表明,特征结构模型能够对连动句中的主语与多个谓语动词、多个宾语之间的复杂语义关系进行全面准确的描述,为面向汉语的自然语言处理提供了一种不同的语义分析方法。相似文献

8.

一种基于HBase的RDF数据存储改进方法

《软件》2019,(12):13-17

相似文献

9.

基于神经网络的中文谓语动词识别研究

李婷秦永彬黄瑞章程欣宇陈艳平《数据采集与处理》2020,35(3):582-590

识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方法。在此基础上,研究了一种基于Attentional-BiLSTM-CRF神经网络的中文谓语动词识别方法。该方法通过双向递归神经网络获取句子内部的依赖关系,然后用注意力机制建模句子的焦点角色。最后通过条件随机场（Conditional random field, CRF)层返回一条最大化的标注路径。此外,为解决谓语动词输出唯一性的问题,提出了一种基于卷积神经网络的谓语动词唯一性识别模型。通过实验,该算法超出传统的序列标注模型CRF,在本文标注的中文谓语动词数据上到达76.75%的F值。相似文献

10.

基于马尔科夫逻辑网的中文专利最大名词短语识别

蔡东风赵奇猛饶齐王裴岩《中文信息学报》2016,30(4):21-28

缺少标注语料和难以识别动词和名词类是阻碍中文专利最大名词短语识别的主要问题。针对上述问题,该文提出了一种基于马尔科夫逻辑网的中文最大名词短语识别方法。该方法避免对开放类的名词短语的识别,而将主要精力放在了相对封闭的分隔符的识别上,利用句子自身特征、领域迁移特征以及双语对齐特征来识别最大名词短语的边界。结果说明,双语信息较好地促进了动词、介词、连词等MNP边界的识别。MNP识别的F值可达83.27%。相似文献

11.

Complex predicates in Indian languages and wordnets

Pushpak Bhattacharyya Debasri Chakrabarti Vaijayanthi M. Sarma 《Language Resources and Evaluation》2006,40(3-4):331-355

Wordnets, which are repositories of lexical semantic knowledge containing semantically linked synsets and lexically linked words, are indispensable for work on computational linguistics and natural language processing. While building wordnets for Hindi and Marathi, two major Indo-European languages, we observed that the verb hierarchy in the Princeton Wordnet was rather shallow. We set to constructing a verb knowledge base for Hindi, which arranges the Hindi verbs in a hierarchy of is-a (hypernymy) relation. We realized that there are unique Indian language phenomena that bear upon the lexicalization vs. syntactically derived choice. One such example is the occurrence of conjunct and compound verbs (called Complex Predicates) which are found in all Indian languages. This paper presents our experience in the construction of lexical knowledge bases for Indian languages with special attention to Hindi. The question of storing versus deriving complex predicates has been dealt with linguistically and computationally. We have constructed empirical tests to decide if a combination of two words, the second of which is a verb, is a complex predicate or not. Such tests provide a principled way of deciding the status of complex predicates in Indian language wordnets. 相似文献

12.

Representing natural language with Prolog

Geetha T.V. Subramanian R.K. 《Software, IEEE》1990,7(2):85-92

The authors describe the use of Prolog to build a syntactic list structure and a syntactic-semantic structure and to incorporate the semantic structure into a background structure that conveys the meanings of the individual words in the sentence in the context of general work knowledge. This semantic structure is then placed in the context of the sentence being parsed. Rather than rely solely on case grammar to represent the functions of words in a sentence, the authors have extended this technique to include a frame structure (which gives semantic details of the verb and the relations of other words to it) for a sentence's verbs to build the syntactic-semantic structure. Using this frame structure conveys more information than using only the case-grammar approach. The authors then place the syntactic-semantic structure in the context of its background knowledge, using the principles of partitioned networks in which word meanings are placed in a hierarchical structure that represents the background knowledge.<> 相似文献

13.

Toward a computational model of aspect and verb semantics

Winfield S. Bennett Tanya Herlick Katherine Hoyt Joseph Liro Ana Santisteban 《Machine Translation》1990,4(4):247-280

The authors examine aspect and the semantic classification of verbs, two areas of concern for natural language processing not often studied in the context of computational linguistics. A five-way aspectual classification system is defined on the basis of three aspectual features, making use of the concept of predicates as event structures. The aspectual value of a sentence can differ from that of its predicate due to the operation of aspectual functions. Sentential aspect is ultimately derived from the operation of various components of the sentence on the aspectual properties of the predicate. A system of twelve semantic features describing the core meaning of verbs provides a level of specificity that can distinguish different senses of verbs and could be used to predict their consequent syntactic and semantic behavior. The computational utility of these models will be tested on a working machine translation system.Also affiliated with Siemens Public Switching SystemsThis paper is written in conjunction with a research project funded by the Texas Higher Education Coordinating Board Advanced Research Programs, Grant No. 1631. The paper is a collective effort of the five authors. Although individual members of the group wrote particular portions, the entire group discussed and revised all parts of this work. We are jointly responsible for its contents. We wish to thank the journal's anonymous referees for their extremely helpful comments. 相似文献

14.

汉语语句核心动词的自动获取研究

韦向峰熊亮张全《计算机工程与应用》2007,43(10):179-182

语句核心动词的自动获取是以动词为中心的汉语语句分析中的重要组成部分。依据概念层次网络理论,在字词概念符号的基础上获取候选动词集合,根据动词的上下文语言环境对动词进行排除和分类处理,对可能作为语句核心动词的动词集合按照作语句核心结构的可能性大小排队,并验证其正确性。实验结果表明,在从真实语料切分得到的3121个语句中,经过排队处理后前三个动词作为语句核心动词的正确率达到了83%。错误分析表明进一步完善知识库及排除排队规则,还可以提高自动获取语句核心动词的正确率。相似文献

15.

汉语句子谓词的自动识别方法研究

下载免费PDF全文

谌志群《计算机工程与应用》2007,43(17):176-178

谓词的自动识别是浅层句法分析的重要内容。以汉语的“谓词中枢论”为语言学基础,详细分析了汉语句子中谓词所处的上下文环境,讨论了影响谓词出现的主要语境因素。提出了一种基于统计学原理的汉语句子谓词自动识别概率模型,通过极大似然估计对谓词候选词在句中充当谓词的概率进行近似计算,利用绝对折扣模型对参数进行平滑。在小规模语料库上进行的实验显示,谓词识别率最高分别达到了80.6%（动词性谓词）和83.2%（形容词性谓词）,表明了该方法的可行性和有效性。相似文献

16.

基于最大熵模型的汉语标点句缺失话题自动识别初探

卢达威宋柔《计算机工程与科学》2015,37(12):2282-2293

本文的任务是判别标点句缺失话题是上句的主语还是宾语,将该任务作为标点句缺失话题自动识别研究的切入点。首先归纳了判别这一任务的一系列字面特征和语义特征,然后结合规则和最大熵模型,进行自动判别实验。结果显示,对特定类别动词的实验F值达到82%。对实验结果的分析说明,动词特征和语义特征对判别该任务的作用最大,规则方法和统计方法在判别任务中不能偏废,精细化的知识对判别的性能有重要影响。相似文献

17.

Toward discourse representation via pregroup grammars

Anne Preller 《Journal of Logic, Language and Information》2007,16(2):173-194

Every pregroup grammar is shown to be strongly equivalent to one which uses basic types and left and right adjoints of basic types only. Therefore, a semantical interpretation is independent of the order of the associated logic. Lexical entries are read as expressions in a two sorted predicate logic with ∈ and functional symbols. The parsing of a sentence defines a substitution that combines the expressions associated to the individual words. The resulting variable free formula is the translation of the sentence. It can be computed in time proportional to the parsing structure. Non-logical axioms are associated to certain words (relative pronouns, indefinite article, comparative determiners). Sample sentences are used to derive the characterizing formula of the DRS corresponding to the translation. 相似文献

18.

面向司法数据的事件抽取方法研究

下载免费PDF全文

贾阵丁泽华陈艳平黄瑞章秦永彬《计算机工程与应用》2023,59(6):277-282

司法数据中的事件主要用于描述案件中犯罪主体和客体之间行为状态的改变,通过识别司法事件能有效地支撑智能化辅助办案研究。目前,现有事件抽取技术主要通过触发词识别事件,然后根据预定义的模板抽取对应参数。其主要缺点是只能抽取预定义的事件类型,并且抽取的事件不一定是句子语义表达的中心。针对上述问题,提出一种基于谓语中心词的司法事件定义方法,并搭建一个结合字词语义信息的神经网络模型。该模型采用字的Embedding获取字的语义信息,并通过CNN获得词特征信息。将词特征信息结合后,使用Cross-BiLSTM交叉学习字词交互信息在上下文的依赖表示,由CRF计算出每个字的最优标签路径。通过实验表明,该模型在司法数据集上的F1值达到84.41%,超出对比方法4.8%。相似文献

19.

面向EBMT的汉语单句谓语中心词识别研究 总被引：9，自引：3，他引：9

穗志方俞士汶《中文信息学报》1998,12(4):40-47

在基于实例的汉英机器翻译( EBMT) 系统中,为计算语句相似度,需要对句子进行适当的分析。本文首先提出了一种折中的汉语句子分析方法———骨架依存分析法,通过确定谓语中心词来把握句子的整体结构,然后,提出了一种根据汉英例句集中英语例句的谓语中心词来识别相应的汉语例句的谓语中心词的策略。实验结果是令人满意的。相似文献