期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

卢达威《中文信息学报》2021,35(10):21-31

话题的延续和转换是篇章中重要的语用功能。该文从句首话题共享的角度对话题延续和转换进行了分类,分为句首话题延续、句中子话题延续、完全话题转换、兼语话题转换、新支话题转换五种,进而对话题转换的特殊情况——新支话题展开研究。基于33万字的广义话题结构语料库,该文对新支话题的句法成分、语义角色进行了统计和分析。通过句法成分分析发现,宾语从句或补语从句主语、主谓谓语句小主语、状性成分起始句主语、句末宾语、连谓句非句末宾语、兼语句兼语、介词宾语甚至状语等都能成为新支话题,从而引出新支句,其中,句末宾语作为新支话题的情况最多,但未发现间接宾语作为新支话题的情况;语义角色分析发现,大部分主体论元(施事、感事、经事、主事)和客体论元(受事、系事、结果、对象、与事)及少数凭借论元(方式)和环境论元(处所、终点)能成为新支话题引出新支句。同时,系事和受事成为新支话题的情况最显著;施事、结果和对象次之;原因和目的等论元难以成为新支话题。该文的研究揭示了句法、语义对话题转换这一语用现象的一种可能的约束途径,有助于人和计算机更深入地理解汉语篇章的话题转换机制,以期将这种语用现象逐步落实到语义直至句法的形式中,最终实现计算机对话题转换的自动分析。相似文献

2.

三元搭配视角下的汉语动词语义角色知识库构建

王诚文钱青青荀恩东邢丹李梦饶高琦《中文信息学报》1986,34(9):19-27

动词语义角色一直是国内外语言学界研究的重点和难点。在自然语言处理领域,相关的语言资源也在逐步构建。对于汉语而言,国内大部分工作集中在语义角色标注上。该文创造性地提出了一种三元搭配的动词语义角色知识表征形式,并在前人研究的基础上,提出了一套语义角色分类体系。在该体系指导下,对汉语动词进行了穷尽式的语义角色认定及相关知识加工,以构建汉语动词语义角色知识库。截至目前,该工程考察了5 260个动词,加工了语义角色及引导词的动词数量为2 685个,加工认定语义角色4 307个。相似文献

3.

商务印书馆新书目录《汉语图解词典》

《中文信息学报》2009,23(1)

《汉语图解词典》系国家汉办招标项目,是一本供外国人学习汉语的工具书。该词典利用语义关联模式,将汉语词语分15个主题,142个话题,以大量直观的图片来解释4200余条词语,涵盖社会生活真实场景中的常见元素。在图中相应的位置标出序号,配以简体汉字、拼音和英语释义。除名词、动词、形容词外,还收录大量词组,方便学习者全方位掌握汉语词汇。相似文献

4.

基于词语聚类的汉语口语自动推送素材研究

杨冰冰赵慧周王治敏《中文信息学报》2022,36(6):155-161

新冠肺炎的蔓延使得线上移动教学成为教育发展的必然趋势,该文以适合为学习者自动推送的汉语口语素材为研究对象,抽取10 341条生活类口语语料,对词汇的整体特点进行计量分析,在此基础上采用腾讯AL LAB公开的中文词向量数据,使用K-means算法对口语词汇进行词语聚类。参考词语聚类结果及对口语语料话题和场景的考察,该文构建了一个包含15个一级话题、102个二级话题及81个交际场景的汉语口语话题—场景素材库,同时对各级话题常用词进行了总结。该文可为教材自动定制的素材库提供资源支持。相似文献

5.

基于特征结构的汉语连动句语义标注研究

陈波姬东鸿吕晨《中文信息学报》2013,27(5):60-67

对汉语特殊句型的语义分析是当前中文信息处理的难点之一。现有的传统语义分析方法存在一些问题,不能很好的反映汉语中各个词语或成分之间的语义关联。该文以汉语连动句为例,提出了基于特征结构模型的语义标注方法,探讨了连动句的语义标注模型,并在此基础上建构了一个大规模的汉语语义资源。结果表明,特征结构模型能够对连动句中的主语与多个谓语动词、多个宾语之间的复杂语义关系进行全面准确的描述,为面向汉语的自然语言处理提供了一种不同的语义分析方法。相似文献

6.

《现代汉语动词语义知识词典》的开发与应用

孙道功亢世勇《中文信息学报》2018,32(10):19-27

该文吸收已有动词研究的相关成果,提出了动词语义词典开发的相关原则和研制思路,界定并描写了词典中所涉及的相关属性信息,并对词典的总体文件结构及其各个库的信息进行了描写和说明。最终开发了融合词汇语义和句法语义,涵盖词形、词性、释义、义类、义场、句法范畴信息、语义范畴信息、语义句模等多种信息参数的开放性的动词语义知识词典。该词典可以在歧义分化、词义关系考察、句法—语义接口、句模抽取等方面提供支持。相似文献

7.

基于广义话题理论的话题句识别

蒋玉茹宋柔《中文信息学报》2012,26(5):114-120

汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一。该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务单个标点句的话题句识别和序列标点句的话题句序列构建。识别出标点句的话题句也就找到了标点句句首缺失的话题。该文解决单个标点句的话题句识别任务,主要采用语义泛化和编辑距离两种手段。实验中开放测试的准确率比基线高出12.51个百分点。该结果说明,运用广义话题理论进行单个标点句的话题句识别可产生明显的效果。相似文献

8.

基于众包的词汇联想网络的获取和分析

丁宇车万翔刘挺张梅山《中文信息学报》2013,27(3):100-107

词典是汉语自然语言处理中非常重要的一类资源,它能为汉语词法句法以及语义分析等提供资源支撑。该文采用众包方法构建汉语语义相关性词典,该词典是通过触发词联想的方式间接获取的,因此又称为词汇联想网络。词汇联想网络相比传统词典具有以下特点 (1)获取代价低;(2)面向互联网,易扩展;(3)词语关系从人的认知角度来建立,符合人的直觉。该文详细介绍词汇联想网络的获取方法并对已获取的数据进行分析,另外,将词汇联想网络与《知网》、《同义词词林》以及微博文本ngram进行比较说明其上述特点。相似文献

9.

汉语短文话题提取系统中SDTF*PDF算法的研究

陈科贾焰杨树强王永恒《计算机应用》2005,25(1):14-16

互联网技术得到迅速发展以来,大量信息尤其是文本信息在网上传播。文中面向海量汉语短文话题提取系统中多信源、短文篇幅小的特点,结合词汇语义相似性度量,提出了一个词汇权重计算算法---SDTF PDF(ShortDocumentTermFrequency ProportionalDocumentFrequency),测试表明,基于该算法的汉语短文话题识别系统能够较准确地在海量中文文本信息中自动提取一段时间内(一天或一周,可以指定)的主要话题。相似文献

10.

基于规则的“把”字句语义角色标注

何保荣邱立坤徐德宽《中文信息学报》2017,31(1):84-93

“把”字句是现代汉语中一种重要的特殊句式,该文尝试用基于知识库的规则方法对把字句进行语义角色自动标注。首先,我们从《人民日报》语义角色标注语料库中收集把字句例句,形成一个覆盖范围较广的把字句例句库;之后,对例句库中把字句的句法和语义构成规律进行手工标注,标注内容包括谓语动词的配价类型、把字句谓语结构类型、把字句句模类型等。在上述标注的基础上,对把字句的句模构成规律进行分析,总结出若干条语义角色标注规则;最后,在测试数据上对前述规则进行验证,语义角色标注的最终正确率为98.61%,这一结果说明该文所提出的规则在把字句语义角色标注上是有效的。相似文献

11.

基于次范畴化的汉语多义动词模糊聚类

韩习武赵铁军《软件学报》2006,17(2):259-266

描述了应用模糊k均值方法聚类汉语多义动词的实验,共涉及到60个汉语动词,40个多义词,20个单义词.首先,自动获取每个动词的次范畴化框架的概率分布,然后,导出这些动词的模糊聚类.结果表明,纯洁度和对精确度的综合量度较好地反映了聚类性能,尽管动词的句法行为在一定程度上体现了深层语义,但汉语动词的句法行为不易从单一的语义层预测出来. 相似文献

12.

基于生成词库论和论元结构理论的语义知识体系研究

袁毓林《中文信息学报》2013,27(6):23-31

该文讨论如何构造合适的汉语语义描写体系并建设相应的语义知识库,从而为文本语义的计算机自动分析提供可靠的资源。文章提出的技术路线是在生成词库论和论元结构理论的指导下,分别描写名词的物性结构和动词、形容词的论元结构(包括物性角色或论元角色集合及其句法配置格式集合),标定名词、动词和形容词的情感评价色彩,揭示相关名词、动词和形容词的物性角色和论元角色之间的关联和推导关系,从而形成比较完整的关于名词、动词和形容词的实体指称、概念关系和情感评价等多层面的语义知识。最后,还展示了这种多层面的语义知识在语义自动计算中的运用案例。相似文献

13.

基于语义模式的英语动词汉译

下载免费PDF全文

张瑶黄德根《计算机工程》2011,37(19):150-152

英语动词正确汉译是机器翻译的难点.为此,提出一种基于动词语义模式库、固定句式库和变量库的英语动词汉译算法.介绍语义模式的提取方法,构建常用动词的语义模式库、固定句式库和变量库,归纳动词语义模式的3种结构形式:V语义模式,VO相邻语义模式和VO非相邻语义模式.动词语义模式库由上述3种结构形式对应的模式库构成.实验结果表明... 相似文献

14.

汉语块扩句的自动分析

韦向峰张全《计算机科学》2010,37(4):183

块扩句是一类概念预期知识十分明确的句子。基于概念层次网络理论介绍了块扩句对应的块扩句类,总结了能够激活块扩句类的典型块扩动词。根据块扩动词的概念知识得到句子的特征语义块及块扩句类,依据块扩句类的知识对句子进行检验后可给出句子句类的分析结果。在已有的句类分析系统的基础上对真实语料中的块扩句进行了自动分析,实验表明正确率达到了71.29%,错误主要来自特征语义块动词辨识、动词多句类代码等。正确分析块扩句将有助于解决汉语句子的多动词处理难点。相似文献

15.

现代藏语动词的句法语义分类及相关语法句式 总被引：1，自引：3，他引：1

江荻《中文信息学报》2006,20(1):39-45

本文突破了传统藏文文法关于动词分类的简单描述,建立起以句法语义为纲要的动词类别和相关句法规则。本文区分了藏语12大类动词,各类动词都有不同论元数量和不同句法性质的要求。因此,动词的句法语义类别划分能够较细致和全面反映各种类型藏语句式的语法结构框架,包括句子的语序、词格标记和句法助词。动词的句法语义分类结果可以直接应用于藏语语法信息词典的构建,是藏语计算处理的重要基础。相似文献

16.

一种用于中文文本查重的双因子相似度算法

刘小军赵栋姚卫东《计算机仿真》2007,24(12):312-314

为了提高搜索引擎的检索效率以及加强知识产权保护,结合汉语语言学以及自然语言处理的研究成果,提出了一种用于中文文本查重的算法.通过引入"动词中心词"的概念,扩展停用词的范围,将文本中的部分动词组成动词序列作为文本特征串,结合串匹配算法,计算出中文文本间语法相似性.同时根据IFIDF方法提取文本特征并进行权重计算,计算出中文文本间的语义相似性.结合文本间语法相似性和语义相似性得到文章的相似度,可以判断两篇中文内容的相似性,有效地进行重稿检测. 相似文献

17.

基于双层语料过滤器的短语抽取方法

林波 林伟佳 郭靖羽 丁东辉 黄翰 《计算机与现代化》2015,(12):7

文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息抽取不能完整表达文本片段的语义信息。短语本身包含较为丰富的细粒度语义信息,更能表达出文本片段的主题性。本文提出基于双层语料过滤器（词性过滤器与短语扩展规则过滤器）的方法来进行文本语料的冗余信息过滤并抽取文本主题短语信息。实验证明,本文的方法具有一定的可靠性和应用性。相似文献

18.

汉语篇章时间短语的分析与时制验算 总被引：5，自引：0，他引：5

马红妹王挺陈火旺《计算机研究与发展》2002,39(10):1211-1220

汉英机器翻译中，汉语篇章的时间信息是生成正确英语词时态的基础，时制是时间信息重要组成部分，需要在篇间中通过时间短语的语义分析获得，首先对汉语篇章时间短时间了语义分类，然后设计了时间短语语义表示结构TPSRS，用概念信息体关联网络CIURN表示了汉语篇间语境知识，给出了在篇章语境中分析时间短语的算法TPPA，提出了通过时制验算来推导汉语篇章中时间短语的时制和事件的时制，最后在汉英机译系统ICENT中进行了实现，对已知写作时间的汉语篇章取得了较好的实验结果。相似文献

19.

汉语动词资源馆(Chinese Verb Library)的构建

汪梦翔王厚峰刘杨饶琪《中文信息学报》2014,28(6):85-94

该研究以动词的语义聚合层次为核心,构建了含有四个语义层级的动词分类系统,依托生成词库理论、语义格框理论和构式语法理论,从事件结构、语义格框架、物性角色、句法格式四个角度来对动词的自身属性以及组合性等特征进行描述,从而构造出能够解释并深入描述动动之间、动名之间甚至是超常搭配用法的汉语动词资源馆Chinese Verb Library(CVL)。实验表明,该研究可以为句法分析、语义角色标注、尤其是揭示隐含的谓间关系提供新的支持。相似文献