首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
本文结合“才”字句的基本句式,考察了副词“才”的句法组合功能,并着重分析了“才”的四种基本语义。指出这四种基本语义可以两两地归并为“表示事物的量”和“表示限定/排他”两种语义。并在此基础上进一步地归纳出副词“才”的深层语法意义——表示说话者对比客观事实与主观标准后作出的倾向性评判。  相似文献   

2.
“是”字句是现代汉语中比较特殊的、又是比较常见的一种句子形式,对其主语部分和宾语部分的自动界定和标注将有助于机器翻译、信息检索、信息提取等的研究。本文通过考察语料中“是”字句的句法表现,总结、提取了“是”字句的自动标注规则,对《人民日报》一个月语料中的“是”字句进行了自动标注。实验结果表明,对没有逗号的句子,标注正确率可达到99%以上;对有逗号的句子,标注正确率为89%。  相似文献   

3.
该文构建了一个规模为11万字的,包含自然语料、对外汉语教材语料和汉语中介语语料的小型“把”字句可比语料库,制订了“把”字的句法语义标注框架,对语料库中1 556个“把”字句进行了句法语义标注,开发了检索界面,探讨了可比语料库在“把”字句教学与研究中的应用。数据显示: 汉语教材中表示具体空间转移、描述动作的方式和次数、信息转移、致使类的“把”字句偏多,但表示抽象空间转移、判断或认同类的“把”字句偏少。学习者对于结果类“把”字句掌握较好;教材中S+把+N+V+状态补语、S+把+N1+V+N2等五种结构形式的“把”字句偏多,但S+把+N1+V为+N2、S+把+N1+V到+N2等六种结构形式的“把”字句偏少。学习者须依次加强S+把+N+V+趋向补语、S+把+N1+V到+N2等17种结构形式的“把”字句的学习。研究认为汉语可比语料库可为对外汉语教材研究、教材编排、二语习得研究、课堂教学提供数据支持与语料基础。  相似文献   

4.
表达“差比”义的“比”字句,是比较句的主要句型,也是比较句关键要素抽取研究中不可回避的主要课题。该句型的关键要素(SUB、BI、OBJ、ITM、DIM、RES、EXT)在语义上互相交织,在表层句法上可以实现为多种多样的序列模式。该文面向中文“比”字句关键要素抽取这个目标,对于表示“差比”义的460多个“比”字句文本进行了七种关键要素的标注。在此基础上,利用Apriori和PrefixSpan算法找出这些要素的关联规则及其序列模式,并归纳出六种“比”字句关键要素的分布规律。此外,该文还进一步说明了产生这六种模式规则的动因,为“比”字句特征选取和处理提供了重要的语言学理论依据。  相似文献   

5.
网络查询分类对提高搜索引擎的搜索质量有重要的意义。该文通过对真实用户查询日志的分析和标注,发现四种特征词(称之为“VASE”特征词)对查询分类起决定性作用。我们提取特征词并构造了一个特征词倒排索引,用于对查询进行主题分类。在此基础之上,提出了基于网络扩展和加权特征词的方法改善分类的效果。实验结果显示,基于此分类方法的正确率和召回率分别达到78.2%和77.3%。  相似文献   

6.
~~关于《是C语言的“漏洞”吗?》一文的再商榷$河北科技大学@袁志民  相似文献   

7.
8.
王正山 《电脑开发与应用》2003,16(9):F002-F002,F003
本刊2002年第10期刊登了李敏教师的一篇文章<是C语言的"漏洞"吗?>.  相似文献   

9.
本文通过在实际工作中遇到的一个总理2,对其作细致分析,从而找出规律,发现特点,进而解决问题,具体地介绍了PLC编程的一种思路和方法。  相似文献   

10.
本刊讯IBM公司的系统管理解决方案在最近的国家税务总局“金税”工程网络建设招标项目中一举中标。 金税工程是我国经济信息化工作的重点工程,是全国税务信息化工作的重要组成部分,而金税工程网络建设(以下简称“金税网络,’)又是金税工程的重点和关键。“金税网络”作为金税工程的基础设施要为整个税务信息化工作服务。 IBM此次中标的产品是IBMTivoli EnterPrise系统管理软件及网络管理平台,硬件采用 IBM RS 6000小型机。“金税”工程网络建设首期工程覆盖5个省、4个直辖市、4个计划单列市,将建成国家税务总局到省局、省局到市局、…  相似文献   

11.
在“现代汉语句法语义信息语料库”的基础上,我们将相对独立的句型系统、句模系统和句干系统有机整合在一起,建立了一个有层级体系的句系系统。并将[P]、[SP]、[SPO]、[PO]定义为基础句型,利用解析法,考察了基础句型对应的高频句模在复杂句模生成机制中的主体作用,此外还考察了补语、状语同语义成分的对应情况。通过寻求简单句型和复杂句型、简单句模和复杂句模之间的组合映射规律,从而找到句型句模对应机制研究的一个新的突破点。  相似文献   

12.
支持重音合成的汉语语音合成系统   总被引:1,自引:1,他引:1  
针对基于单元挑选的汉语语音合成系统中重音预测及实现,本文采用了知识指导下的数据驱动建模策略。首先,采用经过感知结果优化的重音检测器,实现了语音数据库的自动标注;其次,利用重音标注数据库,训练得到支持重音预测的韵律预测模型;用重音韵律预测模型替代原语音合成系统中的相应模型,从而构成了支持重音合成的语音合成系统。实验结果分析表明,基于感知结果优化的重音检测器的标注结果是可靠的;支持重音的韵律声学预测模型是合理的;新的合成系统能够合成出带有轻重变化的语音。  相似文献   

13.
基于自动句对齐的相似古文句子检索   总被引:3,自引:0,他引:3  
郭锐  宋继华  廖敏 《中文信息学报》2008,22(2):87-91,105
随着语料库语言学的兴起,基于实例的机器翻译(EBMT)得到越来越多的研究。如何快速准确地构建大规模古今汉语平行语料库,以及从大量的对齐实例(句子级)中检索和输入句子最相似的源句子是基于实例的古今汉语机器翻译必须解决的问题。本文综合考虑句子长度、汉字字形、标点符号三个因素提出了古今汉语句子互译模型,基于遗传算法、动态规划算法实现了古今汉语的自动句对齐。接着为古文句子建立全文索引,基于汉字的信息熵,本文设计与实现一种高效的最相似古文句子检索算法。最后给出了自动句对齐和最相似古文句子检索的实验结果。  相似文献   

14.
词汇间语义相关关系量化计算方法   总被引:4,自引:0,他引:4  
词汇间语义关系的定量化研究是自然语言处理任务中一个重要的基础性工作。词汇间语义关系总体上分为等同关系、上下位关系、相关关系,现有的语义关系定量化工作主要集中于词汇间语义的等同关系(相似性)量化研究。该文研究和提出了量化词汇间语义相关关系的基本思路和新方法,即构造词汇相关关系二分图来求解和量化词汇间间接相关关系,该方法能够解决在统计语料中没有出现的词汇对的相关关系量化求解问题。实验结果表明,该文提出的方法比单纯用互信息来计算和量化词汇间语义相关关系更为可行。同时,对于一个特定词汇而言,该文的方法能够得到一个相关关系量化的相对合理的趋势性结果。  相似文献   

15.
基于网络的中文问答系统及信息抽取算法研究   总被引:24,自引:3,他引:21  
问答系统(Question Answering System)能用准确、简洁的答案回答用户用自然语言提出的问题。目前多数问答系统利用大规模文本作为抽取答案的知识库,而网络上丰富的资源为问答系统提供了另外一种良好的知识来源,对于回答简短、基于事实的问题非常有效。本文对基于网络的问答系统研究现状作了简要的介绍,分析了网络信息的特点。我们提出了一种基于语句相似度计算的答案抽取方法,在此基础上实现了一个基于网络的中文问答系统。该系统只利用网络搜索引擎返回结果中的摘要部分作为答案抽取的资源,从而节省了下载、分析网络源文本的时间。实验结果表明该系统对人名、数量及时间类型的问题效果显著,对测试问题集的MRR值达到0.51。  相似文献   

16.
从「悬、挂、吊」看现代汉语近义词的区辨   总被引:2,自引:0,他引:2  
本文以中央研究院词库小组所完成的「研究院语料库(Sinica Corpus)」为语料,分析「悬」、「挂」、「吊」这一组近义词。藉由观察这三个词个别的出现分布与句法表现,抽离出区隔这三个动词的关键语意成分。 我们发现事件焦点(event focus)在这一组动词的区分上扮演着重要的角色。分析显示,这三个动词的语意都可以表现在使动结构(causative construction)上,而三者的区分就在于它们各自表示这个结构不同的组成成分。「悬」倾向于以使动句构中的下位事象(subevent)为焦点,「挂」则可涵盖整个使动结构,而「吊」则偏向于将焦点集中在使动句构中的上位事象(superevent)的部分。 由这一组近义动词的表现,证明在事件结构的分析上,「事件焦点」这个概念,在区分动词语意时,有一定的重要性。  相似文献   

17.
时间关系普遍存在于时间和事件概念之间,为信息组织提供了一条天然的线索。该文在信息抽取和时间信息标注的基础上,研究汉语中时间与时间、事件与时间和事件与事件之间的时间关系。一方面考虑汉语文本的特点,充分抽取蕴含于语法语义层面中的时间关系;另一方面定义了与文本无关的规则,实现了不同来源信息之间的时间关系的计算。这为信息抽取结果的组织、积累和共享打下了基础,对于事件追踪、多文本摘要等方面的研究也有一定的借鉴意义。  相似文献   

18.
中文观点挖掘中的主观性关系抽取   总被引:1,自引:0,他引:1  
本文所针对的具体任务是抽取评价词和目标对象之间的关联关系。所采用的方法是将同一句子中共现的评价词与评价对象作为候选集合,应用最大熵模型并结合词、词性、语义和位置等特征进行关系抽取。我们将关系抽取引入观点挖掘,所提出的方法一定程度上解决了指代消解以及评价对象遗漏的问题。实验结果表明该方法的F值比取最近评价对象的Baseline方法有了15%的提高,并且发现程度副词能够帮助提高主观性关系抽取的性能。  相似文献   

19.
本文阐述了以配价作为基本描写法、真实语料为事实依据的维吾尔语框架语义知识库(简称框架网FrameNet)的构建,该知识库在构建维吾尔语词汇及其所属框架的语义词典等诸多领域有着广阔的应用空间和发展前景。提出了研究维吾尔语中句法功能和概念结构(也就是语义结构) 之间的关系, 以及建立用于自然语言处理的维吾尔语网上词汇知识库的意义。在维吾尔语的研究中引入了框架语义知识库(框架网)。框架语义知识库作为一种网上词汇语料库, 包括对每个词位( lexeme)的各个涵义的句法、语义信息的详尽描述。本文为维吾尔语框架语义知识库中各个框架元素的句法、语义特征的说明等自然语言信息处理研究提出新的研究思路,对基于配价的维吾尔语框架语义知识库构建的方法进行了探讨。  相似文献   

20.
汉语意见型主观性文本是目前自然语言处理中的一个研究热点.该文介绍了汉语意见型主观性文本标注语料库构建方面的一些经验,讨论了设计和建设语料库方面的几个重要问题,包括语料的选取、标注、存储、检索和统计,以及语料库相关工具的设计等.汉语意见型主观性文本标注语料库与普通的语料库相比,其特点在于深度标注了主观性文本的词性、句法、语义和意见元素等信息,忠实记录了主观性文本的语言现象.汉语意见型主观性文本标注语料库的构建为人们分析和研究汉语主观性文本提供了有力的资源支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号