期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

俞士汶朱学锋王惠张芸芸《中文信息学报》1996,(2)

《现代汉语语法信息词典》是为计算机实现汉语分析和汉语生成而研制的一部电子词典。这部电子词典可以在语言信息处理的广泛领域中得到应用。本词典的详细规格说明书（ｓｐｅｃｉｆｉｃａｔｉｏｎ）的初稿制订于１９９０年。在八五攻关期间（１９９１年至１９９５年），一方面严格按照规格说明书进行词典内容的开发，一方面在开发过程中又对规格说明书进行了局部的调整与修订，于１９９５年１１月形成了现在的版本、这份规格说明书也是汉语信息处理研究的一项重要成果。现在发表的这份规格说明书共分以下五章：第一章介绍词典的设计目标与结构。第二章介绍总库的属性字段。第三章介绍各类词库的共同属性字段、第四章介绍各类词库专有的属性字段。第五章介绍《现代汉语语法信息词典》于１９９５年１１月通过专家鉴定时所达到的规模。附录给出了面向信息处理的现代汉语词语分类体系的词类代码表。相似文献

2.

现代汉语语法信息词典规格说明书 总被引：5，自引：2，他引：5

俞士汶朱学锋《中文信息学报》1996,10(2):1-22

《现代汉语语法信息词典》是为计算机实现汉语分析和汉语生成而研制的一部电子词典。这部电子词典可以在语言信息处理的广泛领域中得到应用。本词典的详细规格说明书的初稿制订于1990年。在八五攻关期间1991年至1995年,一方面严格按照规格说明书进行词典内容的开发, 一方面在开发过程中又对规格说明书进行了局部的调整与修订, 于1995年11月形成的现在的版本。这份规格说明书也是汉语信息处理研究的一项重要成果。#br#现在发表的这份规格说明书共分以下五章第一章介绍词典的设计目标与结构第二章介绍总库的属性字段。第三章介绍各类词库的共同属性字段,第四章介绍各类词库专有的属性字段。第五章介绍《现代汉语语法信息词典》于年月通过专家鉴定时所达到的规模附录给出了面向信息处理的现代汉语词语分类体系的词类代码表。相似文献

3.

《现代汉语语法信息词典》的新进展 总被引：5，自引：0，他引：5

俞士汶朱学锋王惠《中文信息学报》2001,15(1):59-65

《现代汉语语法信息词典》是面向汉语信息处理的基本语言知识库。1995年11月底通过技术鉴定。5年来,北大计算语言学研究所在应用、推广的同时,仍把重要的力量投入词典本身的发展。至目前为止,词典收词已由5万条增加到7.3万条,并且全部完成了归类;为了处理未定义词,还开发了一个全新的语素库;词语语法属性描述中的瑕疵得到了进一步的修正,新增了20多个语法属性项目和大量的实例。整个词典的规模和质量有了显著的提高。相似文献

4.

面向自然语言处理的机器词典的研制

《信息与电脑》2019,(15)

随着计算机技术的不断发展和普及,我国相关工作人员开始研究面向自然语言处理的机器词典。近年来,北京大学计算机语言学研究所研制了《现代汉语语法信息词典》(简称GKB)。在GKB的基础上,相关工作人员衍生了综合型语言知识库。由于面向自然语言处理的机器词典在语言工程研究上具有重要意义,因此介绍了GKB及相关研究结果,分析了语言工程研究的相关经验,以期为相关工作者提供指导和帮助。相似文献

5.

《现代汉语语义词典》管理系统的设计与实现 总被引：2，自引：0，他引：2

郑泽芝张永奎《计算机工程》2001,27(6):11-13

主要介绍了用VB5．0为《现代汉语语义词典》设计并实现动态管理，多种查询管理系统的研究工作。相似文献

6.

大规模现代汉语标注语料库的加工规范 总被引：14，自引：5，他引：9

俞士汶朱学锋段慧明《中文信息学报》2000,14(6):58-64

北京大学计算语言学研究所在开发了《现代汉语语法信息词典》等语言资源的基础上,又在实施另一项大型语言工程,即对大规模的现代汉语原始语料进行多级加工,目前的加工项目包括词语切分、词性标注(包括动词和形容词的特殊用法) ,并标出专有名词以及短语型的地名、机构名称等等。规划中的语料库规模约为2700万字。现在已经完成了1400万字的任务,而且质量很高。要建成高质量的标注语料库,必须制订出完备的加工规范。本文介绍制订加工规范的原则和执行加工规范的经验。相似文献

7.

现代汉语名词语法属性的计量研究初探

王萌俞士汶段慧明孙薇薇《中文信息学报》2008,22(5):22

以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进“分散度”概念,利用它对“数名”结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。相似文献

8.

《动词句法语义信息词典》知识体系及其检索界面

袁毓林曹宏《中文信息学报》2022,36(8):29-36+45

该文首先介绍《动词句法语义信息词典》的体系结构与理论背景;然后,介绍该词典所区分的8种动词小类及其定义;重点介绍该词典为动词所设置的22种语义角色及其定义,由这些语义角色的不同配置而造成的20来种句法格式及其例句,及其所考察的动词的9种主要的语法功能及其对于该词类的隶属度;最后,给出该词典的检索系统的界面截图,交代其相应的纸质版本的情况。相似文献

9.

基于词典和弱标注信息的电影评论情感分析

樊振过弋张振豪韩美琪《计算机应用》2018,38(11):3084-3088

针对评论文本情感分析研究中数据标注费时费力的问题,提出了一种新的数据自动标注方法。首先,通过基于情感词典的方法计算出评论文本的情感倾向;其次,利用用户评分的弱标注信息和基于词典方法的情感倾向对评论文本自动标注;最后,利用支持向量机（SVM）对评论文本进行情感分类。所提出的数据自动标注方法在两种类型数据集情感分类准确率上分别达到了77.2%和77.8%,相对于单一的利用用户评分对数据标注的方法,分别提高了1.7个百分点和2.1个百分点。实验结果表明,提出的数据自动标注方法在电影评论情感分析中能提高分类效果。相似文献

10.

商务印书馆新书目录《汉语图解词典》

《中文信息学报》2009,23(1)

《汉语图解词典》系国家汉办招标项目,是一本供外国人学习汉语的工具书。该词典利用语义关联模式,将汉语词语分15个主题,142个话题,以大量直观的图片来解释4200余条词语,涵盖社会生活真实场景中的常见元素。在图中相应的位置标出序号,配以简体汉字、拼音和英语释义。除名词、动词、形容词外,还收录大量词组,方便学习者全方位掌握汉语词汇。相似文献

11.

S7-2OO与PC实时通信方法的研究

李斌赵海涛王亚杰《微计算机信息》2007,23(22):74-75,119

针对控制系统中上位机与S7-200系列PLC通信的实际问题，总结了计算机与S7-200系列PLC的几种通信方法，介绍了基于VB6.0的串行通信编程的ActiveX控件MSComm。并给出了程序流程图，现场运行表明该方法组成灵活、实时性强、性能价格比高等优点。相似文献

12.

对应分析在Eviews中的实现

张彦曹晓丽《计算机与现代化》2005,(3):103-104,106

介绍了对应分析的基本原理和步骤,利用Eviews软件的命令编写了实现对应分析的计算程序,在Matlab软件中作出了对应分析图,并给出了一个示例。相似文献

13.

词汇计量研究与常用词知识库建设

俞士汶朱学锋《中文信息学报》2015,29(3):16-20

面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及“部件词”的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。相似文献

14.

On the Correspondence Between Modal and Classical Logic: an Automated Approach 总被引：2，自引：0，他引：2

SZALAS ANDRZEJ 《Journal of Logic and Computation》1993,3(6):605-620

相似文献

15.

基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究

程宁李斌葛四嘉郝星月冯敏萱《中文信息学报》2020,34(4):1-9

古汉语信息处理的基础任务包括自动断句、自动分词、词性标注、专名识别等。大量的古汉语文本未经标点断句,所以词法分析等任务首先需要建立在断句基础之上。然而,分步处理容易造成错误的多级扩散,该文设计实现了古汉语断句与词法分析一体化的标注方法,基于BiLSTM-CRF神经网络模型在四种跨时代的测试集上验证了不同标注层次下模型对断句、词法分析的效果以及对不同时代文本标注的泛化能力。研究表明,一体化的标注方法对古汉语的断句、分词及词性标注任务的F₁值均有提升。综合各测试集的实验结果,断句任务F₁值达到78.95%,平均提升了3.5%;分词任务F₁值达到85.73%,平均提升了0.18%;词性标注任务F₁值达到72.65%,平均提升了0.35%。相似文献

16.

Using Correspondence Analysis to Combine Classifiers 总被引：7，自引：0，他引：7

Merz Christopher J. 《Machine Learning》1999,36(1-2):33-58

Several effective methods have been developed recently for improving predictive performance by generating and combining multiple learned models. The general approach is to create a set of learned models either by applying an algorithm repeatedly to different versions of the training data, or by applying different learning algorithms to the same data. The predictions of the models are then combined according to a voting scheme. This paper focuses on the task of combining the predictions of a set of learned models. The method described uses the strategies of stacking and Correspondence Analysis to model the relationship between the learning examples and their classification by a collection of learned models. A nearest neighbor method is then applied within the resulting representation to classify previously unseen examples. The new algorithm does not perform worse than, and frequently performs significantly better than other combining techniques on a suite of data sets. 相似文献

17.

A Taxonomy and Evaluation of Dense Two-Frame Stereo Correspondence Algorithms 总被引：104，自引：9，他引：104

Daniel Scharstein Richard Szeliski 《International Journal of Computer Vision》2002,47(1-3):7-42

Stereo matching is one of the most active research areas in computer vision. While a large number of algorithms for stereo correspondence have been developed, relatively little work has been done on characterizing their performance. In this paper, we present a taxonomy of dense, two-frame stereo methods. Our taxonomy is designed to assess the different components and design decisions made in individual stereo algorithms. Using this taxonomy, we compare existing stereo methods and present experiments evaluating the performance of many different variants. In order to establish a common software platform and a collection of data sets for easy evaluation, we have designed a stand-alone, flexible C++ implementation that enables the evaluation of individual components and that can easily be extended to include new algorithms. We have also produced several new multi-frame stereo data sets with ground truth and are making both the code and data sets available on the Web. Finally, we include a comparative evaluation of a large set of today's best-performing stereo algorithms. 相似文献

18.

宽基线主动视觉中感兴趣目标的对应技术

刘博文余松煜徐奕杨小康《中国图象图形学报》2007,12(10):1917-1921

在主动视觉系统中,通常需要多个代理对同一场景中的感兴趣目标进行协同处理,以提高系统智能分析感兴趣目标的能力。其中,基于多视几何关系解决感兴趣目标的对应问题是协同处理的基础。一方面,主动视觉系统一般工作在宽基线条件下,这增加了对应问题描述的复杂性;另一方面,主动视觉系统以最佳视角观察目标,因此摄像头需做实时的姿态调整,由此导致的视间几何关系变化进一步加深了对应问题的解决难度。本文基于仿射不变的几何特征,建立宽基线条件下的多视几何关系,并针对频繁使用几何特征不能满足主动视觉系统实时要求的问题,提出一种快速更新多视几何关系的方法,并在多视几何约束下实现对应感兴趣目标的鲁棒标识。实验结果表明,该方法能解决宽基线主动视觉系统中感兴趣目标的复杂对应问题,并能达到实时要求。相似文献

19.

基于OpenGL的对应分析因子载荷三维图的绘制 总被引：5，自引：1，他引：4

徐元进胡光道叶菁彭高辉《计算机工程与应用》2004,40(10):91-93

该文基于OpenGL在VC++环境下绘制出对应分析的因子载荷三维图,通过图形旋转,从不同视图方位清晰地观察样品点和变量点的相对位置,使信息获取更加方便灵活。文中对图形绘制中的关键问题进行了实现,并以实例对三维图形的优点进行分析,证明其在信息提取方面有着更高的准确性。相似文献

20.

中文症状知识库的建立与分析

昝红英韩杨超范亚鑫牛承志张坤丽穗志方《中文信息学报》2020,34(4):30-37

构建大规模的知识库是人工智能、自然语言理解等领域的基础任务之一。症状作为描述病人的主观感受和诊断疾病的重要依据,更是优化智能导诊、医学问答等任务的重要因素。该文在现有的医学症状知识库研究的基础上,结合症状的概念、特征及在医学诊断中发挥的作用,构建了一个公开的中文症状知识库。该知识库从症状的本体分类、相关疾病、发作部位及多发人群等层面对相关属性进行了详细描述,涵盖了8 772种症状,共计146 631条属性关系。所构建的症状知识库(CSKB)是中文医学知识图谱的重要组成部分,并为KBQA、知识推理及决策支持等应用提供了数据基础。相似文献