首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   81篇
  国内免费   7篇
  完全免费   11篇
  自动化技术   99篇
  2017年   2篇
  2014年   7篇
  2013年   2篇
  2012年   5篇
  2011年   6篇
  2010年   11篇
  2009年   4篇
  2008年   4篇
  2007年   7篇
  2006年   5篇
  2005年   4篇
  2004年   6篇
  2003年   2篇
  2002年   6篇
  2001年   6篇
  2000年   5篇
  1999年   5篇
  1998年   3篇
  1997年   2篇
  1996年   3篇
  1995年   3篇
  1994年   1篇
排序方式: 共有99条查询结果,搜索用时 31 毫秒
1.
汉语短语标注标记集的确定   总被引:23,自引:7,他引:16  
本文提出了一个汉语短语标注的基本标记集,并从句法功能和结构组成方面对不同短语的性质进行了深入的分析和探讨,以期为汉语短语划分和标注的自动处理和人工校对提供一个统一的处理标准。  相似文献
2.
汉语句法树库标注体系   总被引:23,自引:10,他引:13  
语料库的句法标注是语料库语言学研究的前沿课题.本文在研究和总结国内外句法树库标注实践的基础上,提出了一套汉语真实文本的句法树标注体系.它以完整的层次结构树为基础,对句法树上的每个非终结符节点都给出两个标记:成分标记和关系标记,形成双标记集的句法信息描述体系.目前,这两个标记集分别包含了16和27个标记,对汉语句子的不同句法组合的外部功能分布和内部组合特点进行了详细描述.在此基础上,我们开发完成了100万词规模的汉语句法树库TCT,对其中各种复杂语言现象的标注实践显示了这套标注体系具有很好的信息覆盖率和语料适应性.  相似文献
3.
汉语最长名词短语的自动识别   总被引:22,自引:0,他引:22       下载免费PDF全文
周强  孙茂松  黄昌宁 《软件学报》2000,11(2):195-201
通过对包含5573个汉语句子的语料文本中的最长名词短语的分布特点的统计分析,提出了两种有效的汉语最长名词短语自动识别算法:基于边界分布概率的识别算法和基于内部结构组合的识别算法.实验结果显示,后者的识别正确率和召回率分别达到了85.4%和82.3%,取得了较好的自动识别效果.  相似文献
4.
规则和统计相结合的汉语词类标注方法   总被引:20,自引:4,他引:16  
本文分析了汉语的多类词现象与汉语词类标注的困难,介绍了汉语词类标注中的规则排歧的和统计排歧的处理策略以及规划和统计相结合的处理思想,按此思路设计的软件系统,对封闭语料和开放语料的标注正确率分别达到了96.06%和95.82%。  相似文献
5.
汉语句子的组块分析体系   总被引:19,自引:1,他引:18  
周强  孙茂松  黄昌宁 《计算机学报》1999,22(11):1158-1165
介绍了一种描述能力介于线性词序列和完整句法树表示之间的浅层句法知识描述体系-组块分析体系,并详细讨论了其中两大部分;词界块和成分组的基本内容及其自动识别算法,在此基础上,提出了一种分阶段构造汉语树库的新设想,即先构造组块库,再构造树库,进行了一系列句法分析和知识获取实验,包括1)自然识别汉语最长名词短语;2)自动获取汉语句法知识等。所有这些工作都证明了这种知识描述体系的实用性和有效性。  相似文献
6.
汉语树库的构建   总被引:18,自引:7,他引:11  
本文讨论了汉语树库的构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集,汉语树库加工处理规范和人机互助的树库和加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后提出了构建大规模汉语树库的设想。  相似文献
7.
汉语短语的自动划分和标注   总被引:15,自引:2,他引:13  
考虑到传统的基于规则的汉语分析器对大规模真实文本的分析所遇到的困难,本文在使用统计方法进行汉语自动句法分析方面作了一些探索,提出了一套基于统计的汉语短语自动划分和标注算法。它分为预测划分点、括号匹配和分析树生成第三个处理阶段,其间利用了从人工标注的树库中统计得到的各种数据进行自动句法排歧,最终得到一棵最佳句法分析树,从而可以自顶向下地完成对一句句子的短语自动划分和标注,对一千多句句子的封闭测试结果  相似文献
8.
基于语料库和面向统计学的自然语言处理技术   总被引:15,自引:1,他引:14  
1引言 语料库语言学(Corpus Linguistics)是八十年代才崭露头角的一门新的计算语言学分支学科.它研究机器可读的自然语言文本的采集、存储、检索、统计、语法标注、句法语义分,以及具有上述功能的语料库在语言定量分析、词典编纂、作品风格分  相似文献
9.
构建知网关系的网状表示   总被引:9,自引:2,他引:7  
本文介绍了一种针对知网关系的网状表示结构及其实现方法。通过构建三张数据表:概念表、特征表和关系,以及建立它们的记录项之间的双向多元联系,可以方便地把知网的所有知识(概念、特征以及它们之间的各种关系)集成在一起,从而为进一步进行基于知网的信息检索和知识推理打下很好的基础。  相似文献
10.
一个汉语短语自动界定模型   总被引:8,自引:1,他引:7  
周强 《软件学报》1996,7(A00):315-322
本文提出了一个汉语短语自动界定模型,它通过基于统计的自动界定处理,利用通过错误驱动自动学习而得到的调整规则界定情况局部调整,利用人工总结的全局调整规则进行精调整等3个处理阶段,可以较邹地确定一句经过正确切分和词性注处理的汉语句子中不同短语的边界位置,从而为时一步的汉语短语自动划分和标注处理打下了良好的基础,对1000多句句子的实验结果表明,模型的界定正确率达到了96.33%(封闭测试)、94.55  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号