首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  完全免费   6篇
  自动化技术   9篇
  2004年   2篇
  2002年   5篇
  1998年   1篇
  1997年   1篇
排序方式: 共有9条查询结果,搜索用时 78 毫秒
1
1.
文本检索会议简介   总被引:3,自引:0,他引:3       下载免费PDF全文
文本检索简介随着互联网的发展和存贮技术的提高,计算机可读的文本信息也越来越多。据估计,截止到1999年,互联网上已约有5TB的信息容量,其中文字信息约为6TB。然而,要有效地开发利用如此丰富的信息资源并不是轻而易举的事情,因为许多信息往往是规模巨大,实时性强,而且存贮分散;语言混杂,内容广泛;图文并茂,格式灵活,有时还含有一定的拼写错误或传输错误。而对于特定的用户而言,所需要的信息往往只占其中极小的一部分。要从如此规模的网络信息中抽取有用的信息资源,对信息处理的速度和精度将提出极为严格的要求,因而迫切需要对这种形式的混合语料进行更快速高效的处理。在这种情况下,人们越来越多地依靠文本检索工具来寻找自己所需要的信息。文本检索指的是给定文本方式的检索需求,在电子文档库中查找出与指定表达式相匹配的文本,并将出现和包含这些文本的原文作为检索结果返回给用户。  相似文献
2.
一种利用链接信息检索关键资源的算法   总被引:2,自引:0,他引:2       下载免费PDF全文
顾健  黄萱菁  吴立德 《计算机科学》2004,31(10):189-192
随着互联网的发展,基于Web的信息处理技术越来越受到人们的重视,也是当前研究的前沿课题。本文探讨的是如何在现有检索技术的基础上,利用Web网页的链接信息,自动地得到更高质量的检索结果——关键资源。本文提出一种同时利用Web网页的结构和内容信息以及链接信息的新方法:先结合网页的结构信息和内容评分得到网页的文档评分,然后基于网页出链的文档评分计算网页的链接评分。实验表明,本文的方法减少了无用链接的干扰,比单纯利用链接信息的效果好得多。  相似文献
3.
关键词识别的基本技术和研究进展   总被引:1,自引:0,他引:1  
Keyword Spotting (KWS) or Keyword Recognition is to recognize a set of given keywords in continuous,spontaneous speech.It is a very active branch of Speech Recognition.It differs from Continuous Speech Recognition (CSR) in terms of research focus,implementation techniques and application background.So they are often regarded as two different issues.This paper gives an overview of basic techniques and advances in recent years,including how to combine the traits of Mandarin.  相似文献
4.
基于双向图算法的快速部分汉语语法分析器   总被引:1,自引:0,他引:1  
本文给出了一个用双向图算法实现的快速部分汉语语法分析器。为了实现真实文本的快速部分语法分析,分析器使用FIRST分析表和LAST分析表来更大程度地避免创建不必要的活动弧,并且引进了弧的竞争机制和对于一些情况的处理方法,使用了各种分析策略的分析器的准确率达到87.2%,在主频66MHz的486机型上运行速度是32句/分。  相似文献
5.
基于实体名的文本自动综述研究   总被引:1,自引:0,他引:1       下载免费PDF全文
自动文摘是自然语言处理的一个重要分支,在信息检索领域中有着重要的用途.文本自动综述是自动文摘在多文档上的推广。本文提出了基于实体名扩展的自动综述方法,这种方法认为综述中的实体名个数反映其中所蕴含信,S量的多少。我们用该方法实现针对事件的自动综述生成,并参加了2003年文本理解会议(Document Understanding Conference,DUC)进行统一评测,DUC反馈的评测结果显示这种方法是有效的。此外,本文还对文本理解会议的任务、评测方法和测试结果做了简单介绍。  相似文献
6.
本文介绍了自然语言处理系统的一个重要知识源——概念词典,以及基于超文本的概念词典管理系统——概念浏览器。我们的概念词典以框架结构为知识表示单元,框架的内容由结构信息和语义信息组成,所有框架通过结构槽形成树形的层次结构。概念浏览器作为一个超文本管理系统,不仅能显示层次结构和框架内容,还提供了插入、查询、删除和修改等各种数据库功能。  相似文献
7.
1.引言识别(Keyword Spotting,简称KWS)的任务是从连续无限制的语音中,识别给定的若干个词.它与通常所说的连续语音识别(Continuous Speech Recognition,简称CSR)有密切的联系,但又有显著的区别.所以,在语音识别的研究中,KWS与CSR通常是作为两个不同的问题来处理[1,2].  相似文献
8.
一、引言句法分析是自然语言处理的重要基础,相应的研究很多,但是由于速度问题,句法分析很难大规模运用,因此提高分析速度一直是句法分析的重要研究方向。我们知道,句法分析的过程实际上是一个在句法成分树的空间中寻找最优分析树的过程,因此可以把分析过程看成是个搜索最佳路径的过程。在搜索的过程中给些“启发”将提高效率。双向图算法,是个最佳的例证,由于每条规则都有触发类来规定它的使用时机,使得它无论是时间还是空间上都比传统的图算法有更高的效率。  相似文献
9.
1.引言面对日益庞大的信息量,如何有效地检索到感兴趣的内容是至关重要的。新闻视频、音频(包括电视、广播)与文字报道相比,更为生动,表达更为丰富,但也有数据量大、难以组织、索引、检索等缺点。这主要体现在两方面; 文本有标题、段等明显的辅助标记,而视频、音频则没有。一般的浏览工具只有播放、快进、快退、拖动定位等简单手段。这对于几十、几百小时,而且还在日益增长的视频、音频数据库,是远远不能满足要求的。  相似文献
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号