首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
介绍了信息抽取技术的基本概念、GATE信息抽取系统的抽取过程。对现有的信息抽取系统构建方法进行了介绍,指出了构建中文信息抽取系统所需要解决的关键问题及解决办法。  相似文献   

2.
闫俊英 《福建电脑》2013,(5):59-61,73
对信息抽取技术的概念、发展及信息抽取系统的体系结构进行介绍。信息抽取技术的核心任务是命名实体识别和实体关系抽取,总结现有的各种关系抽取方法,常用的关系抽取技术主要分为基于知识工程、基于机器学习和基于Ontology三大类方法,分别对三种方法进行介绍。  相似文献   

3.
信息抽取技术的发展现状及构建方法的研究   总被引:8,自引:0,他引:8  
介绍了信息抽取(IE)技术的基本概念、信息抽取系统的抽取过程。对现有的信息抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,同时指出了构建中文信息抽取系统所需要解决的关键的基础问题。  相似文献   

4.
伍守芹  李晓昀 《福建电脑》2010,26(4):55-55,65
对信息抽取技术的发展背景、概念进行了概述。详细介绍了信息抽取中研究的四个关键技术:命名实体识别、实体关系抽取、指代消解及事件探测。根据采用模型的不同,对信息抽取进行了分类介绍,分别指出了各类抽取方法的优点、缺点及研究难点。最后,对国内外在信息抽取领域中的研究现状及应用状况进行了分析,进一步说明了信息抽取技术的发展趋势。  相似文献   

5.
生物医学领域中的文本信息抽取技术与系统综述   总被引:3,自引:0,他引:3  
介绍了近年来的信息抽取技术的发展,着重介绍了目前在生物医学领域内的各类信息抽取系统,并展望了今后的发展方向。  相似文献   

6.
文章针对垂直搜索引擎技术进行了介绍,介绍了通用信息检索技术、信息抽取技术和信息抓取技术,例如Nutch和GATE。并利用当前流行的技术构建了一个垂直搜索引擎,最后描述了系统的架构和实现过程。  相似文献   

7.
黄晨 《福建电脑》2009,25(6):45-46
命名实体语义关系抽取是信息抽取中的主要任务之一,本文对现有的语义关系抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,回顾语义关系抽取研究的历史,总结语义关系抽取技术的现状,将有助语义关系抽取技术研究工作的向前发展。  相似文献   

8.
利用调频立体声基带传送数据信息的原理及实现   总被引:1,自引:0,他引:1  
阐述了利用调频立体声基带传送数据的技术原理,介绍了信息发送/接收系统的配置及实现方法,重点介绍了最新研制成功的、在系统中起关键作用的FM-RE602编码器和RDS信息接收卡。  相似文献   

9.
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架.对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案.实验结果表明,该方法可以得到性能较高的抽取结果.  相似文献   

10.
从互联网获取信息的手段中,Web信息抽取技术是有别于搜索引擎的,它能得到更精确和更具细粒度的信息,该文在分析了Web信息抽取技术在国内外发展现状的基础上,提出了陶瓷产品信息Web信息抽取的技术路线,制定了抽取规则,开发出了一套抽取系统,得到了相关陶瓷产品信息。  相似文献   

11.
税务信息查询系统是一个提供纳税资料基础信息、并辅助领导进行决策的综合查询平台。本文详细介绍该系统的设计与实现,并且着重分析了系统采用的基于异构数据库的数据抽取和数据更新技术。  相似文献   

12.
网页信息抽取及建库系统C#实现   总被引:1,自引:0,他引:1       下载免费PDF全文
刘华 《计算机工程》2006,32(16):49-51
围绕网页内容解析、数据清洗、语料库信息字段定义和XML数据存储4个方面,该文介绍了网页信息自动抽取及建库的原理,并使用C#语言在微软.NET Framework下完成了一个网页信息自动抽取及建库系统,该系统具有智能性和个性化的特点,适合构建文本分类、话题识别和信息检索的大型训练(测试)语料集。  相似文献   

13.
Web文本挖掘系统及其关键技术研究   总被引:10,自引:0,他引:10  
随着网络信息的迅猛发展,信息量日益增加,怎样从海量的Internet上获取有用信息,WEB文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程,论文对文本中所涉及的关键技术,包括K-最近邻参照法模型、基于隐马尔科夫模型(HMM)的信息抽取、机器学习方法,进行了研究和探讨,并且给出了基于信息抽取的文本挖掘系统的设计实现和下一步的研究重点。  相似文献   

14.
Web信息抽取技术已成为一个活跃的研究领域。本文根据信息抽取的原理,对现有的信息抽取技术进行了分类,结合典型的系统讨论各取技术的特点,还进一步指出了目前以本体为基础的Web信息抽取研究须解决的问题  相似文献   

15.
Web信息抽取已经成为下一代Web应用的一个研究热点.在分析了当前Web信息抽取技术面临问题的基础上,结合网格技术的发展,提出了一个基于网格的Web信息抽取系统(GWIES),并给出了GWIES的设计方案,描述了系统实现的关键技术.  相似文献   

16.
随着互联网技术的快速发展,Web信息呈现爆炸性增长,人们发现用信息检索的方法不能及时的得到想要的信息,于是出现了信息抽取。在回顾Web信息抽取基本理论的基础上,该文对Web信息抽取技术进行较全面的综述,通过分析信息抽取的概念、信息抽取的类型和功能等进行介绍,以此有助于本研究继续向前发展。  相似文献   

17.
范纯龙  夏佳  肖昕  吕红伟  徐蕾 《计算机应用》2011,31(9):2417-2420
博客作为一类重要的网络信息资源,其评论信息抽取是舆情分析等研究工作的基础。总结了当前主流的博客评论抽取算法,介绍了页面结构在信息抽取中的应用,并结合人理解网页时充分利用“首页”等指示性短语的特点,提出利用具有明确语义和功能指示作用的功能语义单元来抽取评论信息的技术;详细介绍了抽取过程中涉及的页面结构线性化、功能语义单元识别、正文识别和评论抽取算法等内容。最后,通过实验证明,该技术在博客的正文和评论信息抽取上能取得良好效果。  相似文献   

18.
在利用本体进行信息抽取的基础上,提出了一个基于个人信息领域的语义信息抽取系统框架,将语义抽取从WEB领域扩展到个人信息领域;系统对个人信息领域内的网页,电子邮件,本地数据库和本地文件夹建立本体,根据本体之间的语义关联,实现个人信息领域内数据的交流。系统详细描述了语义信息抽取系统的实现过程,并以电子邮件为例重点介绍了语义信息抽取的算法。  相似文献   

19.
基于扩展标记图的Web信息抽取器   总被引:2,自引:0,他引:2  
王亮  朱征宇 《计算机工程》2005,31(8):159-161,191
介绍了一种新的Web信息抽取器,该抽取器基于扩展标记图模型,实观了数据和模式的分离,应用于Web检索系统中,能够有效地支持标记级实时信息检索、抽取和重组。还介绍了其在Web信息检索系统PowerSearcher中的实际应用。  相似文献   

20.
基于Web的包装器技术的现状与发展   总被引:1,自引:0,他引:1  
Web信息抽取技术已成为当前一个研究热点,信息抽取的主要工作由包装器来完成。根据包装器的原理,对现有的信息抽取技术进行了分类,并结合典型的系统讨论各抽取技术的特点,提出了以本体来构建包装器的规则模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号