共查询到20条相似文献,搜索用时 703 毫秒
1.
介绍了信息抽取技术的基本概念、GATE信息抽取系统的抽取过程。对现有的信息抽取系统构建方法进行了介绍,指出了构建中文信息抽取系统所需要解决的关键问题及解决办法。 相似文献
2.
3.
4.
对信息抽取技术的发展背景、概念进行了概述。详细介绍了信息抽取中研究的四个关键技术:命名实体识别、实体关系抽取、指代消解及事件探测。根据采用模型的不同,对信息抽取进行了分类介绍,分别指出了各类抽取方法的优点、缺点及研究难点。最后,对国内外在信息抽取领域中的研究现状及应用状况进行了分析,进一步说明了信息抽取技术的发展趋势。 相似文献
5.
6.
文章针对垂直搜索引擎技术进行了介绍,介绍了通用信息检索技术、信息抽取技术和信息抓取技术,例如Nutch和GATE。并利用当前流行的技术构建了一个垂直搜索引擎,最后描述了系统的架构和实现过程。 相似文献
7.
命名实体语义关系抽取是信息抽取中的主要任务之一,本文对现有的语义关系抽取系统构建方法进行了分类和介绍,并对这些方法进行了讨论和比较,回顾语义关系抽取研究的历史,总结语义关系抽取技术的现状,将有助语义关系抽取技术研究工作的向前发展。 相似文献
8.
9.
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架.对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案.实验结果表明,该方法可以得到性能较高的抽取结果. 相似文献
10.
詹沐清 《数字社区&智能家居》2014,(24):5799-5802
从互联网获取信息的手段中,Web信息抽取技术是有别于搜索引擎的,它能得到更精确和更具细粒度的信息,该文在分析了Web信息抽取技术在国内外发展现状的基础上,提出了陶瓷产品信息Web信息抽取的技术路线,制定了抽取规则,开发出了一套抽取系统,得到了相关陶瓷产品信息。 相似文献
11.
税务信息查询系统是一个提供纳税资料基础信息、并辅助领导进行决策的综合查询平台。本文详细介绍该系统的设计与实现,并且着重分析了系统采用的基于异构数据库的数据抽取和数据更新技术。 相似文献
12.
围绕网页内容解析、数据清洗、语料库信息字段定义和XML数据存储4个方面,该文介绍了网页信息自动抽取及建库的原理,并使用C#语言在微软.NET Framework下完成了一个网页信息自动抽取及建库系统,该系统具有智能性和个性化的特点,适合构建文本分类、话题识别和信息检索的大型训练(测试)语料集。 相似文献
13.
Web文本挖掘系统及其关键技术研究 总被引:10,自引:0,他引:10
随着网络信息的迅猛发展,信息量日益增加,怎样从海量的Internet上获取有用信息,WEB文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程,论文对文本中所涉及的关键技术,包括K-最近邻参照法模型、基于隐马尔科夫模型(HMM)的信息抽取、机器学习方法,进行了研究和探讨,并且给出了基于信息抽取的文本挖掘系统的设计实现和下一步的研究重点。 相似文献
14.
15.
Web信息抽取已经成为下一代Web应用的一个研究热点.在分析了当前Web信息抽取技术面临问题的基础上,结合网格技术的发展,提出了一个基于网格的Web信息抽取系统(GWIES),并给出了GWIES的设计方案,描述了系统实现的关键技术. 相似文献
16.
随着互联网技术的快速发展,Web信息呈现爆炸性增长,人们发现用信息检索的方法不能及时的得到想要的信息,于是出现了信息抽取。在回顾Web信息抽取基本理论的基础上,该文对Web信息抽取技术进行较全面的综述,通过分析信息抽取的概念、信息抽取的类型和功能等进行介绍,以此有助于本研究继续向前发展。 相似文献
17.
18.
在利用本体进行信息抽取的基础上,提出了一个基于个人信息领域的语义信息抽取系统框架,将语义抽取从WEB领域扩展到个人信息领域;系统对个人信息领域内的网页,电子邮件,本地数据库和本地文件夹建立本体,根据本体之间的语义关联,实现个人信息领域内数据的交流。系统详细描述了语义信息抽取系统的实现过程,并以电子邮件为例重点介绍了语义信息抽取的算法。 相似文献
19.
基于扩展标记图的Web信息抽取器 总被引:2,自引:0,他引:2
介绍了一种新的Web信息抽取器,该抽取器基于扩展标记图模型,实观了数据和模式的分离,应用于Web检索系统中,能够有效地支持标记级实时信息检索、抽取和重组。还介绍了其在Web信息检索系统PowerSearcher中的实际应用。 相似文献
20.
基于Web的包装器技术的现状与发展 总被引:1,自引:0,他引:1
Web信息抽取技术已成为当前一个研究热点,信息抽取的主要工作由包装器来完成。根据包装器的原理,对现有的信息抽取技术进行了分类,并结合典型的系统讨论各抽取技术的特点,提出了以本体来构建包装器的规则模型。 相似文献