首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
文本知识发现:基于信息抽取的文本挖掘   总被引:11,自引:0,他引:11  
1.引言大家熟知,所谓“数据丰富但知识缺乏“的现状导致了数据挖掘(Data Mining)技术研究的兴起,数据挖掘又称数据库知识发现(Knowledge Discovery in Databases)是从海量的结构化信息中抽取或挖掘隐含信息和知识的重要方法和途径。数据挖掘技术已相当成熟。因为除了结构化的数据之外,在数字化信息中更多地存在大量自由、非结构化或半结构化的文本信息如新闻文章、电子书本、电子图书馆藏、Web页面内容、Email、文档数据库等,显然手工处理需要花费大量的人力物力,并且具有不确定性。所以出现了从文本中发现知  相似文献   

2.
Internet信息量迅猛增长,信息的海量化越来越突出,如何获取用户所需已日益突显出其重要性.文本挖掘技术能快速、有效地从大量数据中抽取有价值的信息,而Internet成为一个拥有大量Web文本资源的巨型数据库,大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战.介绍Web文本挖掘的一般流程,重点分析Web文本挖掘中的几种关键技术.  相似文献   

3.
互联网的普及和飞速发展,使Internet成为世界上最大的信息积聚地,但Internet积聚的信息不同与以往的数据挖掘源,其内容大多是半结构化或非结构化的文本。如何有效的对半结构化或非结构化的文本信息进行挖掘即文本挖掘已成为当今热门的研究方向。  相似文献   

4.
在网络这个庞大的虚拟图书馆中,占信息比重最大的文本数据却缺乏结构化、组织化的规整性,大大降低了网络文本信息的利用效率,而文本的自动分类技术则能降低网络的查询时间,提高网络搜索质量。文章提出了一种基于粗糙集理论的文本分类方法。  相似文献   

5.
计算机互联网上的信息量迅猛增长,信息的海量化越来越突出,如何获取用户所需的信息已日益突显出其重要性。该文挖掘技术能快速、有效地从大量数据中抽取有价值的信息,而Internet成为一个拥有大量Web本资源的巨型数据库,大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。文章介绍了Web文本挖掘的一般流程,重点分析了Web文本挖掘中的几种关键技术。  相似文献   

6.
郭弘 《微电脑世界》2000,(24):49-51
数字化和网络化的信息环境带来了数据库技术的变革,同时也为数据库的核心技术——信息存储与检索技术的发展提出了新的挑战,如何有效地存储海量的非结构化数据,如何从海量信息中检取有用的信息,成为了人们关注的热点。本期访谈中,我们邀请到国信贝斯公司总裁、研究员吴广印老师为我们谈一谈Internet时代的数据存储与检索技术。  相似文献   

7.
孙玮 《微电脑世界》1997,(2):111-113
一、数据库技术的发展状况及应用领域 经过10多年的发展,数据库系统已不仅仅停留在管理结构化的关系型数据上面,还具备管理更复杂的、非结构化数据类型的能力,例如对文本、图像、影像、声音和空间等类型数据的有效管理,同时还支持用户对数据类型的扩展。在数据库领域享有盛誉的Oracle、Sybase、Informix、IBM、CA和Mi-  相似文献   

8.
在数据信息极度增长的今天,单单获取计算机能够识别的结构化语言,对信息优化来讲是远远不够的。信息优化是通过信息化的手段,获取一些局部的结构化数据和部分非结构化数据,并充分地利用,达到实现信息优化的目的。如今,惠普能够利用技术实现让机器理解信息的含义,为人们实现数据挖掘提供更大帮助。  相似文献   

9.
北大方正电子有限公司北大方正技术研究院副院长张晓鸥告诉记者,方正电子将主要业务定位于 E-Media电子传播上,这是一个很宽泛的煤体传播概念。而方正研究院现在所从事的研究也是按照这个发展方向制定的。研究范围将包含互联网技术、信息发布技术、医疗技术。应用和研究紧密相连在谈到现在研究重点有哪些时,张晓鸥给记者列举了一个数据挖掘(data mining)技术方面的例子,以往的数据挖掘是指针对结构化的数据库或是非结构化纯文本所进行的挖掘工作。由于互联网的发展,涌现出大量界于两者之间的半结构化数据,办正研究院认为这种针对半结构化数据进行数据挖掘分析的工作将是未来一个主  相似文献   

10.
源于信息挖掘的新型智能化决策支持系统   总被引:2,自引:0,他引:2  
阐述了以结构化数据和复杂类型数据挖掘为主要内容的信息挖掘技术。采用7库(模型库、综合知识库、数据库、方法库、文本库、日志库、多媒体库)与双网(Internet、Intranet)相结合的体系结构,以信息挖掘技术为核心,提出源于信息挖掘的新型智能化决策支持系统(IDSSIM)。旨在解决决策支持系统对半结构化数据、非结构化数据的挖掘处理能力,使之适应目前信息源的多样型和动态变化性的特点,提供更加丰富的决策信息。  相似文献   

11.
I/O板卡是PC—BASED类型工控应用中重要的外围设备。传统的I/O板卡功能单一,其用户态下的操作受到操作系统影响而具有不确定性。另外,其编程方法中对ISR的应用有一些局限,而其中断延迟在一些超高速的工控场合仍然无法满足要求。针对传统I/O板卡的局限性,提出“主动式”I/O模块的概念,描述其系统结构,讲解提高系统实时性能的机制。  相似文献   

12.
从有线/无线组网方式论述家庭网络中QoS(Quality of Service,服务质量)机制的重要性;在QoS机制的一些基本功能基础上介绍目前家庭网络QoS分类方式以及存在的问题;同时在家庭网关使用QoS相关技术来解决家庭网络中存在的QoS问题。  相似文献   

13.
SQL标准发展概述   总被引:3,自引:1,他引:3  
本文简要介绍SQL标准的发展概况,目前标准的某些关键技术特征,以及标准修订所涉及的未来版本可能确定的内容,最后讨论了SQL标准应用的相关问题。  相似文献   

14.
LabVIEW和MATLAB是目前工程技术领域中比较流行的两种软件,功能强大但又各自存在着不足,本文介绍了在LabVIEW中通过MATLAB Script节点调用MATLAB应用程序的方法及注意事项,从而实现扬长避短,更好发挥各自的长处,例程运行的结果证明这种调用可以很好地实现,并且,这种调用的实现为开发一些大型的系统提供了有力的工具。  相似文献   

15.
OLAP系统中用户的会话视图   总被引:1,自引:0,他引:1  
1.前言在数据库系统中,视图是由基表或其它视图导出的虚表,只在数据目录中保留其逻辑定义,而不作为一个表实际存储在数据库中。数据库管理员可以为特定的用户或用户群定义一个或多个视图,以限制或引导他们对数据库的访问。用户也可以定义视图,把自己的视野集中在有意义的范围内。在文[1]中,提出了Web用户视图的概念,将Web用户的注意力限制在其感兴趣的范围内。  相似文献   

16.
多处理器系统实时调度理论是目前实时系统研究的热点问题。EDF调度算法是目前流行的实时调度算法,有很多优点,但在多处理器系统应用中存在问题。论文研究了EDF调度算法在多处理器系统中的调度理论,在此基础上,提出了一种基于EDF算法的优先级驱动实时调度算法,算法充分利用了EDF调度算法的优点,较大程度地克服了EDF算法在多处理器系统中的调度缺点,并提供了较好的实时调度性能。  相似文献   

17.
基于潜在局部区域空间关系学习的物体分类算法   总被引:1,自引:0,他引:1  
韩东峰  李文辉  郭武 《计算机学报》2007,30(8):1286-1294
提出了一种物体分类模型--潜在局部区域空间关系模型及实现算法.模型描述物体各部分间的潜在空间关系,将抗缩放和仿射变换的特征区域方法与模型相结合,采用变分期望值最大方法进行学习.与同类空间关系模型算法比较,该文模型算法具有以下优点:(1)为非监督式学习模型;(2)可抵抗几何变换;(3)模型为稠密模型;(4)模型描述的是一种潜在的空间关系,这种关系对物体具有更本质的描述.在标准测试图像库上的实验表明了该算法在抵抗平移、旋转、尺度缩放、仿射变换和部分遮挡等难点问题上具有优势.  相似文献   

18.
簇图编辑问题是一个重要的NP-难问题。作为相关性聚类问题的一个特例,它在计算生物等领域有着重要的应用。参数计算理论出现后,参数化的簇图编辑问题逐渐引起了很多人的注意。介绍了求解簇图编辑问题的近似算法、参数算法和它的一些变形,着重分析了参数化簇图编辑问题核心化和FPT算法的最新结果。最后提出了关于该问题的一些研究方向。  相似文献   

19.
该文介绍了IPv6新协议的特点及一些技术规范,分析比较了IPv4和IPv6两种协议的异同点,并深入探讨了从IPv4向IPv6过渡的问题,详细介绍了针对过渡时期不同问题所提出的具体解决方案,重点分析了目前几种比较成熟的技术:双协议栈技术、隧道技术、网络地址-协议转换技术和IVI技术。  相似文献   

20.
自Z.Pawlak提出粗糙集理论以来,众多学者进行了广泛深入的研究,将其拓展至粗糙代数领域。R.Biswas和S.Nanda首次提出了粗糙群(B-N粗糙群)的概念并给出了若干性质,但这一概念本身存在一定缺陷。已有一些研究者指出了B-N粗糙群的定义和结论存在的一些问题,给出了B-N粗糙群的修正定义。以粗糙群的修正定义为基础,提出了粗糙群的阶、粗糙群元素的阶以及粗糙循环群等概念,给出了与之相关的一些性质,通过实例说明了普通循环群的某些性质对粗糙循环群并不成立。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号