首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 86 毫秒
1.
赵丹 《福建电脑》2009,25(5):157-158
本文在数据挖掘技术的基础上对数据挖掘系统进行了研究。着重论述了面向企业的数据挖掘系统、数据挖掘系统的原型框架。并分析了企业对数据挖掘系统的需求,探讨了面向企业应用的数据挖掘系统的设计原理与实现方法,论述了数据挖掘技术在企业中的应用,对面向企业数据挖掘系统提出了合理的设计原型及实施办法。  相似文献   

2.
于永玲  李向  宗思生  施进发 《微机发展》2013,(12):161-163,167
为了建立数字校园信息平台,必须对校园GIS数据进行分析和挖掘。文中提出将校园GIS与数据挖掘系统进行集成,空间数据库系统负责空间信息抽取,GIS实现对挖掘结果进行可视化显示。搭建一个空间数据挖掘原型系统模型,利用设计的挖掘算法,挖掘出空间数据库中隐含的知识,并将空间数据挖掘结果进行可视化输出。该原型系统已成功应用于某高校校园GIS,不仅可以挖掘显示知识(校园每个教学楼的上座率),还可以发现隐藏在校园GIS中的隐式知识,是对现有空间数据挖掘系统的有益改进和补充。  相似文献   

3.
数据挖掘原型系统GenMiner中分类挖掘模块的设计与实现   总被引:1,自引:0,他引:1  
吴湘洲  田盛丰 《计算机工程》2002,28(12):111-112,130
通用数据挖掘原型系统GenMiner中分类挖掘模块采用耗时短,分类效率高,较为成熟的决策树C4.5,介绍了该系统中分类挖掘模块的设计与实现,并说明了分类挖掘模块采用决策树C4.5的方法。  相似文献   

4.
Internet上的文本数据挖掘   总被引:48,自引:3,他引:48  
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。  相似文献   

5.
基于J2EE的Web挖掘原型系统的研究与应用   总被引:4,自引:0,他引:4  
首先分析了电子商务给数据挖掘系统设计带来的新特点,电子商务网站的网上业务量巨大,在每天的大量业务中蕴含了许多用户的隐藏信息。每个顾客在Web上的行为都会产生相关数据,这不只是包括购买的信息,而且还有利用搜索引擎和在站点内浏览的相关数据。所有的交互数据都呆以被网站后台的数据库记录下来,这些大量的数据集合包含了对历史记录的市场分析以及数据驱动的市场预测非常有益的潜在信息。然后提出了一个面向电子商务的Web Mining系统的设计与实现方案,并实现了一个基于J2EE平台的原型系统。  相似文献   

6.
一个面向电子商务的数据挖掘系统的设计与实现   总被引:8,自引:0,他引:8  
在分析电子商务给数据挖掘系统设计带来的新特点的基础上,提出了一个面向电子商务的数据挖掘系统的设计与实现方案,并实现了一个基于CORBA平台的原型系统。  相似文献   

7.
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,本文介绍了一种文本数据挖掘方法。并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性。  相似文献   

8.
为了建立数字校园信息平台,必须对校园GIS数据进行分析和挖掘。文中提出将校园GIS与数据挖掘系统进行集成,空间数据库系统负责空间信息抽取,GIS实现对挖掘结果进行可视化显示。搭建一个空间数据挖掘原型系统模型,利用设计的挖掘算法,挖掘出空间数据库中隐含的知识,并将空间数据挖掘结果进行可视化输出。该原型系统已成功应用于某高校校园GIS,不仅可以挖掘显示知识(校园每个教学楼的上座率),还可以发现隐藏在校园GIS中的隐式知识,是对现有空间数据挖掘系统的有益改进和补充。  相似文献   

9.
张静  马垣  张学东 《微处理机》2004,25(1):47-48,50
本文设计并实现了一个数据挖掘原型系统 ,并将增量更新技术应用于此原型中。该原型具有快速的响应能力和处理大数据集的能力。  相似文献   

10.
文本分类是自然语言处理的基本任务之一。该文在原型网络基础上,提出了按时序移动平均方式集成历史原型向量的均值原型网络,并将均值原型网络与循环神经网络相结合,提出了一种新的文本分类模型。该模型利用单层循环神经网络学习文本的向量表示,通过均值原型网络学习文本类别的向量表示,并利用文本向量与原型向量的距离训练模型并预测文本类别。与己有的神经网络文本分类方法相比,模型在训练和预测过程中有效利用了样本间的特征相似关系,并具有网络深度浅、参数少的特点。该方法在多个公开的文本分类数据集上取得了最好的分类准确率。  相似文献   

11.
面向Web的文本挖掘技术研究   总被引:4,自引:0,他引:4  
徐妙君  顾沈明 《控制工程》2003,10(Z1):44-46
简要介绍了文本挖掘技术,并描绘了该技术在Web应用特别是信息检索技术中的重要性.再对整个文本知识挖掘过程所涉及的各个方面进行了进一步地研究探讨,包括了文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价等几个方面.其间运用数据挖掘技术对各个过程进行处理,并引进基于评估函数的特征筛选算法、词频矩阵、余弦计算法和潜在语义标引等方法来处理文本挖掘过程所产生的问题.在此基础上得出了一个完整的Web文本挖掘过程.最后展望了文本挖掘技术在Web应用中的前景.  相似文献   

12.
文本挖掘是对具有丰富语义的文本进行分析从而发现隐含的,令人感兴趣的,有潜在使用价值知识的过程,是数据挖掘的一个新兴主题。本文首先介绍数据挖掘的定义及其发展,进而叙述文本挖掘的含义,回顾国内外文本挖掘的研究现状,着重论述文本分类与文本聚类的一般过程并指出它们的区别之处。最后指出中文文本挖掘的特点,展望了今后的研究目标。  相似文献   

13.
文本挖掘是对具有丰富语义的文本进行分析从而发现隐含的,令人感兴趣的,有潜在使用价值知识的过程,是数据挖掘的一个新兴主题。本文首先介绍数据挖掘的定义及其发展,进而叙述文本挖掘的含义,回顾国内外文本挖掘的研究现状,着重论述文本分类与文本聚类的一般过程并指出它们的区别之处。最后指出中文文本挖掘的特点,展望了今后的研究目标。  相似文献   

14.
本文在分析Web数据挖掘相关理论基础上,深入探讨XML在Web数据挖掘中应用问题,利用XML和Web数据挖掘技术的结合点,提出建立基于XML的Web文本数据挖掘模型,为如何从大量的Web资源中获得有价值的知识提供了一种可行的解决方案。  相似文献   

15.
互联网的普及和飞速发展,使Internet成为世界上最大的信息积聚地,但Internet积聚的信息不同与以往的数据挖掘源,其内容大多是半结构化或非结构化的文本。如何有效的对半结构化或非结构化的文本信息进行挖掘即文本挖掘已成为当今热门的研究方向。  相似文献   

16.
文本挖掘技术的基础是对文本的统计分析。通常,文本挖掘技术的基本做法是通过计算出某一个词或短语的出现频率来计算其在文档中的重要程度。但在统计分析中,其原始语义可能不是其在语句中的准确意思。为了解决这个问题,本文提出一个新的基于概念的模型框架,可以有效地找出文档间的匹配及相关联的概念。  相似文献   

17.
Knowledge Discovery in Databases (KDD) focuses on the computerized exploration of large amounts of data and on the discovery of interesting patterns within them. While most work on KDD has been concerned with structured databases, there has been little work on handling the huge amount of information that is available only in unstructured textual form. This paper describes the KDT system for Knowledge Discovery in Text, in which documents are labeled by keywords, and knowledge discovery is performed by analyzing the co-occurrence frequencies of the various keywords labeling the documents. We show how this keyword-frequency approach supports a range of KDD operations, providing a suitable foundation for knowledge discovery and exploration for collections of unstructured text.  相似文献   

18.
基于Web的文本挖掘技术研究   总被引:2,自引:0,他引:2  
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

19.
许高建 《微机发展》2007,17(6):187-190
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。  相似文献   

20.
Clustering Text Data Streams   总被引:2,自引:0,他引:2       下载免费PDF全文
Clustering text data streams is an important issue in data mining community and has a number of applica- tions such as news group filtering,text crawling,document organization and topic detection and tracing etc.However, most methods axe similaxity-based approaches and only use the TF*IDF scheme to represent the semantics of text data and often lead to poor clustering quality.Recently,researchers argue that semantic smoothing model is more efficient than the existing TF*IDF scheme for improving text clus...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号