首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
文本挖掘及其应用   总被引:4,自引:0,他引:4  
蒋良孝  蔡之华 《现代计算机》2003,37(2):29-31,48
文本挖掘是指利用数据挖掘技术,从大量的文本数据中提取感兴趣的、潜在的有用模式和隐藏的信息。本文详细阐述了文本挖掘的功能、文本挖掘的过程、文本挖掘的应用,并在文章最后介绍了文本挖掘的工具及演示实例。  相似文献   

2.
文本知识发现:基于信息抽取的文本挖掘   总被引:11,自引:0,他引:11  
1.引言大家熟知,所谓“数据丰富但知识缺乏“的现状导致了数据挖掘(Data Mining)技术研究的兴起,数据挖掘又称数据库知识发现(Knowledge Discovery in Databases)是从海量的结构化信息中抽取或挖掘隐含信息和知识的重要方法和途径。数据挖掘技术已相当成熟。因为除了结构化的数据之外,在数字化信息中更多地存在大量自由、非结构化或半结构化的文本信息如新闻文章、电子书本、电子图书馆藏、Web页面内容、Email、文档数据库等,显然手工处理需要花费大量的人力物力,并且具有不确定性。所以出现了从文本中发现知  相似文献   

3.
基于Web的文本挖掘系统的研究与实现   总被引:13,自引:0,他引:13  
1.引言 60年代,大的物理流伴随着大信息流。传统的文件方式不能适应信息处理的需求,因此出现了数据库技术。90年代,人类积累的数据量以高于每月15%(或每年5.3倍)的速度增加,但是数据海洋不能产生决策意志,为了进行决策,人们不断地扩大数据库能力,搜集海量数据,但这使得决策者更难于决策,因此出现了数据挖掘技术,以便从数据库中发现知识。数据挖掘技术包括特征、分类、关联、聚类、偏差、时间序列、趋势分析等。  相似文献   

4.
文本挖掘 挖掘知识   总被引:7,自引:0,他引:7  
面对今天浩如烟海的文本信息,如何帮助人们有效地收集和选择所感兴趣的信息,如何帮助用户在日益增多的信息中自动发现新的概念,并自动分析它们之间的关系,使之能够真正做到信息处理的自动化,这已经成为信息技术领域的热点问题。  相似文献   

5.
Web文本挖掘系统及其分类算法的研究与实现   总被引:9,自引:0,他引:9  
介绍了Web文本挖掘系统WTMS的系统总体结构图,实现了其核心算法——基于距离测度函数的分类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行分类挖掘,从而帮助人们快速进行文本信息导航,获取重要的知识。  相似文献   

6.
文本挖掘研究进展   总被引:2,自引:0,他引:2  
文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程.本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品.  相似文献   

7.
基于Multi-Agent的Web文本挖掘系统   总被引:1,自引:0,他引:1  
基于Multi-Agent(多智体)技术的Web文本挖掘是从海量信息源尤其是Web文本信息源中快速、有效地获取知识所提出的一个新型研究领域。本论文给出了基于Multi-Agent技术的Web文本挖掘系统模型,并利用Multi-Agent技术实现了Web数据预处理、数据的挖掘、知识的获取、知识的评价与表示等功能。  相似文献   

8.
Web文本挖掘系统及聚类分析算法   总被引:2,自引:0,他引:2  
朱克斌  唐菁  杨炳儒 《计算机工程》2004,30(13):138-139,183
给出了Web文本挖掘系统WTMS的系统总体结构图,开发并实现了基于SOM的Web文档层次聚类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘,从而帮助人们快速进行文本信息导航,获取重要的知识。  相似文献   

9.
文本挖掘有着极大的应用前景,更加有效的文本挖掘算法设计仍然有很大的研究空间,本文将从文本挖掘涉及的关键技术进行阐述以求对文本挖掘有整体的把握与理解。  相似文献   

10.
文本挖掘是对具有丰富语义的文本进行分析从而发现隐含的,令人感兴趣的,有潜在使用价值知识的过程,是数据挖掘的一个新兴主题。本文首先介绍数据挖掘的定义及其发展,进而叙述文本挖掘的含义,回顾国内外文本挖掘的研究现状,着重论述文本分类与文本聚类的一般过程并指出它们的区别之处。最后指出中文文本挖掘的特点,展望了今后的研究目标。  相似文献   

11.
Internet上的文本数据挖掘   总被引:48,自引:3,他引:48  
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。  相似文献   

12.
文本知识发现:基于信息抽取的文本挖掘蝌   总被引:9,自引:0,他引:9  
In the general context of Knowledge Discovery, Knowledge Discovery in Text (KDT), which uses TextMining techniques to extract and induce hidden knowledge from unstructured text data, surges in the data and naturallanguage processing research. KDT is a multi-discipline of Artificial Intelligence, Machine learning, Natural Lan-ing with a stressing on its IE (Information Extraction)-based induction and specific sublanguage fields oriented prac-tices.  相似文献   

13.
可视化中文文本挖掘模型   总被引:13,自引:0,他引:13  
面对今天浩如烟海的信息,如何帮助人们有效地收集和选择所感兴趣的信息,更关键的是如何帮助用户在日益增多的信息中自动发现新的概念并自动分析它们之间的关系,使之能够真正地做到信息处理的自动化,这已成为信息技术领域的热点问题。在这样的需求驱动下,文本挖掘得到了长足的发展,并取得了相当的成功。由于目前在因特网上大多数的信息表现形式为文本形式,只有通过文本挖掘才能充分地利用信息资源。  相似文献   

14.
文本挖掘技术研究进展   总被引:21,自引:0,他引:21  
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。  相似文献   

15.
数据采掘方法及其在金融行业中的应用   总被引:2,自引:0,他引:2  
陈增乔  徐大杰 《计算机工程》1998,24(11):56-57,72
在现实生活中随着数据的日趋庞大,需要有新一代的智能工具和技术对之进行处理。数据采掘正是着眼于此,它的主要目的在于开发相关的技术和工具,从浩翰的数据中获取有价值的信息,简要综述数据采掘的基本概念、任务、要求和基本方法等有关工作,并给出了一个应用于金融行业的实例研究。  相似文献   

16.
TH-Miner是以JaVa实现的跨平台数据挖掘可视化系统。在TH-Miner中实现了多种经典的数据挖掘算法,并构造了几种新的改进算法。TH-Miner包括可视化聚类挖掘工具、分类算法工具、序列模式挖掘算法工具以及文本分类工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号