首页 | 本学科首页   官方微博 | 高级检索  
     

文本挖掘技术研究进展*
引用本文:袁军鹏,朱东华,李毅,李连宏,黄进.文本挖掘技术研究进展*[J].计算机应用研究,2006,23(2):1-4.
作者姓名:袁军鹏  朱东华  李毅  李连宏  黄进
作者单位:1. 清华大学,公共管理学院,北京,100084
2. 北京理工大学,管理与经济学院,北京,100081
3. 空军济南四站厂,山东,济南,250022
基金项目:国家自然科学基金资助项目(70031010); 北京理工大学学校基金项目;北京理工大学育苗基金项目
摘    要:文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。

关 键 词:文本挖掘    中文分词    特征选取    文本摘要    文本分类    文本聚类    关联分析    数据可视化
文章编号:1001-3695(2006)02-0001-04
收稿时间:2005-06-22
修稿时间:2005-09-21

Survey of Text Mining Technology
YUAN Jun-peng,ZHU Dong-hu,LI Yi,LI Lian-hong,HUANG Jin.Survey of Text Mining Technology[J].Application Research of Computers,2006,23(2):1-4.
Authors:YUAN Jun-peng  ZHU Dong-hu  LI Yi  LI Lian-hong  HUANG Jin
Abstract:Text Mining, also known as intelligent text analysis, text data mining or Knowledge-Discovery in Text (KDT), is a rapidly emerging field concerned with the extraction of concepts, relations, and implicit knowledge from texts. As most information (over 80%) is stored as text, text mining is believed to have a high commercial potential value. Firstly, this review paper discusses the research status of text mining, then it lays out the framework of text mining and analyses techniques of text mining, such as feature selection, automatic abstracting, text categorization, text clustering, text association, data visualization. In the end, it shows the importance of text mining in knowledge discovery and highlights the upcoming challenges of text mining and the opportunities it offers.
Keywords:Text Mining  Cutting Chinese Word  Feature Selection  Text Automatic Abstracting  Text Categorization  Text Clustering  Text Association  Data Visualization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号