首页 | 本学科首页   官方微博 | 高级检索  
     

文本知识发现:基于信息抽取的文本挖掘
引用本文:周雪忠,吴朝晖.文本知识发现:基于信息抽取的文本挖掘[J].计算机科学,2003,30(1):63-66.
作者姓名:周雪忠  吴朝晖
作者单位:浙江大学计算机系,浙江大学计算机系 杭州 310027,杭州 310027
摘    要:1.引言大家熟知,所谓“数据丰富但知识缺乏“的现状导致了数据挖掘(Data Mining)技术研究的兴起,数据挖掘又称数据库知识发现(Knowledge Discovery in Databases)是从海量的结构化信息中抽取或挖掘隐含信息和知识的重要方法和途径。数据挖掘技术已相当成熟。因为除了结构化的数据之外,在数字化信息中更多地存在大量自由、非结构化或半结构化的文本信息如新闻文章、电子书本、电子图书馆藏、Web页面内容、Email、文档数据库等,显然手工处理需要花费大量的人力物力,并且具有不确定性。所以出现了从文本中发现知

关 键 词:文本知识发现  信息抽取  文本挖掘  数据库  数据挖掘

Knowledge Discovery in Text: A Survey
ZHOU Xue-Zhong WU Zhao-Hui.Knowledge Discovery in Text: A Survey[J].Computer Science,2003,30(1):63-66.
Authors:ZHOU Xue-Zhong WU Zhao-Hui
Abstract:In the general context of Knowledge Discovery, Knowledge Discovery in Text (KDT), which uses Text Mining techniques to extract and induce hidden knowledge from unstructured text data, surges in the data and natural language processing research. KDT is a multi-discipline of Artificial Intelligence, Machine learning, Natural Language Processing and Information Extraction & Information Retrieval. This paper presents an overview of Text Mining with a stressing on its IE (Information Extraction)-based induction and specific sublanguage fields oriented practices.
Keywords:Text mining  Text data mining  Information extraction  Knowledge discovery in text  Sublanguage  
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号