首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web的文本挖掘技术研究
引用本文:许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,17(6):187-190.
作者姓名:许高建
作者单位:合肥工业大学,计算机与信息学院,安徽,合肥,230009;安徽农业大学,信息与计算机学院,安徽,合肥,230036
基金项目:安徽省高校省级自然科学基金
摘    要:Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。

关 键 词:Web挖掘  文本挖掘  文本分类  文本聚类
文章编号:1673-629X(2007)06-0187-04
收稿时间:2006-08-25
修稿时间:2006-08-25

Research on Text Mining Techniques Web- Based
XU Gao-jian.Research on Text Mining Techniques Web- Based[J].Computer Technology and Development,2007,17(6):187-190.
Authors:XU Gao-jian
Abstract:Most information on Internet are text formatting. How to find the potential knowledge from the immensity text information is an awaiting to be settled question, which is the purpose of text mining. This is a process for analyzing text and getting the customizing messages from them. This paper introduces what is the text mining systemically, and it also further discusses the aspects involved in text mining process, including text architecture construction, feature mining, text categorization, text clustering etc. And a text mining model based on Web is presented. And will build an automatic text classification system on BBS by using programming language.
Keywords:Web mining  text mining  text categorization  text clustering
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号