首页 | 本学科首页   官方微博 | 高级检索  
     

面向Web的文本挖掘技术研究
引用本文:徐妙君,顾沈明.面向Web的文本挖掘技术研究[J].控制工程,2003,10(Z1):44-46.
作者姓名:徐妙君  顾沈明
作者单位:1. 浙江大学,信息学院,浙江,杭州,310000
2. 浙江海洋学院,信息学院,浙江,舟山,316004
摘    要:简要介绍了文本挖掘技术,并描绘了该技术在Web应用特别是信息检索技术中的重要性.再对整个文本知识挖掘过程所涉及的各个方面进行了进一步地研究探讨,包括了文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价等几个方面.其间运用数据挖掘技术对各个过程进行处理,并引进基于评估函数的特征筛选算法、词频矩阵、余弦计算法和潜在语义标引等方法来处理文本挖掘过程所产生的问题.在此基础上得出了一个完整的Web文本挖掘过程.最后展望了文本挖掘技术在Web应用中的前景.

关 键 词:数据挖掘    文本挖掘    Internet
文章编号:1671-7848(2003)S0-0044-04
修稿时间:2002年12月19

Study on Text Mining on Web
Abstract:
Keywords:data mining  text mining  internet
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号