基于XML的web文本挖掘方法与模型研究 Research on method and model of web mining based on XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于XML的web文本挖掘方法与模型研究

引用本文：	亓洪标,李安,胡柏青.基于XML的web文本挖掘方法与模型研究[J].微计算机信息,2006,22(33):196-197.

作者姓名：	亓洪标李安胡柏青

作者单位：	1. 430033,武汉,海军工程大学电气与信息工程学院 2. 430033,武汉,海军工程大学理学院

基金项目：	解放军总装备部预研项目

摘要：	Internet的快速发展和大量非结构化数据的出现,给传统的数据挖掘工具带来了极大的挑战。XML(可扩展标记语言)技术一方面继承了HTML的灵活性和简单性,另一方面又具有强制结构的完整性和标签的自定义性,已经成为web挖掘的一个重要方向。本文在介绍XML语言基本特点的基础上,针对web上大量异构数据的特点,探讨了基于多叉树的HTML到XML的转换方法,实现web上文本的规范化,并将其用于提出的基于XML的web文本挖掘模型,提高web文本挖掘的有效性。
关键词：	web文本挖掘多叉树
文章编号：	1008-0570(2006)11-3-0196-02
修稿时间：	2006年4月28日
Research on method and model of web mining based on XML

QI HONGBIAO,LI AN,HU BOQING.Research on method and model of web mining based on XML[J].Control & Automation,2006,22(33):196-197.

Authors:	QI HONGBIAO LI AN HU BOQING

Affiliation:	QI HONGBIAO LI AN HU BOQING

Abstract:

Keywords:	XML
本文献已被 CNKI 万方数据等数据库收录！