首页 | 本学科首页   官方微博 | 高级检索  
     

基于内容的网页信息挖掘原理和设计
引用本文:张义忠,赵明生,梁久祯.基于内容的网页信息挖掘原理和设计[J].测试技术学报,2002,16(Z2):1433-1438.
作者姓名:张义忠  赵明生  梁久祯
作者单位:清华大学电子工程系,北京,100084
基金项目:本课题得到清华大学985项目和国家自然科学基金(60003014)资助
摘    要:本文提出了一种SOFM(自组织特征映射)与LVQ(学习矢量量化)相结合的分类算法,利用一种新的网页表示方法,形成特征向量并应用于网页分类中.该方法充分利用了SOFM自组织的特点,同时又利用LVQ解决聚类中测试样本的交迭问题.实验表明它不仅具有较高的训练效率,同时有比较好的查全率和查准率.

关 键 词:自组织特征映射  特征提取  神经网络  分类
修稿时间:2002年3月23日

Principle and Implementation of Information Mining Based on Content
Zhang Yizhong,Zhao Mingsheng,Liang Jiuzhen.Principle and Implementation of Information Mining Based on Content[J].Journal of Test and Measurement Techol,2002,16(Z2):1433-1438.
Authors:Zhang Yizhong  Zhao Mingsheng  Liang Jiuzhen
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号