首页 | 本学科首页   官方微博 | 高级检索  
     

主题网页标签树邻接矩阵识别算法研究
引用本文:宋军,杨晓夫,李益才,王家伟.主题网页标签树邻接矩阵识别算法研究[J].计算机科学,2016,43(6):316-320.
作者姓名:宋军  杨晓夫  李益才  王家伟
作者单位:重庆交通大学信息科学与工程学院 重庆400074,重庆交通大学信息科学与工程学院 重庆400074,重庆交通大学信息科学与工程学院 重庆400074,重庆交通大学信息科学与工程学院 重庆400074
基金项目:本文受国家自然科学基金(61573076)资助
摘    要:随着Web编程技术的发展,同类主题网页可以采用不同的Html标签展示出视觉特征相同的网页信息,导致需要匹配Html标签名称的现有网页结构相似性算法无法准确识别同类主题网页。因此,提出一种主题网页标签树邻接矩阵识别算法,通过构造主题网页标签树邻接矩阵,并利用邻接矩阵的结构特征来计算网页之间的结构相似度以实现同类主题网页识别。实验结果表明,该算法的最佳性能达到查全率100%、查准率96%,平均性能达到查全率97%、查准率89%。

关 键 词:网页结构  Html标签  标签树邻接矩阵
收稿时间:2015/8/20 0:00:00
修稿时间:2015/10/20 0:00:00

Research on Recognition Algorithm for Subject Web Pages Based on Tag Tree Adjacency Matrix
SONG Jun,YANG Xiao-fu,LI Yi-cai and WANG Jia-wei.Research on Recognition Algorithm for Subject Web Pages Based on Tag Tree Adjacency Matrix[J].Computer Science,2016,43(6):316-320.
Authors:SONG Jun  YANG Xiao-fu  LI Yi-cai and WANG Jia-wei
Affiliation:School of Information Science and Engineering,Chongqing Jiaotong University,Chongqing 400074,China,School of Information Science and Engineering,Chongqing Jiaotong University,Chongqing 400074,China,School of Information Science and Engineering,Chongqing Jiaotong University,Chongqing 400074,China and School of Information Science and Engineering,Chongqing Jiaotong University,Chongqing 400074,China
Abstract:
Keywords:Web page structure  Html tag  Tag tree adjacency matrix
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号