首页 | 本学科首页   官方微博 | 高级检索  
     

基于DOM的Deep Web查询接口属性抽取方法
引用本文:石龙,强保华,何倩,吴春明,谌超.基于DOM的Deep Web查询接口属性抽取方法[J].桂林电子科技大学学报,2012,32(6):468-472.
作者姓名:石龙  强保华  何倩  吴春明  谌超
作者单位:1. 桂林电子科技大学计算机科学与工程学院,广西桂林,541004
2. 桂林电子科技大学计算机科学与工程学院,广西桂林541004;西南大学计算机与信息科学学院,重庆400715
3. 西南大学计算机与信息科学学院,重庆,400715
基金项目:国家自然科学基金(61163057)
摘    要:属性抽取主要基于单元素属性抽取,而多元素属性抽取的研究较少.针对多元素组成属性情况进行研究,提出一种基于查询接口DOM结构的属性抽取方法,该方法将查询接口解析成DOM,基于DOM节点提取查询接口上对应的表单元素,对从查询接口上提取获得的元素集合进行二次聚类,挖掘元素之间的组合关系,最终将元素组合形成属性.这种方法能很好地抽取接口上的单元素属性和多元素属性,实验结果表明了方法的有效性.

关 键 词:属性抽取  Deep  Web  查询接口  DOM节点  表单元素

Attributes extraction of Deep Web query interface based on DOM
Shi Long , Qiang Baohua , He Qian , Wu Chunming , Chen Chao.Attributes extraction of Deep Web query interface based on DOM[J].Journal of Guilin Institute of Electronic Technology,2012,32(6):468-472.
Authors:Shi Long  Qiang Baohua  He Qian  Wu Chunming  Chen Chao
Affiliation:1(1.School of Computer Science and Engineering,Guilin University of Electronic Technology,Guilin 541004,China; 2.School of Computer and Information Science,Southwest University,Chongqing 400715,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号