首页 | 本学科首页   官方微博 | 高级检索  
     

基于启发式信息的Deep Web查询接口属性抽取
引用本文:梁浩,左万利,任斐,赫枫龄.基于启发式信息的Deep Web查询接口属性抽取[J].计算机研究与发展,2009,46(Z2).
作者姓名:梁浩  左万利  任斐  赫枫龄
作者单位:1. 吉林大学计算机科学与技术学院,长春,130012;长春税务学院信息系,长春,130012
2. 吉林大学计算机科学与技术学院,长春,130012;符号计算与知识工程教育部重点实验室,长春,130012
3. 吉林大学计算机科学与技术学院,长春,130012
基金项目:国家自然科学基金项目,国家自然科学杰出青年基金项目,吉林省科技发展计划基金项目,高等学校博士学科点专项科研基金项目,吉林大学基本科研业务费交叉学科与创新基金项目 
摘    要:电子商务网站以查询接口的方式提供商务信息,查询接口也是隐藏在后端的Deep Web数据库模式信息的载体.有效解析查询接口是访问Deep Web资源的第1步,但是由于查询接口在不同的设计模式和开发语言下实现,所以导致了属性难以抽取、语义关系复杂的现象.为提高属性抽取的准确率且实现在语义层面上对查询接口的解读,提出一种以查询接口启发式信息为基础的属性抽取方法,通过使用本体工具对属性集合进行拓展并获取语义描述.在实际的电子商务网站上进行的广泛实验证明了提出方法的可行性与有效性.

关 键 词:电子商务  查询接口  语义关系  启发式信息

Deep Web Query Interface Attributes Extraction Based on Heuristic Information
Liang Hao,Zuo Wanli,Ren Fei,He Fengling.Deep Web Query Interface Attributes Extraction Based on Heuristic Information[J].Journal of Computer Research and Development,2009,46(Z2).
Authors:Liang Hao  Zuo Wanli  Ren Fei  He Fengling
Abstract:E-commerce Web sites provide economic information by the query interfaces,which are considered as Web services that indirectly reflect the real schema of the deep Web.The first step of accessing the deep Web is to parse query interfaces effectively.The query interfaces are designed and coded in different development models using different programming languages and the semantic relation is very complicated in the query interfaces.Aiming to improve the accuracy of extracting attributes and realize machine-readable query interfaces semantically,an approach is presented to extract the attributes based on heuristic information and sets of attributes are enriched utilizing ontology to get deep semantic understanding of the query interfaces.Extensive experiments over realword domains show the utility and ability of the algorithm parsing the interfaces and extracting valid attributes.
Keywords:Deep Web  e-commerce  deep Web  query interface  semantic relation  heuristic information
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号