首页 | 本学科首页   官方微博 | 高级检索  
     

基于本体的旅游信息抽取
引用本文:陈立娜,张红,马莉,蒋运承.基于本体的旅游信息抽取[J].计算机应用与软件,2010,27(4):146-148,161.
作者姓名:陈立娜  张红  马莉  蒋运承
作者单位:广西师范大学计算机科学与信息工程学院,广西,桂林,541004
基金项目:广西青年科学基金项目(0640030);;广西科学研究与技术开发计划项目(0719001-11)
摘    要:基于本体的信息抽取技术是一种把本体和信息处理技术结合起来实现信息抽取的一种方法。提出一种基于本体的旅游领域信息抽取方法。该方法依据旅游本体的关键词定位页面信息区域,从网页中抽取正文信息,对其进行分词处理及过滤,再根据Java标注模式引擎JAPE(Java Annotation Patterns Engine)编写的规则进行本体匹配,形成结构化的内容,存入数据库。最后,通过实验证明了所提出的方法的准确性。

关 键 词:本体  信息抽取  DOM树  旅游信息  

ONTOLOGY-BASED TOURISM INFORMATION EXTRACTION
Chen Lina,Zhang Hong,Ma Li,Jiang Yuncheng.ONTOLOGY-BASED TOURISM INFORMATION EXTRACTION[J].Computer Applications and Software,2010,27(4):146-148,161.
Authors:Chen Lina  Zhang Hong  Ma Li  Jiang Yuncheng
Affiliation:College of Computer Science and Engineering/a>;Guangxi Normal University/a>;Guilin 541004/a>;Guangxi/a>;China
Abstract:Ontology-based information extraction is a method of information extraction realisation which combines ontology with information processing technique together.An ontology-based tourism information extraction is proposed in this paper.The method positions the webpage information region according to the keywords in tourism ontology and extracts content information from the website,then the word segmentation and filtration are performed,follows up with the ontology matching based on the rule compiled by JAPE t...
Keywords:Ontology Information extraction DOM tree Tourism information  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号