首页 | 本学科首页   官方微博 | 高级检索  
     

改进的基于本体的Web信息抽取
作者单位:;1.山东科技大学信息科学与工程学院
摘    要:针对Web信息抽取主要依据内容进行抽取的思想,通过对基于本体的Web信息抽取技术的分析,在对网页进行预处理的过程中引入网页分块思想。通过网页分块技术准确提取出所需信息的抽取区域,再根据本体抽取规则对得到的抽取区域进行处理,最终得到需要的信息。实验验证了改进的基于本体的Web信息抽取算法具有更高的准确率和召回率,具有良好的应用前景。

关 键 词:信息抽取  网页分块  本体  抽取规则  准确率

IMPROVED ONTOLOGY-BASED WEB INFORMATION EXTRACTION
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号