首页 | 本学科首页   官方微博 | 高级检索  
     

面向领域的Web信息自动抽取技术研究
引用本文:陈建彪.面向领域的Web信息自动抽取技术研究[J].计算机光盘软件与应用,2012(24):59-60.
作者姓名:陈建彪
作者单位:新乡学院,新乡河南 454000
摘    要:本文分析了目前Web数据抽取主流技术,针对领域网站上文本信息采用MDR算法进行抽取,阐述了网页抽取的工作流程,并通过引入文本分类算法提高了网页抽取的查准率.

关 键 词:网页抽取  DOM  面向领域
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号