首页 | 本学科首页   官方微博 | 高级检索  
     

基于模式发现的在线招聘信息抽取
引用本文:陈建辉,刘利民.基于模式发现的在线招聘信息抽取[J].微计算机信息,2006,22(27):194-196.
作者姓名:陈建辉  刘利民
作者单位:010051,内蒙古工业大学信息工程学院
摘    要:随着互联网的迅速发展,网络已成为招聘信息的重要来源。但是各个人才招聘网站结构各异、形式多样,人们要花大量的精力才能实现招聘信息的抽取。本文针对招聘信息的显示特点,提出一种基于模式发现的在线招聘信息抽取器设计框架。该信息抽取器将PAT数组用于模式发现,实现招聘信息的自动抽取,对以列表、表格形式显示的招聘信息以及类似的在线商品等信息的在线抽取都有较好的效果。

关 键 词:Web抽取  模式发现  半结构化数据  PAT数组
文章编号:1008-0570(2006)09-3-0194-03
修稿时间:2006年1月25日

OnLine-Recruiment Information Extraction Based on Patterns Discovery
Chen,Jianhui,Liu,Limin.OnLine-Recruiment Information Extraction Based on Patterns Discovery[J].Control & Automation,2006,22(27):194-196.
Authors:Chen  Jianhui  Liu  Limin
Abstract:With the rapid growth of the WWW, Web has become a important information resources for recruiment. However, because of the different of online- recruiment websites' s structure, people must spend a great deal of time and energy in extracting the on- line- recruiment information. Based on display character of online- recruiment information, this thesis bring out a design about extrac- tion tool based on patterns discovery. This tool applied PAT- array on pattern discovery to achieve automatic extraction of online- re- cruiment information. It can successfully apply in extracting for onliner- recruiment information or online- commodity information which display on the web with table or list.
Keywords:XML
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号