首页 | 本学科首页   官方微博 | 高级检索  
     

网页信息自动提取的设计与实现
引用本文:栗勇兵,韩平,董启雄.网页信息自动提取的设计与实现[J].计算机光盘软件与应用,2012(18):187-188.
作者姓名:栗勇兵  韩平  董启雄
作者单位:装备学院信息管理中心
摘    要:网页信息自动提取是一种重要的网络应用技术,用于提取各类网页的专门信息。网页信息自动提取的设计基于网页的半结构化特征,其流程是先获取HTML源文件,然后去掉HTML标记和无关信息,再进行语义匹配,提取信息到特定的数据结构,进行CSV格式化输出,就可以得到所需的信息。在网站企业化、网店普遍化和网络购物盛行的背景下,推广和应用网页信息自动提取技术,有着重要的经济价值和意义。

关 键 词:网页信息  提取  设计
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号