首页 | 本学科首页   官方微博 | 高级检索  
     

基于语义树的非结构化年鉴Excel表格的ETL方法
引用本文:赵乐,赵宏宇,刘斌,陈彦如. 基于语义树的非结构化年鉴Excel表格的ETL方法[J]. 计算机应用, 2021, 41(z2): 131-135. DOI: 10.11772/j.issn.1001-9081.2021020233
作者姓名:赵乐  赵宏宇  刘斌  陈彦如
作者单位:西南交通大学计算机与人工智能学院,成都611756;中铁第四勘察设计院集团有限公司,武汉430063;西南交通大学经济管理学院,成都610031
摘    要:针对计算机程序在对海量Excel表格中的中国城市年鉴数据进行抽取?转换?加载(ETL)时由于表格的非结构化格式导致的准确率和查全率较低的问题,提出了一种基于语义树的ETL方法.首先,通过数据与表格行名、列名的对应关系分别建立两棵语义树模型,利用两棵语义树生成包含数据项以及数据项所属行名、列名的元数据集合;然后,通过正则...

关 键 词:Excel表格  抽取—转换—加载  语义树  正则表达式  数据仓库

ETL method of unstructured yearbook Excel form based on semantic tree
ZHAO Le,ZHAO Hongyu,LIU Bin,CHEN Yanru. ETL method of unstructured yearbook Excel form based on semantic tree[J]. Journal of Computer Applications, 2021, 41(z2): 131-135. DOI: 10.11772/j.issn.1001-9081.2021020233
Authors:ZHAO Le  ZHAO Hongyu  LIU Bin  CHEN Yanru
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号