首页 | 本学科首页   官方微博 | 高级检索  
     

基于自然语言的云数据库非结构化数据提取
引用本文:侯本忠,张永强,尚颖,梁昕,刘甜甜,苏江文.基于自然语言的云数据库非结构化数据提取[J].信息技术,2023(3):57-63.
作者姓名:侯本忠  张永强  尚颖  梁昕  刘甜甜  苏江文
作者单位:1. 国家电网有限公司;2. 国网北京市电力公司;3. 国网福建省电力有限公司;4. 国家电网有限公司大数据中心;5. 福建亿榕信息技术有限公司
基金项目:国家电网公司总部数字化审计平台智能化相关技术研究科技项目(1300-201999440A-0-0-00);
摘    要:以非结构化数据高精度提取为目的,利用改进K-均值算法聚类云数据库非结构化数据,对分类后非结构化数据进行归一化预处理;通过基于自然语言语义的数据库目标检索模型,对预处理后的多种云数据库非结构化数据,按照用户需求实时提取。经测试:所提方法在不同数据集中,对多种类型的云数据库非结构化数据提取结果存在可信度,最大偏差为1个,偏差极小,在可接受范围内,可高精度提取云数据库非结构化数据。

关 键 词:自然语言  云数据库  非结构化  数据提取  聚类
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号