首页 | 本学科首页   官方微博 | 高级检索  
     

电力企业互联网舆情数据规格化存储系统设计
引用本文:韩维,孙林檀,吕静贤,陈龙,彭渤,潘宝玉.电力企业互联网舆情数据规格化存储系统设计[J].信息技术,2023(8):160-164.
作者姓名:韩维  孙林檀  吕静贤  陈龙  彭渤  潘宝玉
作者单位:1. 国家电网有限公司客户服务中心;2. 天津市普迅电力信息技术有限公司
摘    要:为避免舆情焦点损伤电力企业形象,设计了电力企业互联网舆情数据规格化存储系统,实时采集、处理并存储公共舆情数据。利用基于TF-IDF改进算法的聚焦网络爬虫爬取原始数据层的舆情数据,构建正则表达式描述语义模型;应用基于负载权重的负载均衡算法的存储负载均衡机制,根据负载差值计算存储节点执行任务的概率,更新存储节点的负载,实现各存储节点负载均衡。实验结果表明:读取时间均值为72.9ms,写入时间均值为425.3ms,数据读写效率高,各存储节点负载均衡,对大规模数据的处理及存储性能更佳。

关 键 词:电力企业  规格化存储  网络爬虫  负载均衡
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号