首页 | 本学科首页   官方微博 | 高级检索  
     

基于视觉注意力模型的电表铭牌识别研究
引用本文:刘 影,张忠宝,张 威,鲁观娜,彭鑫霞.基于视觉注意力模型的电表铭牌识别研究[J].电子器件,2022,45(3):623-627.
作者姓名:刘 影  张忠宝  张 威  鲁观娜  彭鑫霞
作者单位:国网冀北电力有限公司
基金项目:国网冀北电力有限公司科技项目(52018K19002G)
摘    要:为实现电力设备铭牌中文字信息的自动识别,提升设备管理的效率,提出一种面向场景文字(scene text)的文本内容识别方法。该方法依赖于从卷积特征中训练得到的基于长短时记忆网络(long short-term memory,LSTM)的视觉注意力模型。一组特征向量由与图像不同区域对应的卷积层提取,从而将图像空间信息编码到特征中。通过这一方式,模型可以选择关注图像的不同部分,并结合卷积特征与注意力权重识别文字。进一步地 ,引入语言模型并修改集束搜索(beam search)策略可以显著改善识别效果。在真实数据集上的结果验证了该方法的有效性。

关 键 词:电力设备  场景文字识别  计算机视觉  卷积神经网络  长短时记忆网络
点击此处可从《电子器件》浏览原始摘要信息
点击此处可从《电子器件》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号