基于残差网络和OCR技术的人物敏感广告识别 |
| |
作者姓名: | 杜佳 |
| |
作者单位: | 深圳市标准技术研究院,广东深圳,518000 |
| |
基金项目: | 深圳电子商务交易安全工程实验室提升项目 |
| |
摘 要: | ![]() 为响应国家“净网行动”,本实验针对蕴涵文本信息的图片广告难以审核问题,提出一种基于人脸识别和OCR文字识别的图文结合的审核技术,通过构建敏感人物的人脸图片库和敏感人物人名库进行对比审核。本实验采用基于c++编写的Dlib库face_recognition,利用其底层的残差网络(ResNet)学习图像特征,对于疑似包含敏感人物的广告图片先进行人脸目标检测,然后利用锁定的人脸图像块抽取人脸特征,然后和构建的敏感人物人脸图片库进行对比,识别出是否含有敏感人物;同时利用OCR技术从图片中识别提取文本信息,利用基于前缀树字典和AC自动机算法的flashtext关键词匹配算法,根据构建的敏感人名库进行规则匹配审核,达到基于图文结合的人物敏感广告图片识别的效果。
|
关 键 词: | 图文结合 人脸识别 规则匹配 |
本文献已被 万方数据 等数据库收录! |
|