双注意力机制的复杂场景文字识别网络OA
文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和中英文字符混杂形似等诸多问题,设计出具有文字区域提取与校正、图像增强、文本检测和文本识别的光学字符识别(Optical Character Recognition,OCR)算法框架。设计了基于双注意力机制和内容感知上采样的DBNet文本检测模块增强网络的特征提取选择能力,提高内容感知能力,设计了融入中心损失CRNN+CTC的文本识别模块增大字符之间的特征间距。实验结果表明,改进的文本检测网络在ICDAR2015数据集上准确率提升了5.09%,召回率提高2.12%,F评分提高了3.46%。在中英文文本识别数据集中,改进的文本识别网络对中英文字符识别准确率提高了1.2%。
宋问玉;杜文爽;封宇;王丽园;
华中电力国际经贸有限责任公司,湖北武汉430066 中国电力技术装备有限公司,北京100052武汉大学电子信息学院,湖北武汉430072中交第二公路勘察设计研究院有限公司,湖北武汉430040
计算机与自动化
路标识别双注意力机制文本检测文本识别
《无线电工程》 2024 (002)
P.343-350 / 8
国家自然科学基金(42101448)。
评论