基于Deformable DETR的自然场景任意形状文本检测OA
自然场景下的文本区域形状复杂多变,直接使用轮廓坐标描述文本区域会使得建模不充分,导致文本检测准确性低。针对自然场景下文本区域不规则的问题,提出了一种基于Deformable DETR的任意形状文本检测模型,不同于传统的直接预测轮廓点的方法,使用B-样条对文字区域进行建模使得文本轮廓平滑精确的同时减少了需要预测的参数。提出的文本检测模型无需手工设计锚点、区域建议等组件,极大地简化了模型设计并提高了通用性。提出的模型在无需额外数据集的情况下在任意形状文本数据集CTW1500和Total-Text上的平均精度(F值)分别达到了85.4%和85.0%,证明了模型的有效性。
张子旭;游钰玮;仝明磊;薛亮;
上海电力大学电子与信息工程学院,上海201306上海电力大学数理学院,上海201306
计算机与自动化
计算机视觉自然场景文本检测Deformable DETRB-样条
《无线电工程》 2024 (002)
P.312-318 / 7
国家自然科学基金(62105196)。
评论