计算机应用研究2022,Vol.39Issue(1):280-284,302,6.DOI:10.19734/j.issn.1001-3695.2021.06.0197
基于多模态推理图神经网络的场景文本视觉问答模型
Visual question answering model of vision and scene text based on multi-modal reasoning graph neural network
摘要
关键词
视觉问答/图神经网络/多模态推理/问题自注意力分类
信息技术与安全科学引用本文复制引用
张海涛,郭欣雨..基于多模态推理图神经网络的场景文本视觉问答模型[J].计算机应用研究,2022,39(1):280-284,302,6.基金项目
辽宁省自然科学基金面上项目 ()
中国人民解放军总装备部装备预研基金项目 ()