计算机应用研究2023,Vol.40Issue(8):2367-2374,8.DOI:10.19734/j.issn.1001-3695.2022.11.0517
基于跨模态多维关系增强的多模态模型研究
Research on multi-modal model based on cross-modal multi-dimensional relationship enhancement
摘要
关键词
图像描述/视觉问答/特征多样性/空间关系/上下文语义关系/特征融合/多模态编码Key words
image description/visual question answering/feature diversification/spatial relationship/contextual semantic relationship/feature fusion/multimodal encoding分类
信息技术与安全科学引用本文复制引用
成曦,杨关,刘小明,刘阳..基于跨模态多维关系增强的多模态模型研究[J].计算机应用研究,2023,40(8):2367-2374,8.基金项目
国家自然科学基金青年资助项目(61906141) (61906141)
河南省高等学校重点科研资助项目(23A520022) (23A520022)
东北师范大学应用统计教育部重点实验室资助项目(135131007) (135131007)