计算机应用研究Issue(3):956-960,5.DOI:10.19734/j.issn.1001-3695.2019.11.0691
基于硬注意力机制的多模态视频字幕的处理
Hard attention based multi-modal fusion for video caption generation
郭宁宁 1蒋林华1
作者信息
- 1. 上海理工大学 光电信息与计算机工程学院,上海200093
- 折叠
摘要
关键词
编码器—解码器/多模态融合/注意力机制分类
信息技术与安全科学引用本文复制引用
郭宁宁,蒋林华..基于硬注意力机制的多模态视频字幕的处理[J].计算机应用研究,2021,(3):956-960,5.