计算机工程2022,Vol.48Issue(10):45-54,10.DOI:10.19678/j.issn.1000-3428.0063294
基于多模态融合与多层注意力的视频内容文本表述研究
Research on Text Representation of Video Content Based on Multi-Modal Fusion and Multi-Layer Attention
摘要
关键词
视频内容文本描述/多模态融合/联合表示/协作表示/自注意力机制分类
信息技术与安全科学引用本文复制引用
赵宏,郭岚,陈志文,郑厚泽..基于多模态融合与多层注意力的视频内容文本表述研究[J].计算机工程,2022,48(10):45-54,10.基金项目
国家自然科学基金(62166025,51668043) (62166025,51668043)
甘肃省重点研发计划(21YF5GA073). (21YF5GA073)