| 注册
首页|期刊导航|计算机工程|基于多模态融合与多层注意力的视频内容文本表述研究

基于多模态融合与多层注意力的视频内容文本表述研究

赵宏 郭岚 陈志文 郑厚泽

计算机工程2022,Vol.48Issue(10):45-54,10.
计算机工程2022,Vol.48Issue(10):45-54,10.DOI:10.19678/j.issn.1000-3428.0063294

基于多模态融合与多层注意力的视频内容文本表述研究

Research on Text Representation of Video Content Based on Multi-Modal Fusion and Multi-Layer Attention

赵宏 1郭岚 1陈志文 1郑厚泽1

作者信息

  • 1. 兰州理工大学 计算机与通信学院,兰州 730050
  • 折叠

摘要

关键词

视频内容文本描述/多模态融合/联合表示/协作表示/自注意力机制

分类

信息技术与安全科学

引用本文复制引用

赵宏,郭岚,陈志文,郑厚泽..基于多模态融合与多层注意力的视频内容文本表述研究[J].计算机工程,2022,48(10):45-54,10.

基金项目

国家自然科学基金(62166025,51668043) (62166025,51668043)

甘肃省重点研发计划(21YF5GA073). (21YF5GA073)

计算机工程

OA北大核心CSCDCSTPCD

1000-3428

访问量0
|
下载量0
段落导航相关论文