首页|期刊导航|计算机工程|基于多模态融合与多层注意力的视频内容文本表述研究

基于多模态融合与多层注意力的视频内容文本表述研究

赵宏郭岚陈志文郑厚泽

计算机工程2022，Vol.48Issue(10)：45-54,10.

计算机工程2022，Vol.48Issue(10)：45-54,10.DOI:10.19678/j.issn.1000-3428.0063294

Research on Text Representation of Video Content Based on Multi-Modal Fusion and Multi-Layer Attention

赵宏 ¹郭岚 ¹陈志文 ¹郑厚泽¹

作者信息

视频内容文本描述/多模态融合/联合表示/协作表示/自注意力机制

信息技术与安全科学

赵宏,郭岚,陈志文,郑厚泽..基于多模态融合与多层注意力的视频内容文本表述研究[J].计算机工程,2022,48(10):45-54,10.

国家自然科学基金(62166025,51668043) （62166025,51668043）

甘肃省重点研发计划(21YF5GA073). （21YF5GA073）

OA北大核心CSCDCSTPCD

ISSN：1000-3428

访问量0

下载量0

段落导航