首页|期刊导航|计算机应用研究|基于多模态融合的城市道路场景视频描述模型研究

基于多模态融合的城市道路场景视频描述模型研究

李铭兴徐成李学伟刘宏哲闫晨阳廖文森

计算机应用研究2023，Vol.40Issue(2)：607-611,640,6.

计算机应用研究2023，Vol.40Issue(2)：607-611,640,6.DOI:10.19734/j.issn.1001-3695.2022.06.0275

Multimodal fusion for video captioning on urban road scene

李铭兴 ¹徐成 ²李学伟 ¹刘宏哲 ²闫晨阳 ¹廖文森²

作者信息

视频描述/多模态融合/注意力机制/智能驾驶

信息技术与安全科学

李铭兴,徐成,李学伟,刘宏哲,闫晨阳,廖文森..基于多模态融合的城市道路场景视频描述模型研究[J].计算机应用研究,2023,40(2):607-611,640,6.

国家自然科学基金资助项目(62171042,62102033,61906017,61802019) （62171042,62102033,61906017,61802019）

北京市重点科技项目(KZ202211417048) （KZ202211417048）

协同创新中心资助项目(CYXC2203) （CYXC2203）

北京联合大学学术研究项目(BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104) （BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104）

OA北大核心CSCDCSTPCD

ISSN：1001-3695

访问量0

下载量0

段落导航