计算机应用研究2023,Vol.40Issue(2):607-611,640,6.DOI:10.19734/j.issn.1001-3695.2022.06.0275
基于多模态融合的城市道路场景视频描述模型研究
Multimodal fusion for video captioning on urban road scene
摘要
关键词
视频描述/多模态融合/注意力机制/智能驾驶分类
信息技术与安全科学引用本文复制引用
李铭兴,徐成,李学伟,刘宏哲,闫晨阳,廖文森..基于多模态融合的城市道路场景视频描述模型研究[J].计算机应用研究,2023,40(2):607-611,640,6.基金项目
国家自然科学基金资助项目(62171042,62102033,61906017,61802019) (62171042,62102033,61906017,61802019)
北京市重点科技项目(KZ202211417048) (KZ202211417048)
协同创新中心资助项目(CYXC2203) (CYXC2203)
北京联合大学学术研究项目(BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104) (BPHR2020DZ02,ZB10202003,ZK40202101,ZK120202104)