首页|期刊导航|自动化学报|从视频到语言:视频标题生成与描述研究综述

从视频到语言:视频标题生成与描述研究综述OA北大核心

From Video to Language:Survey of Video Captioning and Description

中文摘要

视频标题生成与描述是使用自然语言对视频进行总结与重新表达.由于视频与语言之间存在异构特性,其数据处理过程较为复杂.本文主要对基于"编码-解码"架构的模型做了详细阐述,以视频特征编码与使用方式为依据,将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法,并对各类模型进行了归纳与总结.最后,对当前存在的问题及可能趋势进行了总结与展望,指出需要生成融合情感、逻辑等信息的结构化语段,并在模型优化、数据集构建…查看全部>>

汤鹏杰;王瀚漓

井冈山大学电子与信息工程学院 吉安343009同济大学计算机科学与技术系 上海201804

视频描述卷积神经网络循环神经网络语段生成情感表达逻辑语义

《自动化学报》 2022 (2)

基于非局部轨迹边界学习的精准行为检测方法研究

375-397,23

国家自然科学基金(62062041,61976159,61962003),上海市科技创新行动计划项目(20511100700),江西省自然科学基金(20202BAB202017,20202BABL202007),井冈山大学博士启动基金(JZB1923)资助

10.16383/j.aas.c200662

评论

您当前未登录!去登录点击加载更多...