多模态深度学习综述OA北大核心CSCDCSTPCD
Survey of Multimodal Deep Learning
模态是指人接收信息的方式,包括听觉、视觉、嗅觉、触觉等多种方式.多模态学习是指通过利用多模态之间的互补性,剔除模态间的冗余性,从而学习到更好的特征表示.多模态学习的目的是建立能够处理和关联来自多种模式信息的模型,它是一个充满活力的多学科领域,具有日益重要和巨大的潜力.目前比较热门的研究方向是图像、视频、音频、文本之间的多模态学习.着重介绍了多模态在视听语音识别、图文情感分析、协同标注等实际层面的应用,以及在匹配和分类、对齐表示学习等核心层面的应用…查看全部>>
孙影影;贾振堂;朱昊宇
上海电力大学 电子与信息工程学院,上海 200090上海电力大学 电子与信息工程学院,上海 200090上海电力大学 电子与信息工程学院,上海 200090
信息技术与安全科学
多模态学习多模态应用多模态融合共享表示空间
《计算机工程与应用》 2020 (21)
1-10,10
国家自然科学基金青年科学基金(No.61401269).
评论