- 年份
- 2025(31)
- 2024(45)
- 2023(29)
- 2022(23)
- 2021(12)
- 2020(4)
- 2019(3)
- 2018(5)
- 2017(1)
- 2016(1)
- 更多...
- 核心收录
- 中国科技论文与引文数据库(CSTPCD)(95)
- 北京大学中文核心期刊目录(北大核心)(77)
- 中国科学引文数据库(CSCD)(24)
- 中文社会科学引文索引(CSSCI)(3)
- 中国人文社会科学引文数据库(CHSSCD)(2)
- EI(1)
- MEDLINE(1)
- 更多...
- 刊名
- 计算机应用研究(15)
- 计算机工程与应用(14)
- 计算机工程(12)
- 计算机技术与发展(9)
- 农业机械学报(5)
- 智能系统学报(5)
- 现代信息科技(4)
- 计算机与数字工程(4)
- 计算机与现代化(4)
- 计算机科学与探索(4)
- 更多...
- 作者单位
- 太原理工大学(5)
- 清华大学(5)
- 南京邮电大学(3)
- 天津大学(2)
- 西南交通大学(2)
- 三峡大学(1)
- 上海理工大学(1)
- 中国科学院计算技术研究所(1)
- 兰州理工大学(1)
- 北京航空航天大学(1)
- 更多...
- 语种
- 汉语(158)
- 关键词
- 多模态融合(158)
- 深度学习(28)
- 注意力机制(19)
- 特征提取(10)
- 神经网络(7)
- Transformer(5)
- 人工智能(5)
- 多模态情感分析(5)
- 情感识别(5)
- 多模态(4)
- 更多...
- 作者
- 刘华平(3)
- 孙富春(3)
- 徐玺(3)
- 王彤(3)
- 王海荣(3)
- 邵曦(3)
- 周超(2)
- 张虎成(2)
- 曾昱皓(2)
- 朱文韬(2)
- 更多...
相关度
- 相关度
- 发表时间
每页显示10条
- 每页显示10条
- 每页显示20条
- 每页显示30条
已找到 158 条结果
- 动态视音场景下问答模型研究CSTPCD摘要:现实世界由大量不同模态内容构建而成,各种模态的信息相互关联和互补,充分挖掘不同模态之间的关系和特性能够有效弥补单一模态信息的局限性。动态视音场景下的问答模型研究,旨在通过视频中多模态信息回答不同视觉物体、声音及其相互联系的问题,使人工智能获得场景感知和时空推理能力。针对视音问答不准确的问题,提出了一种空间时序问答模型,该模型通过空间融合建模和时序融合建模对多模态特征进行融合,从而提高问答准确率。首先,分别使用Resnet_18,VGG…查看全部>>
- 无人机多模态融合的城市目标检测算法
- 多尺度视觉语义增强的多模态命名实体识别方法北大核心CSTPCD摘要:为解决多模态命名实体识别(Multimodal named entity recognition,MNER)方法研究中存在的图像特征语义缺失和多模态表示语义约束较弱等问题,提出多尺度视觉语义增强的多模态命名实体识别方法(Multi-scale visual semant-ic enhancement for multimodal named entity recognition method,MSVSE).该方法提取多种视觉特征用于补…查看全部>>
- 多模态融合的家庭音乐相册自动生成CSTPCD
- 基于城市区域多模态融合的人群流量预测北大核心CSTPCD
- 多模态数据融合综述北大核心CSCDCSTPCD
- 多模态数据融合研究综述北大核心CSTPCD
- 基于多模态特征的音乐情感多任务识别研究CHSSCDCSSCICSTPCD
- 基于随钻关键参数的岩体智能探测方法研究进展
- 基于音乐内容和歌词的音乐情感分类研究CSTPCD