生成对抗网络与文本图像生成方法综述OACSTPCD
Survey About Generative Adversarial Network and Text-to-Image Synthesis
随着多传感器的普及,多模态数据获得科研和产业面的持续关注,通过深度学习来处理多源模态信息的技术是核心所在.文本生成图像是多模态技术的方向之一,由于生成对抗网络(GAN)生成图像更具有真实感,使得文本图像生成取得卓越进展.它可用于图像编辑和着色、风格转换、物体变形、照片增强等多个领域.将基于图像生成功能的GAN网络分为四大类:语义增强GAN、可增长式GAN、多样性增强GAN、清晰度增强GAN,并根据分类法提供的方向将基于功能的文本图像生成模型进行整…查看全部>>
赖丽娜;米瑜;周龙龙;饶季勇;徐天阳;宋晓宁
江南大学 人工智能与计算机学院,江苏 无锡 214122江南大学 人工智能与计算机学院,江苏 无锡 214122江南大学 人工智能与计算机学院,江苏 无锡 214122江南大学 人工智能与计算机学院,江苏 无锡 214122江南大学 人工智能与计算机学院,江苏 无锡 214122江南大学 人工智能与计算机学院,江苏 无锡 214122
计算机与自动化
多模态生成对抗网络文本图像生成深度学习
multi-modalgenerative adversarial network(GAN)text-to-image synthesisdeep learning
《计算机工程与应用》 2023 (19)
复杂场景下多模态视觉表征与分析的理论与方法研究
21-39,19
国家自然科学基金(62020106012,U1836218,62106089).
评论