基于分层联邦框架的音频模型生成技术研究OA北大核心CSTPCD
针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题;提出一种基于对比学习的音频模型的预训练方法,利用<音频,文本描述>数据学习语义特征,提高模型的泛化能力和多样化能力;提出一种基于提示学习的音频生成微调方法,利用少量标注数据提高模型的适应能力和定制化能力;提出一种音…查看全部>>
王健宗;张旭龙;姜桂林;程宁;肖京
平安科技(深圳)有限公司,广东深圳518046平安科技(深圳)有限公司,广东深圳518046湖南财信金融控股集团有限公司,湖南长沙410035平安科技(深圳)有限公司,广东深圳518046平安科技(深圳)有限公司,广东深圳518046
计算机与自动化
音频模型联邦学习框架音频表征学习数据异构性隐私保护对比学习提示学习模型压缩
《智能系统学报》 2024 (5)
P.1331-1339,9
广东省重点领域研发计划“新一代人工智能”重大专项(2021B0101400003).
评论