|国家科技期刊平台
首页|期刊导航|电子学报|基于先验梅尔谱和神经声码器的语音丢包隐藏方法

基于先验梅尔谱和神经声码器的语音丢包隐藏方法OA北大核心CSTPCD

中文摘要

对基于神经网络的丢包隐藏方法而言,输入特征是直接影响最终恢复效果的重要因素.此外,如何通过丢包隐藏恢复高自然度的语音,也是亟待解决的难题.为有效恢复丢包语音并提高自然度,本文提出了一种基于先验梅尔谱和神经声码器的语音丢包隐藏方法.该方法采用一种非对称的编解码网络结构.在编码端,用两个独立的编码网络分别从时域波形和梅尔谱中提取深层时频特征.在解码端,将时频深层特征一同送入由时序自适应反归一化层构成的声码器中,以恢复丢失的语音信号并提高自然度.仿真实验表明,该方法在语音感知质量和短时客观可懂度上均优于现有的两种丢包隐藏算法.

黄晋维;鲍长春;周静;

北京工业大学信息学部语音与音频信息处理研究所,北京100124

电子信息工程

丢包隐藏先验梅尔谱神经声码器时序自适应反归一化层时频特征

《电子学报》 2024 (008)

P.2581-2590 / 10

国家自然科学基金(No.61831019)~~。

10.12263/DZXB.20231056

评论