首页|期刊导航|计算机工程|基于发音特征的音视频融合语音识别模型

基于发音特征的音视频融合语音识别模型

吴鹏蒋冬梅王风娜 Hichem SAHLI Werner VERHEIST

计算机工程2011，Vol.37Issue(22)：268-269,272,3.

基于发音特征的音视频融合语音识别模型

Audio Visual Fusion Speech Recognition Model Based on Articulatory Feature

吴鹏 ¹蒋冬梅 ¹王风娜 ²Hichem SAHLI ²Werner VERHEIST²

作者信息

1. 西北工业大学陕西省语音与图像信息处理重点实验室,西安710072
2. 布鲁塞尔自由大学电子与信息工程系,比利时布鲁塞尔1050
折叠

摘要

Abstract

A multi-stream Dynamic Bayesian Nctwork(DBN) model(AF_AV_DBN) based on Articulatory Featurc(AF) is proposed for audio visual speech recognition. Conditional probability distribution or each node and the degrcc of asynchrony between the AFs are defined, and speech recognition experiments arc carried out on an audio visual connected digit database. Compared with ihc audio-only AF_A_DBN model, the state synchronous DBN model and the state asynchronous DBN model, the designed AF^AV_DBN model gets the highest recognition rate under various signal to noise ratios, and is more robust to background noise.

关键词

:动态贝叶斯网络/发音特征/音视频融合/语音识别/异步

Key words

Dynamic Bayesian Network(DBN)/ articulatory feature/ audio visual fusion/ speech recognition/ asynchronous

分类

信息技术与安全科学

引用本文复制引用

吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner VERHEIST..基于发音特征的音视频融合语音识别模型[J].计算机工程,2011,37(22):268-269,272,3.

基金项目

国家自然科学基金资助项目(60703104) （60703104）

陕西省自然科学基金资助项目(SJ08F28) （SJ08F28）

西北工业大学基础研究基金资助项目(JC200943) （JC200943）

计算机工程

OACSCDCSTPCD

ISSN：1000-3428

访问量0

下载量0

段落导航