|国家科技期刊平台
首页|期刊导航|计算机工程与科学|基于多特征交互融合的老挝语无监督音素分割方法

基于多特征交互融合的老挝语无监督音素分割方法OA北大核心CSTPCD

中文摘要

针对现有方法对老挝语声调变化以及音频多样性考虑不足导致音素分割不准确的问题,提出一种多特征交互融合的老挝语无监督音素分割方法。先对自监督特征、频谱特征以及音高特征进行独立编码,避免单一特征的不足;再基于注意力机制渐进融合多种独立特征,使模型更全面地捕捉老挝语的声调变化和音素边界的信息;最后采用可学习框架优化音素分割模型。实验结果表明,相比基线方法,在老挝语音素分割任务上所提方法的R-value值提升了27.88%。

李新洁;王文君;董凌;赖华;余正涛;高盛祥;

昆明理工大学信息工程与自动化学院,云南昆明650500 昆明理工大学云南省人工智能重点实验室,云南昆明650500

计算机与自动化

无监督学习特征融合老挝语音素分割语音表征

《计算机工程与科学》 2024 (005)

P.937-944 / 8

国家自然科学基金(62376111,U23A20388,U21B2027,62366027);云南省重点研发计划(202303AP140008,202302AD080003,202401BC070021,202103AA080015);云南省科技人才与平台计划(202105AC160018)。

10.3969/j.issn.1007-130X.2024.05.019

评论