HLT实验室学生在全球语音质量预测挑战赛中获奖

6月26日,由ASRU 2023(IEEE Automatic Speech Recognition and Understanding,自动语音识别与理解)举办的VoiceMOS2023挑战赛公布了比赛结果。我院HLT实验室(Human Language Technologies,人类语言技术)2022级博士生王卉在赛道三(Noisy and enhanced speech)获得第3名。

 

ASRU是IEEE(Institute of Electrical and Electronics Engineers,电气与电子工程师协会)语音和语言处理技术委员会(SLTC)的旗舰技术研讨会,每两年举办一次,汇集了来自全球智能语音技术领域的学术界和工业界的顶级专家和研究人员,共同探讨先进的语音识别与理解问题。VoiceMOS2023挑战赛是ASRU在2023年的一项重要活动,旨在评估参赛者在自动预测发音质量方面的技术能力,今年的挑战赛注重更加有挑战性的零样本域外MOS预测难题。本次挑战赛共设有多个赛道,其中赛道三竞争更为激烈。

在HLT实验室师生的支持帮助下,王卉阅读了大量的论文,并进行了深入的实验,通过采用先进的算法和技术,构建了精准的质量评估模型,在此基础上融合了检索增强技术,成功实现了对发音质量的准确预测,显著提升了基线系统的性能,最终获奖。