5月10日和17日上午,伍伦贡联合研究院举办了2场主题为“语音信号建模与处理:基础与应用”的学术讲座。讲座由来自伍伦贡大学教授克里斯蒂安·瑞兹(Christian Ritz)博士主讲,伍伦贡联合研究院北康漾博士(Dr. Yann Berquin)主持。
Christian教授讲座开始
在第一场讲座中,克里斯蒂安·瑞兹教授以日常生活中的语音技术的应用为引,展开了关于语音信号处理的相关理论介绍。首先,他介绍了语音信号处理中的基本工具,离散余弦变换,短时傅里叶变换等,并使用MATLAB为大家演示了语音信号的频谱特征,加强了同学们对于语音信号的理解。随后,克里斯蒂安·瑞兹教授从人类的发声系统为例,介绍了语音信号的周期,频率等。最后,他详细阐述了语音信号处理中线性预测模型的具体算法流程。
应用在语音编码中的线性预测
在第二场讲座中,克里斯蒂安·瑞兹教授首先介绍了人类声学感知模型,并给大家展示了语音信号处理中的部分真实数据。接着,他对语音增强技术进行了相关介绍。其中,克里斯蒂安·瑞兹重点讲解了谱减算法的实现过程和语音信号处理应用中的性能度量标准,例如Mean Opinion Score (MOS),Perceptual Evaluation of Speech Quality (PESQ)等。最后,他详细介绍了麦克风的相关理论,使同学们了解了不同麦克风所具有的不同极性响应的相关知识。
谱减算法介绍
在系列讲座中,克里斯蒂安·瑞兹教授深入浅出地讲解使同学们对语音信号处理有了更深刻的认识,对语音信号处理算法中的代码实现进行了详细的介绍和演示,使得同学们对算法和知识的具体运用也有了更进一步的了解。
克里斯蒂安·瑞兹现为伍伦贡大学教授,他先后于1999年和2003年获得伍伦贡大学硕士和博士学位。自2016年至2022年,他一直担任伍伦贡大学工程与信息科学学部的副部长,负责学部的国际化事务。目前瑞兹教授是信号与信息处理中心(CSIP)的成员,主要负责和领导该中心的音频、语音和声学信号处理相关研究。克里斯蒂安·瑞兹教授积极参与多个项目,主要包括用于定向声增强的麦克风阵列信号处理、声学场景分类、基于扬声器的声场再现和控制以及使用机器学习的视觉对象分类,并荣获亚太信号与信息处理协会(APSIPA)的杰出讲师( 2019 - 2020)年荣誉称号。
撰稿人:邵帅,周钊颖
初审:杨洋
审校:吴和林