本课程主要讲授语音发声和听觉机理及其数字模型、语音信号的短时时域分析和频域分析方法、线性预测分析、矢量量化和语音编码等,所有的方法都配备了MATLAB仿真实现,使学生了解和掌握语音信号处理的有关基本知识、基本理论、基本技能和科学思维方法,旨在于培养学生获取综合运用语音信号处理的能力,为学生能够进一步进行独立分析和解决人机交互实际问题,开展新方法、新技术创新奠定基础。
课程章节
1绪论
1.1内容概要
1.2语音信号处理的三大分支
1.3语音信号处理的应用及新方向
2语音信号的数字模型
2.1内容概要
2.2语音的发音机理
2.3语音的听觉机理
2.4语音的感知
2.5语音信号数字模型
3语音信号的短时时域分析
3.1内容概要
3.2语音信号的预处理
3.3短时平均能量和短时平均幅度函数
3.4短时平均过零率
3.5语音的短时自相关函数
3.6短时时域处理技术的应用--语音端点检测
3.7短时时域处理技术的应用--基音周期估值
4语音信号的短时频域分析
4.1内容概要
4.2傅里叶变换的解释
4.3滤波器的解释
4.4短时综合的滤波器组相加法
5语音信号的线性预测分析
5.1内容概要
5.2线性预测分析原理
5.3线性预测分析与语音信号模型的关系
5.4LPC方程的自相关系数解法
5.5倒谱
5.6总结
6矢量量化
6.1内容概要
6.2矢量量化的基本原理
6.3最佳矢量量化器
6.4矢量量化器的设计算法
6.5初始码书的选取
6.6降低复杂度的矢量量化系统
6.7总结
7语音编码原理及应用
7.1内容概要
7.2语音编码的分类及特性
7.3语音编码性能的评价指标
7.4语音信号波形编码
7.5语音信号参数编码
7.6语音信号混合编码