学习目标:
掌握音频基础概念
学习内容:
1.掌握采样频率,通道数,位数,比特率,分贝等音频基础概念
2.掌握快速傅里叶变换,数字滤波器等理论知识
3.熟悉逻辑线性回归,支撑向量机,随机森林等常见机器学习算法
学习时间:
2020年8月28号
学习产出:
采样频率:
即取样频率,指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很限,太高的频率并不能分辨出来。
22050的采样频率是常用的,44100已是CD音质,超过48000或96000的采样对人耳已经没有意义。这和电影的每秒24帧图片的道理差不多。
如果是双声道,采样就是双份的,文件也差不多要大一倍。
采样位数:
即采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,所发出声音的能力越强。
每个采样数据记录的是振幅, 采样精度取决于采样位数的大小:
1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.
频率与采样频率的关系
采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1kHz。假设我们有2段正弦波信号,分别为20Hz和20kHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40kHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40k/20=2000次,而20k的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1kHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48kHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1kHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。
通道数:
即声音的通道的数目。常有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果,当然还有更多的通道数。
帧:
帧记录了一个声音单元,其长度为样本长度(采样位数)和通道数的乘积。
比特率:
每秒的传输速率(位速, 也叫比特率)。如705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒的意思,表示每秒705600bit的容量。
分贝:
分贝定义:
分贝dB定义为两个数值的对数功率,这两个数值分别是测量值和参考(也称为基准值)。存在两种定义情况。
一种为功率之比:
1dB = 10log10(W/W0)
一种为幅值之比:
1dB = 10 log10(X/X0)^2 = 20log10(X/X0)
下标为0的数值均为幅值和功率的参考值。功率量的例子如:声功率(W),声强(W/m^2),电工率,电强等。幅值量的例子如:声压(Pa),电压(V),加速度、温度等。
注:没有特殊要求时,参考值通常为1。
声压的标准参考值时2*10^-5Pa~20Pa。
dB的性质:
贝尔最初是用来表示电信功率讯号的增益和衰减的单位,1个贝尔的增益是以功率在放大后与放大前的比值。所以,电压增益的分贝表达式是从功率的角度来考虑的,即分贝应该理解为功率的增大或衰减情况。
用对数来dB形式表达增益之所以在工程上得到了广泛的应用,是因为:
(1)当用对数dB表达增益随频率变化的曲线时,可大大扩大线性增益变化的区间。人耳可听的声压幅值波动范围为2*10^-5Pa~20Pa,而用幅值dB表示时对应的dB数值仅仅为0-120dB。
(2)计算多级放大的总增益时,可将乘法化为加法进行运算。
(3)dB值可正可负。正值表示增大,负值表示衰减。若x/x0<1,则dB值为负值。也就是说测量值大于参考值的为正,小于参考值的为负。
(4)幅值比互为倒数时,dB值互为正负。这是因为:
-3dB:
通过上表我们已经知道-3dB对应的幅值比为0.707,即√2/2倍,也就是说幅值是原来的√2/2倍。如果是按功率比来计算,则功率比为1/2,也就是原来功率的一半,因此,-3dB称为“半功率点”。抗混叠滤波器是按幅值衰减0.707或者功率衰减一半所对应的频率作为滤波器截止频率的。其它类型的滤波器,如高通、低通、带通和带阻滤波器的截止频率也是-3dB点。
激励器
激励器是一种谐波发生器,利用人的心理声学特性,对声音信号进行修饰个美化的声处理设备。通过给声音增加高频谐波成分等多种方法,可以改善音质、音色、提高声音的穿透力,增加声音的空间感。现代激励器不仅可以创造出高频谐波,而且还具有低频扩展和音乐风格等功能,使低音效果更加完美、音乐更具表现力。使用激励器提高声音的清晰度,可懂性和表现力。使声音更加悦耳动听,降低听音疲劳,增加响度。虽然激励器只给声音增加了0.5dB左右的谐波成分,但实际听起来,音量好像增加了10dB左右。使声音的听觉响度明显增加,声音图像的立体感,以及声音的分离度的增加;改善了声音的定位和层次感,还可以提高重放声音的音质,磁带的复制率。因为声信号在传送和录制过程中会损失高频谐波成分,出现高频噪声。此时前者用激励器先对信号进行补偿,后者可用滤波器将高频噪声滤掉后,再营造出高音成分,保证重放音质。激励器的调节需要音响师对系统的音质和音色进行判别,再根据主观听音评价进行调整。