1.2.2 Audio音频基础概念

声音是由震动产生下图是一个声音产生记录到最终播放的过程:

音乐家演唱歌曲,通过麦克风获取,麦克风将模拟的震动信号转换为数字信号,再通过存储设备进行存储。
听众购买了音乐家的播放器,播放音乐时保存的数字信号经过转换后通过喇叭将数字信号转换为震动的模拟信号听众就可以听到。

常见的音频设备

麦克风中的咪头:
图片[1] - 1.2.2 Audio音频基础概念 - 宋马
音响里面的喇叭:
图片[2] - 1.2.2 Audio音频基础概念 - 宋马
3.5mm音频设备:
图片[3] - 1.2.2 Audio音频基础概念 - 宋马

USB音频设备:
图片[4] - 1.2.2 Audio音频基础概念 - 宋马
图片[5] - 1.2.2 Audio音频基础概念 - 宋马
蓝牙音频设备:
图片[6] - 1.2.2 Audio音频基础概念 - 宋马

声音的三要素:频率、振幅、波形

频率:

声波的频率,即声音的音调, 音调越高,频率越大;音调越低,频率越小。 人类听觉的频率(音调)范围为20Hz–20KHz 。

振幅:

即声波的响度,通俗的讲就是声音的高低。 音量(响度)越大,振幅越大;音量越小,振幅越小。

波形:

即声音的音色,同样的频率和振幅下,钢琴和小提琴的声音听起来完全不同的,因为他们的音色不同,波形决定了其所代表声音的音色。音色不同是因为它们的介质所产生的波形不同。 音调越高,波长越短;音调越低,波长越长。

声音的震动信号经过数模转换后就生成PCM数学数据。

PCM

PCM(Pulse Code Modulation)脉冲编码调制是数字通信的编码方式之一。主要过程是将话音模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。

PCM数据如下图:
图片[7] - 1.2.2 Audio音频基础概念 - 宋马
图片[8] - 1.2.2 Audio音频基础概念 - 宋马
详细过程如下图:

音频的常用名词

采样率(Sample rate)

采样率可以理解为采集样本的速率(故也可以称为采样速度或者采样频率),它定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。
8000 Hz: 电话所用采样率, 对于人的说话已经足够
11025 Hz:AM调幅广播所用采样率
22050 Hz和24000 Hz: FM调频广播所用采样率
32000 Hz: miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44100 Hz:音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
47250 Hz: 商用 PCM 录音机所用采样率
48000 Hz: miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50000 Hz: 商用数字录音机所用采样率
96000 或者 192000 Hz: DVD-Audio、一些 LPCM DVD 音轨、BD-ROM(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率

声道(Channel)

是指声音在录制或播放时在不同空间位置采集或回放的相互独立的音频信号,所以声道数也就是声音录制时的音源数量或回放时相应的扬声器数量。所以可想而知,其他参数相同的情况下,声道数越多定位越精准,同样所需扬声器和功放组件越多。
单声道(mono)
双声道(stereo 立体声):左声道 + 右声道,低音不分离,应用于音乐播放较多
2.1声道 :左声道 + 右声道, 低音分离
5.1声道 :左声道 + 右声道 + 低音声道 + 中央声道 + 左环绕 + 右环绕,应用于类传统影院和家庭影院中
7.1声道 :左声道 + 右声道 + 低音声道 + 中央声道 + 左环绕 + 右环绕 + 左后环 + 右后环,常见的包括:Dolby Surround 7.1杜比7.1环绕声

位宽/位深(Sample)

在使用脉冲编码调制(PCM)的数字音频中,bit depth是每个Sample(采样)点占用的位数,并且它直接对应于每个采样的分辨率。
8bit ( 1Byte ) 对应0~255,将振幅划分为256个等级
16bit (2Byte) 对应0~65535,将振幅划分为65536个等级
24bit (3Byte) 对应0~16777216‬,将振幅划分为16777216‬个等级
32bit (4Byte) 对应0~4294967296 ,将振幅划分为4294967296个等级

帧(Frame)

是由一组样本组成的音频数据块,大小由样本位宽和声道数决定。对于立体声,每一帧包含左声道和右声道的样本值。帧的字节数可以通过样本位宽、声道数和样本大小(通常为字节)来计算。

样本格式/交错模式(Interleaved)

是一种音频数据的存储方式。在交错模式下,音频数据以交替的方式存储,先存储一个通道的所有样本,然后是另一个通道的所有样本,以此类推。这种存储方式在立体声音频中常见。

交错模式:每个声道的样本数据交错存储排布
平面模式:每个声道的样本数据分开存储

PCM数据:

编码格式介绍

WAV编码(波形编码)
WAV是编码的一种实现方式(其实它有非常多实现方式,但都是不会进行压缩操作)。就是在源 PCM 数据格式的前面加上44个字节。分别用来描述 PCM 的采样率、声道数、数据格式等信息。
MP3编码
MP3编码具有不错的压缩比,而且听感也接近于WAV文件,当然在不同的环境下,应该调整合适的参数来达到更好的效果。
AAC编码
AAC是目前比较热门的有损压缩编码技术,并且衍生了LC-AAC、HE-AAC、HE-AAC v2 三种主要编码格式。
LC-AAC:是比较传统的AAC,主要应用于中高码率的场景编码(>= 80Kbit/s)
HE-AAC: 主要应用于低码率场景的编码(<= 48Kbit/s)
Ogg编码(有损)
Ogg编码是一种非常有潜力的编码,在各种码率下都有比较优秀的表现。尤其在低码率场景下。Ogg除了音质好之外,Ogg的编码算法也是非常出色。可以用更小的码率达到更好的音质。128Kbit/s的Ogg比192Kbit/s甚至更高码率的MP3更优质.但目前由软件还是硬件支持问题,都没法达到与MP3的使用广度.

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容