用户
 找回密码
 立即注册
搜索

发帖

音频科普丨关于音频编解码你应该了解的知识

[复制链接]
发表于 2022-11-9 22:32:18
本帖最后由 righteousman 于 2022-11-9 22:35 编辑 8 o* X# R( G% D4 E3 z7 S

% X% k/ s( \; s( [7 g5 q9 z# [) d9 w本文将介绍音频编码的三大要素以及一些常用的音频格式这两大方面,对于刚接触无损的小白算是蛮有用的干货,如果内容有差误也请大佬口下留情,在评论中勘误。+ g% ]( L' X; c  F
+ j8 R) B& r' s* N

音频编码的主要作用是将音频采样数据(PCM等)压缩成为音频码流,从而降低音频的数据量,以此来降低数据传输和存储的成本


/ P! Y: w. I1 q8 N5 a9 y

拿音频来举例,一路采样频率为44100Hz,采样精度为16bit,声道数为2的声音,如果不进行编码压缩,一分钟的时间所需要的数据量是约为10MB。


+ s: n+ V. C  [7 T0 D

“三高”决定音频文件的质量

对于音频,编解码器会压缩文件以节约带宽进行传输,并在播放时解压缩收到的文件。

( n: Z, o3 Y0 i& C: T3 b) z

而音频文件的质量主要取决于三个变量:采样频率、采样精度和比特率。当模拟音频(自然界的声音,乐队演奏,歌手演唱等)转换为数字音频时将使用这些变量,并最终影响整体的音频质量。

7 w! ]6 Q; G4 Q+ _

理论上,这三个变量的数值越高,音频质量也就越好。

3 o$ P; ~% }5 e9 W0 n- W5 N8 K

& j8 H8 q; j: A6 i

采样频率:

5 ~; E/ ~( I8 `5 o

采样率是指在一秒钟内采集音频文件样本的次数,通常可以代表样本的数量。它以每秒样本数或赫兹/千赫兹(Hz/kHz)为单位进行测量。这些样本以相等的间隔进行采样,并影响音频的精度。一秒钟内样本越多,音频信号携带的细节就越多。

, C' m+ \  ], a' A

音频中的采样频率类似于视频中的帧速率。帧速率越高,您可以捕获视频中每个瞬间的深度和细节就越多,最终产品就越平滑。

: W. N; Z4 w( a+ _' F8 U; m

常见的采样应用场景:


% _6 g% G; s7 |: ], X5 g9 x+ V; K

8kHz:电话等,可用于记录并还原对于音质要求不高的人声。

9 o0 K1 T7 ^5 g5 b& b" a

22.05kHz:广播。


# V- }6 m: |; h, E

44.1kHz:CD。

8 U2 C$ r) `, _: q0 c0 m

48kHz:DVD、数字电视中使用。


+ Q8 p: z3 w' X! K: T  B& l5 G# ^/ s3 H$ {

96kHz-192kHz:DVD-Audio、Blu-ray等使用。

4 O& p! n) C$ v" ?7 }

采样精度:

- S' _: y7 o: q# x

采样精度也称为样本大小或采样深度,它指的是样本的质量。采样频率是一秒内记录样本的数量统计,采样精度表示每个记录样本的质量。


9 k7 }+ C- j% E! V, E0 F8 S9 E. X

音频的采样精度可以与代表视频/图像质量的图像色深这个参数进行类比。图像的色深位数会影响它能够表示的颜色数,比如8bit的色彩位深下,能显示256个不同的颜色;16bit的色深能够显示65536个不同的颜色。具有较高位深的图片将显示颜色更准确的像素,因为图片中像素的颜色能更接近真实世界中的颜色。同理,音频的采样精度越高,记录下的声音数据就能更接近真实的声音。


7 ]! ]4 a/ k; o1 J# r8 C. s  Z! t

采样精度常用范围为8bit-32bit,而CD中一般都使用16bit;DVD-Audio、Blu-ray一般会用到24bit;32bit就很少见,可能会用于某些特殊的录音设备。

$ W$ ^; H! k, ?& [& _3 Y: }: I' H' S

比特率:
: [6 ]" K# ~5 v& W' |! C. @( L

通常来说,比特率是采样率和采样精度的乘积。它的大小与音频的音质息息相关。低比特率的音频文件听起来或许很糟糕,但由于它们的容量要小得多,因此可以节省大量的存储空间和设备的处理能力。

' H: i/ m) V* E
八种常见的音频编码:

' b/ w& V% Q" I* \, c1 u0 H

MP3


  `& u$ n) F7 V( q1 J2 p

有损音频最常见的编码是MP3。MP3播放器曾经非常流行,因为它们能够方便地存储数千首歌曲。MP3仍然是最常见的存储格式。在压缩过程中,它将音频文件减少到原始大小的十分之一左右,并且由于它占用容量很小而广受欢迎。MP3几乎可以在所有流媒体设备上得到支持与播放。这种压缩技术节省了大量空间,但是它会降低音质。是否使用这种格式取决于您更看重音质还是便利。


7 i; q4 I# d: X" n) q1 _: V, Y" \

AAC5 L' w3 K' O8 p! t, z: b! V


8 }3 s, \. e( |' Z6 m/ |

AAC(Apple's Advanced Audio Coding)是有损编码格式的另一个例子。它的比特位也像MP3一样被有选择地舍弃,但它通常听起来稍微好一些,因为AAC文件具有更有效的算法来确定听众会听到什么和不会听到什么。因此,它们能够提供相比同规格MP3更多的录音原始信息。AAC主要用于流式传输Apple Music和YouTube。如果您需要高质量的声音,则不建议使用AAC,但它非常适合在线流媒体,以及手机使用。

5 D; c: E' c. w. `% P, l1 L

FLAC
7 d) p  e$ P- {4 u! I

/ n8 E- t) ~+ _5 W1 S, i# @

作为一种无损音乐格式,FLAC(Free Lossless Audio Codec)能够提供CD质量的声音,而不占用CD的相同存储空间。压缩率能达到50%左右,从而释放了相当多的存储空间。FLAC的最大属性特点是压缩不会对音频质量造成任何损失。FLAC是一种免费的开源编解码器,非常适合需要高质量音频的专业人士。FLAC甚至还能够提供高达32bit、128kHz的高清分辨率,这时甚至比CD音质好得多!请注意,FLAC的文件大约是有损音频文件大小的六倍,而且并非兼容所有的设备和软件。


  _" S6 {* ~- ?2 C8 z& s

ALAC/ y& w& h. S2 C' V0 b2 c+ ]

$ E' J! S1 [- @- p4 L

Apple无损音频编解码器(ALAC)是另一种无损音频编解码器,顾名思义,它主要适用于Apple设备。就像FLAC一样,它的文件被压缩到更小的大小,而不会影响其质量。由于这些文件明显大于有损音频文件,因此下载时间更长。此外,对于没有Apple设备的人来说,这种格式受到一定限制。但是,由于它没有通过压缩删除比特位信息,因此听起来音质很棒。

9 e& C, n" x/ X6 h

WMA
0 V  R7 X- L) x

* H8 r( {7 t# `& D3 I0 ~8 T

第三种类型的无损音频格式是WMA(Windows Media Audio)。WMA 文件比常见的无损文件更紧凑。WMA提供了相当不错的设备兼容性。但是,它与Apple设备不兼容。它也不被主要的流媒体提供商支持,这限制了它的实用性。在功能方面,它与FLAC相同。

# C1 ^$ L0 [/ h1 Z: H

WAV( I4 n) X! ?& [: S: P

! P: `( E' I) G- ^7 [& {/ _

WAV( Waveform Audio Format)是您需要高质量声音时的绝佳选择。这是一种未压缩的音频格式,因此文件往往非常大。在带宽有限的情况下,很难进行流媒体传输。但是,它们听起来绝对完美无暇。如果您正在寻找原始录制的而不降低音质,那么WAV就是您的理想选择。WAV由微软和IBM开发,因此用于Windows平台。它也是所有CD编码的标准格式。

% F* X0 q3 U. I6 i7 S9 X

AIFF0 `& K3 u' k( ^8 F" C9 H

, J: R6 P) p, a

AIFF(Audio Interchange File Format),是由Apple创建的音频格式。它是完全未压缩的,AIFF的下载时间很长,并且会占用相当大的存储空间。因此,该格式不太适合便携式设备。AIFF 与 CD 品质的音频相同,可以在 Mac 和 PC 上播放。AIFF能够进行流媒体传输,但这种做法并不常见。AIFF是作为WAV的替代品开发的,尽管它不那么受欢迎,但它具有更好的元数据支持。这意味着文件中可以包括专辑封面,歌曲标题等。


& k& g! x) W1 B5 A2 u/ C

MQA
' J, ?, ^+ {1 @3 q( z7 q* N8 T

+ k, ~2 d( t& [+ n. e( V

MQA(Master Quality Authenticateed)是一种有损音频编解码器。MQA声称提供最高的音质。它的开发人员似乎在暗示他们对于声音的处理非常先进,以至于当前的测量技术无法捕捉到他们在音质方面的优势。批评者们试图测量MQA音频,并注意到可听见的音质下降,这与MQA声称的“与原始版本比没有丢失任何东西”形成鲜明对比。他们指出,原始文件的格式在播放过程中没有清晰显示,意味着无论原始采样率如何,MQA都会显示这是一个高分辨率音源。

  _3 }0 V' @% u3 r! y& _* C$ C
另外还有DSD 技术:用1bit比特流的方式取样,采样率2.4MHz(CD44.1kHz取样的64倍)的高取样方式,直接把模拟音乐讯号波形以脉冲方式转变为数字讯号。! \/ ~1 V& Q4 W! b' _5 M
# x+ Z& A1 w' F! s7 u2 s% p* }* @

  k/ \, Q2 i8 e3 `& V, o5 x* W3 ?2 P3 M  `1 o

& Z8 I& A9 |6 Z4 Q$ U6 W  E
使用道具 举报 回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则