核心关系总结
一句话概括:PCM是一种最基础的、未经压缩的音频数据编码格式;而WAV是一种文件容器格式,它最常用于封装PCM音频数据。
可以把它们想象成:
-
PCM:是未经包装的“原材料”或“裸数据”(就像一块未经雕琢的木头)。
-
WAV:是一个标准的“包装盒”,这个盒子里最常装的就是PCM这种原材料,但也可以装其他东西。盒子上还贴有标签,说明了里面装的是什么、有多少、规格如何。
两者的联系
-
包含关系:在绝大多数情况下(99.9%),一个WAV文件内部存储的音频数据就是PCM流。当你创建一个“PCM格式”的WAV文件时,WAV文件的结构就是在PCM数据的前面加上一个文件头。
-
无损存储:由于PCM是未经压缩的,所以WAV文件封装PCM数据后,提供了一种非常简单直接的无损音频存储方式。音频从模拟信号转为数字信号(PCM)后,直接被存入WAV文件,没有经过任何有损压缩处理。
-
高质量音频的基石:在专业音频领域、音频编辑和CD唱片中,WAV/PCM组合是事实上的标准格式,因为它能提供最完整的音频信息。
两者的区别
特性 | PCM | WAV |
---|---|---|
本质 | 一种编码格式/数据布局 | 一种文件格式/容器 |
定义 | 脉冲编码调制,一种将模拟信号转换为数字信号的原始方法。 | 波形音频文件格式,由微软和IBM联合制定,是RIFF规范的一个子集。 |
文件结构 | 没有标准文件头,只有连续的、原始的音频数据流。 | 有标准的文件头结构,包含采样率、位深度、声道数、数据大小等关键信息。 |
可识别性 | 纯PCM数据流无法被媒体播放器直接识别,因为不知道其参数(采样率等)。 | 带有完整文件头,可以被各种软件、播放器和操作系统直接识别和播放。 |
灵活性 | 只能表示一种特定的音频编码。 | 理论上可以封装多种编码格式的音频,如ADPCM、MP3等,但最常见、最标准的是封装PCM。 |
常见扩展名 | .pcm (不常见) 或没有特定扩展名。 |
.wav |
深入理解:从数据到文件
让我们通过一个音频的诞生过程来理解它们:
-
采样与量化(产生PCM数据):
-
麦克风捕捉到连续的模拟声波。
-
音频接口(声卡)以固定的时间间隔(例如每秒44100次,即44.1kHz采样率)对声波进行“采样”。
-
每次采样都会测量声波的振幅,并将其转换为一个数字值(例如用16位二进制数表示,即65,536个可能的电平)。
-
这一系列按时间顺序排列的数字值,就是PCM数据。它已经是一串数字信号了,但还没有任何描述信息。
-
-
封装(创建WAV文件):
-
为了能让播放器知道这串PCM数据的参数(采样率是44.1kHz还是48kHz?位深度是16bit还是24bit?是单声道还是立体声?),我们需要给它加上一个“说明书”。
-
WAV文件格式就是在PCM数据的前面加上一个文件头。
-
文件头里明确写明了:
-
音频格式代码(例如,
1
代表PCM)。 -
声道数(1为单声道,2为立体声)。
-
采样率(如44100)。
-
位深度(如16)。
-
数据部分的大小。
-
-
这个 “文件头 + PCM数据块” 的组合,就构成了一个完整的、可以被正确解读的.wav文件。
-
举例说明
-
你从声卡直接录制的“原始数据”:是PCM流。如果你把它直接保存到硬盘,没有加文件头,很多播放器会无法播放,因为你必须手动告诉播放器它的参数。
-
你用Audacity或Adobe Audition导出的“WAV文件”:是包含了PCM数据的WAV容器。你可以把它发给任何人,在任何设备上播放,因为文件头里已经包含了所有必要信息。
总结
-
PCM是“数据”本身,是数字音频的原始形态。
-
WAV是“文件”本身,是一种为方便存储和交换PCM数据而设计的包装。
因此,我们通常说“这个WAV文件是PCM编码的”,这准确地描述了两者的关系。在讨论音频时,WAV和PCM常常被混用,但在技术层面上理解它们的区别和联系是非常重要的。