• 누워서 읽는 디지털 오디오 포맷 (1) - PCM (오디오 CD)
  • 아날로그 세계를 디지털화해서 저장하는 방법은 매우 다양합니다. 현재 가장 대중적인 방법은 PCM(펄스 코드 변조)이라고 불리는 방법입니다. 우리가 가장 흔하게 접하는 오디오 CD와 MP3 같은 포맷들이 바로 PCM 방식으로 기록된 것입니다.

아날로그 세계를 디지털로 기록하는 방법

우리가 귀로 듣는 소리는 기본적으로 공기를 타고 전파되는 아날로그 파형입니다. 아날로그 신호는 신호의 연속성이 가장 큰 특징입니다. 풀어서 설명하자면, 신호가 시간에 따라 변화하는 모양이 끊임없이 자연스럽게 이어집니다. 이를 디지털 신호로 바꿀 때에는 매시간 변하는 신호의 모양을 순간적으로 포착해서 저장하게 됩니다.

 

이 디지털 신호의 저장 원리는 카메라를 예를 들면 이해가 쉽습니다. 우리가 눈으로 보는 세계는 시간에 따라 끊임없이 변화하는 아날로그 세계입니다. 카메라는 그 아날로그 세계에서 아주 짧은 순간의 모습을 저장할 수 있는 장치입니다. 그리고 이를 초당 24장이나 그 이상으로 빠르게 연속적으로 촬영하면 일정 시간 동안의 변화를 연속적으로 빠르게 쪼개서 기록할 수 있습니다. 이것이 곧 동영상입니다.


동영상은 정지된 화면을 연속적으로 빠르게 녹화하여 이를 다시 빠르게 재생한다

디지털로 저장되는 동영상과 음성은 그렇게 찰나의 순간을 포착한 상태(프레임)의 연속으로 이루어져 있습니다. 그래서 실제 아날로그 세계의 연속성과는 다르게 불연속적입니다. 하지만 이를 재생할 때에는 신기하게도 뚝뚝 끊기지 않고 연속된 변화로 느껴집니다. 영상의 경우에는 사람의 눈에 남는 잔상이 매 프레임 사이사이를 메워주는 효과가 있어서 부드럽게 이어지는 것처럼 보입니다. 그래서 눈이 프레임의 변화를 따라가지 못할 정도로 빠르게 프레임을 돌리면 충분히 연속된 부드러운 움직임으로 느껴집니다.

 


음성은 파형의 높이 단계를 빠르게 쪼개서 녹음하고, 재생 시에는 필터 처리를 거쳐 부드럽게 만든다

 

한편, 음성의 경우에는 디지털로 저장된 사운드를 그대로 재생하면 파형에 계단 현상이 생기게 됩니다. 그래서 디지털 오디오가 아날로그 오디오보다 듣기에 나쁘다는 등의 오해가 널리 퍼져 있기도 합니다. 하지만 디지털 오디오는 실제 재생 과정에서 프레임의 단계 변화를 부드럽게 만들어 주는 다양한 디지털 / 아날로그 필터 처리를 거쳐서 출력합니다. 그래서 적절한 필터를 거친 디지털 소스의 파형은 원래의 아날로그 신호처럼 매끈합니다.

 

소리를 디지털화하는 기본적인 방법 : PCM


아날로그 세계를 디지털화해서 저장하는 방법은 매우 다양합니다. 현재 가장 대중적인 방법은 PCM(펄스 코드 변조)이라고 불리는 방법입니다. 우리가 가장 흔하게 접하는 오디오 CD와 MP3 같은 포맷들이 바로 PCM 방식으로 기록된 것입니다. 그 이외의 흔하지 않은 방법들에 대해서는 연재 후반에 자세히 다룰 예정입니다. 우선은 1장에서 오디오 CD를 기준으로 PCM 방식에 대해 설명하겠습니다.

 

PCM 방식은 소리 신호의 순간적인 높이를 잘게 쪼개서 저장합니다. 그래서 PCM 방식에서 중요한 것은 높이를 얼마나 잘게 쪼개느냐, 그리고 시간을 얼마나 잘게 쪼개느냐입니다. 오디오 CD의 샘플링이 16비트 / 44.1 킬로헤르츠라는 말을 많이 들어보셨을 겁니다. 여기서 샘플링 비트는 신호의 높이를 포착한 정밀도, 샘플링 주파수는 1초 동안 몇 번 신호를 포착했는지를 의미합니다.

 

샘플링 비트의 수는 2진수로 표현되는 디지털 데이터의 자릿수입니다 그래서 16bit는 16자리의 2진수로 이루어져 있습니다. 16자리의 2진수가 표현 가능한 데이터의 종류는 2의 16제곱입니다. 그래서 16bit로 신호를 기록하면 2의 16제곱인 65,536단계로 신호의 높이를 잘게 쪼개서 포착할 수 있습니다.

 

그리고 샘플링 주파수가 44.1kHz 면 신호를 1초 동안 44,100번 포착해서 기록했다는 의미입니다. 동영상으로 치면 무려 초당 44,100 프레임인 셈입니다. 이렇게 음성 신호는 우리가 늘 보는 TV의 60프레임보다 무려 735배나 잘게 쪼개서 기록합니다.

 

결론적으로, 오디오 CD는 1초당 44,100번에 걸쳐 소리의 세기를 매번 65,536단계로 쪼개서 기록한 디지털 미디어입니다. 평소에 무심코 지나쳤던 부분이지만 이렇게 숫자로 풀어서 놓고 보면 상당히 대단하다는 생각이 들기도 합니다.

 

샘플링 주파수와 고음 한계 : 나이퀴스트 이론



디지털 녹음 시에 샘플링 주파수가 충분히 빠르지 않으면 재생 과정에서 파형이 일그러지게 된다

 

음성이 영상보다 훨씬 빠른 샘플링 주파수가 필요한 이유는 사람의 가청 주파수와 관계가 있습니다. 사람의 청각은 20~20,000Hz의 소리를 들을 수 있습니다. 여기서 Hz 단위의 숫자는 음파의 초당 진동 횟수를 의미합니다. 즉, 20,000Hz의 소리는 초당 2만 번의 진동입니다.

 

한 번의 진동은 원점으로부터 시작한 움직임이 최고점과 최저점을 각각 한 번 찍고 다시 원점으로 돌아온 상태까지를 의미합니다. 그런데 PCM 방식은 순간의 신호의 높이만을 기록할 뿐이므로, 최고점과 최저점을 동시에 기록할 수는 없습니다. 그래서 1번의 진동 주기에 포함된 최고점과 최저점을 모두 기록하기 위해서는 신호를 최소 두 번은 포착해야 합니다. 이런 개념을 정리한 것이 '나이퀴스트 이론'입니다.

 

이 나이퀴스트 이론에 의하면 44.1kHz 샘플링 주파수의 오디오 CD는 그 절반에 해당하는 22.05kHz까지의 고음을 기록할 수 있습니다. 그렇다면 샘플링 주파수를 올리면 올릴수록 더 높은 고음까지 기록할 수 있어서 좋을 텐데 왜 굳이 44.1kHz로 정했을까요? CD가 44.1kHz의 샘플링 주파수를 가지게 된 이유는 나이퀴스트 이론에 의거해 사람의 가청 한계를 충분히 만족하면서도, 제한된 용량 안에서 보다 긴 시간의 오디오를 기록하기 위함입니다.

 

오디오 CD의 비트 레이트(초당 데이터량)는 16bit x 44,100Hz x 2채널 = 1,411,200bit 입니다. 만약에 여기서 샘플링 레이트가 48kHz로 높아진다고 치면, 비트 레이트는 16bit x 48,000Hz x 2채널 = 1,536,000bit가 돼서 데이터량이 순식간에 8% 정도 늘어나 버립니다. 실제로 오디오 CD에 기록되는 데이터는 이렇게 단순 계산으로 이루어지진 않습니다만, 재미 삼아 단순하게 계산하면 80분짜리 오디오 CD에서 6.5분이 날아가는 셈입니다. 샘플링 레이트가 높으면 높을수록 좋은 것을 알아도 무작정 높일 수는 없는 이유가 여기에 있습니다.

 

글쓴이

  • 지성, 이성, 그리고 감성의 삼위일체를 꿈꾸는 테크니컬 라이터
    디자인과 공학을 기반으로 다양한 분야에 능통하여 다학제적 시각의 리뷰가 특기이다.
    개인 블로그 asnote.net 운영중