• 누워서 읽는 디지털 오디오 포맷 (3) - PCM 무손실 압축
  • 현재 가장 대중화된 방식은 FLAC (Free Lossless Audio Codec)입니다. 24bit / 384kHz의 고해상도 PCM 음원과 멀티채널을 지원하여 범용성이 좋은 데다, 그 이름대로 라이선스가 필요 없는 개방된 포맷인 덕분입니다.

디지털 압축 포맷의 등장

디지털 오디오 포맷으로서 처음 대중화된 오디오 CD는 굳이 압축 방식별로 분류하자면 무압축 방식입니다. 처음에는 디지털 오디오 포맷의 데이터 형태보다는 CD라는 물리적 미디어가 더 중요하게 다루어졌습니다. 음악을 듣는 방법은 그저 CD를 CD 플레이어에 넣어서 재생하는 방법뿐이었기 때문입니다. 그래서 오디오 CD에 실제로 어떤 식으로 데이터가 기록되어 있는지까지는 다들 별 관심이 없었습니다.

 

그러다가 90년대에 가정용 컴퓨터에도 CD를 자유롭게 읽을 수 있는 CD-ROM이라는 것이 달리기 시작하면서 사람들은 오디오 CD를 디지털 파일로 바꿀 수 있게 되었습니다. 드디어 디지털 오디오 포맷이 물리적 미디어의 제약을 탈출해 디지털 파일의 형태로 보급되기 시작한 것입니다. 이때서야 사람들은 오디오 CD의 데이터를 그대로 파일로 옮기면 용량이 너무 크다는 사실을 인식하기 시작했습니다.

 

90년대까지만 해도 인터넷 전용 회선이란 게 거의 없었고, 대부분 유선 전화 회선을 통해 PC 통신이나 인터넷을 이용했습니다. 유선 전화는 사용 시간만큼 요금이 부과되기 때문에 시간이 곧 돈이었습니다. 따라서 인터넷을 통해 오디오 파일을 전송하기에는 3분짜리 곡 하나도 몇십 MB씩 용량을 먹는 무압축 WAV 파일은 시간이 오래 걸릴뿐더러 너무 비싸게 먹혔습니다.

 

그래서 인터넷의 보급을 계기로 각종 파일 압축 기법이 연구되기 시작했습니다. 이때 개발된 JPG, MP3와 같은 각종 멀티미디어 파일 압축 방식은 현재까지도 널리 이용되고 있을 정도입니다. 처음에는 무조건 용량이 최우선이었기 때문에 원본의 손실을 약간 감수하고라도 최대한 용량을 아끼는 손실 압축 방식을 중심으로 개발되었습니다. 오디오 파일 포맷 중에는 MP3가 대표적입니다.

 

인터넷과 저장 장치의 발달 : 무손실 압축 방식의 등장

그리고 시간은 흘러 바야흐로 21세기가 되었습니다. 첨단 과학 문명은 불과 20여 년 만에 눈부시게 발전했습니다. 이제는 손가락만 한 USB 메모리에 몇백 GB를 저장할 수 있고, 영화 한 편을 손바닥 안의 스마트폰으로 몇 초만에 다운로드할 수 있는 세상이 되어 버렸습니다. 즉, 이제는 과거처럼 편집증적으로 용량에 집착할 필요가 적어졌습니다.

 

그러자 이번에는 사람들의 관심이 자연스레 무손실 압축으로 쏠리기 시작했습니다. 아무리 세상이 좋아졌어도 무압축 파일을 다루기에는 파일의 크기가 너무 크니, 원본의 음질을 유지하면서도 파일의 크기를 최대한 줄이고 싶어진 것입니다. 무손실 압축을 사용하면 손실 압축보다 용량은 좀 커지지만 음질과 용량의 두 마리 토끼를 동시에 잡을 수 있습니다.

 

역사적으로 널리 보급된 순서를 따르면 손실 압축이 무손실 압축보다 앞서나, 본 연재는 역사의 흐름을 따르기보다는 기술적으로 덜 복잡한 무손실 압축에 대해 먼저 다루겠습니다. 무손실 압축의 설명을 통해 오디오 압축 포맷에 대한 기본적인 개념이 정리되면 손실 압축을 이해하기 훨씬 쉽습니다.

 

원본에서 그대로 용량만 줄이는 무손실 압축

무손실 압축에도 세부적으로는 여러 알고리즘이 있지만 대표적인 원리는 간단합니다. 원본 파일의 데이터 중 중복되는 부분들을 짧게 줄이는 것입니다. 예를 들어서 1이 연속으로 10개가 나열된 '1111111111'이라는 부분이 있다면 이를 기호화하여 짧게 '1-10'이라고 표현할 수 있습니다. 문자를 10개를 써야 될 것을 단 4개의 문자로 표현함으로써 데이터를 60%나 줄인 셈입니다. 이를 재생할 때에는 1-10이라고 기호화된 표현을 원래의 데이터인 1111111111로 풀어 인식함으로써 원본과 동일한 데이터가 완성됩니다.

 

무손실 압축 방식은 위와 같이 어떤 식으로든 중복되는 부분들을 찾아내서, 기록하는 문자의 수를 줄임으로써 전체 데이터의 용량을 줄일 수 있습니다. 이는 손실 압축 시에도 동일하게 적용되는 가장 기본적인 데이터 압축 기법입니다. 손실 압축 기법은 여기에 더해 심리음향적인 압축 알고리즘이 추가되며 이는 본 연재의 다음 부에서 자세히 다룰 예정입니다.

 

만약에 무손실 압축 방식으로 기록된 오디오 파일을 다시 WAV 파일로 변환하면, 완벽하게 원본과 동일한 WAV 파일이 됩니다. 무손실 압축 방식은 원본 WAV 파일을 ZIP과 같은 단순 압축 컨테이너에 담아 놓은 것과 마찬가지이기 때문입니다. 간혹 무손실 압축도 압축을 거치면서 데이터가 손실된다는 주장도 있는데, 이를 비유하자면 ZIP 압축 파일로 워드 문서 파일을 압축했다가 다시 해제해 보면 문서 안에 오타가 생긴다는 말과 마찬가지인 터무니없는 얘기입니다.



WAV 원본 -> FLAC 압축 -> WAV 복원 -> FLAC 압축 결과 용량 비교. 단 1바이트의 차이도 없이 동일하다

 

오디오 전용 압축 방식을 쓰는 이유

그렇다면 오디오 파일도 평범하게 ZIP로 압축하면 되지 않느냐는 질문이 떠오르신다면 상당히 날카로우신 분입니다. 여기에 대한 답은, 모든 파일 압축 방식은 압축을 하려는 데이터의 형태에 따라 최적화된 알고리즘을 써야 용량을 최소화할 수 있습니다. ZIP, RAR 등 단순한 압축 컨테이너 방식은 어느 파일을 압축하든 범용적으로 그럭저럭 잘 적용될 만한 알고리즘이 적용된 것입니다. 그래서 FLAC과 같은 오디오 데이터 전용 무손실 압축 포맷을 사용하면 오디오 파일에 한정해서 용량을 더욱 줄일 수 있습니다.

 

한편으로는 편의성 때문이기도 합니다. 동일한 WAV 파일을 사람에 따라서는 ZIP로도 압축할 수 있고 RAR로도 압축할 수 있습니다. 음악 전용 압축 포맷이 없다면 재생하는 플레이어 입장에서는 그런 가능한 모든 압축 방식을 예상해서 각각의 압축을 해제하는 디코더를 전부 내장해야 하는 문제가 생깁니다. 그에 비해 FLAC과 같이 음악 전용으로만 사용하는 압축 방식을 쓰기로 다들 약속하면, 하드웨어 방식이든 소프트웨어 방식이든 플레이어는 그 오디오 전용 압축 방식에 대한 디코더만 탑재하면 되므로 설계가 쉬워집니다.

 

또한 오디오 전용 압축 방식은 오디오 재생에 유용한 각종 부가 데이터들을 추가로 하나의 파일 안에 통합할 수 있는 기능을 제공합니다. 곡명 / 앨범명 등을 기록한 태그, 앨범 아트 이미지 등이 그것입니다. 오디오 재생에 자주 사용되는 그런 부가 정보들을 약속된 저장 방식으로 미리 기록해 두면 파일을 만들기도 쉽고 플레이어 입장에서도 데이터 처리가 쉬워집니다.



WAV 파일을 FLAC과 ZIP로 압축한 용량 비교. ZIP은 용량이 거의 줄어들지 않았다

 

무손실 압축의 종류

오디오 전용 무손실 압축 방식도 물론 여러 가지가 있습니다. 현재 가장 대중화된 방식은 FLAC (Free Lossless Audio Codec)입니다. 24bit / 384kHz의 고해상도 PCM 음원과 멀티채널을 지원하여 범용성이 좋은 데다, 그 이름대로 라이선스가 필요 없는 개방된 포맷인 덕분입니다. 그래서 현재 시점에서는 음원 사이트들에서 PCM 무손실 압축 음원을 판매할 때 거의 FLAC 방식을 사용하고 있습니다.

 

FLAC 이전에는 무손실 압축 방식 중 압축률이 높은 APE와 같은 방식이 널리 사용되던 과도기가 있었습니다. 다만 압축률이 높으면 압축 해제, 즉 재생에 많은 연산 성능을 요구하는 문제가 있습니다. 그래서 용량에 덜 민감해진 최근에는 용량보다 속도와 기능성을 우선시하여 FLAC으로 넘어가게 되었습니다.

 

이외에도 OptimFROG, TTA, WMA Lossless, WV 등 여러 방식이 있지만, FLAC 이외에는 음원도 드물뿐더러 플레이어에서 지원해 주지 않아 재생이 불가능한 경우가 많습니다. 그나마 애플 진영에서 주로 사용하는 ALAC (Apple Lossless Audio Codec, 파일 확장자 M4A) 정도가 비교적 널리 쓰이는 편입니다. 애플의 미디어 파일 관리 프로그램인 iTunes에서 CD를 리핑할 때 이 ALAC로 저장할 수 있습니다. ALAC는 아이튠스 및 아이폰 / 아이팟 등 대부분의 애플 기기에서 재생할 수 있습니다.

 

글쓴이

  • 지성, 이성, 그리고 감성의 삼위일체를 꿈꾸는 테크니컬 라이터
    디자인과 공학을 기반으로 다양한 분야에 능통하여 다학제적 시각의 리뷰가 특기이다.
    개인 블로그 asnote.net 운영중