출처는 http://www.icdmusic.com/new2/contents/aboutmp3 입니다.

. MP3 탄생 배경 2. MP3와 디지털 오디오 3. MP3 압축 원리 4. MPEG의 종류

1. MP3 탄생 배경
MP3는 MPEG-1 Audio Layer-3의 줄임 말로 오디오 신호를 효과적으로 사용하기 위하여 고안된 압축 방식을 지칭하는 말이다. 멀티미디어 시대가 도래하여 동영상 및 음향의 디지탈 데이타가 증가하면서 데이타 크기의 폭증이라는 어려운 문제점이 나타나기 시작했는데, CD 한 장을 그대로 디지탈로 저장하기 위해서는 650M byte라는 상당히 많은 저장 용량이 필요하다.
멀티미디어 개발자들은 이런 문제점들을 해결하기 위해서 데이타를 압축하여 저장하는 방법을 사용할 수밖에 없다는 것을 알았지만, 압축을 하게 되면 화질이나 음질에 큰 손실을 가져오기 때문에 이를 최소화하기 위한 연구들이 활발하게 진행되었다.
이런 연구를 뒷받침하기 위해서 세계적으로 압축 코딩의 표준이 마련되었는데 그것이 바로 MPEG(Moving Pictures Experts Group) 이다. 잘 알려진 대로 비디오 CD의 동영상 포맷이 MPEG-1 규격으로 제작되어 있고, 최근 출시된 DVD 역시 보다 진보된 MPEG-2 방식의 압축 기술을 사용하고 있다. MPEG은 이렇게 세계적인 영상 매체들의 표준을 이루는 중요한 규격으로 위성방송, 케이블방송 등을 위한 새로운 규격을 계속해서 만들고 있다.
이런 MPEG 규격 중에서도 오디오 데이타를 위한 규격들이 있는데 그 중 하나가 Audio Layer-3이라는 규격이다. 이 압축 방식을 사용하면 CD급의 음질을 유지하면서 데이타의 크기를 10분의 1 이상으로 축소할 수 있다. 그러나 이런 MP3 파일을 제작하거나 감상하기 위해서는 특수하게 제작된 인코더/디코더가 필요한데 이런 프로그램들은 대부분 프리웨어나 쉐어웨어 형태로 배포되기 때문에 인터넷 상에서 쉽게 구할 수 있다.
하지만 오디오 데이타를 압축하기 위한 표준은 아직 완벽하게 제정된 상태가 아니다. DVD에서는 AC-3라는 입체음 방식이 채용되었지만 가정용 오디오 시장에는 아직도 MD(Mini Disk) 방식이 일본을 중심으로 상당히 강세를 나타내고 있으며, 인터넷 쪽에서는 RA(Real Audio) 포맷이 보급되어 있는 실정이어서 PC에 어떤 방식이 표준으로 채택될 지는 더 두고 봐야 알 수 있을 것이다. 참고로 MD 레코더는 개발된지 꽤 오래되었기 때문에 비교적 압축률이 낮으며 MPEG Layer-1의 수준이라고 할 수 있다.

.........................................................................................................................................


2. MP3와 디지탈 오디오
MP3를 이해하려면 먼저 디지탈 오디오에 대한 기본적인 사항을 알아야 한다. MP3 역시 디지탈 오디오의 한 포맷에 해당하기 때문이다. 우리가 가장 많이 접할 수 있는 디지탈 오디오로는 오디오 CD(CoMPact Disk)와 PC의 윈도우 시스템에서 사용하고 있는 Wave라는 파일 포맷이 있다. 즉, 디지탈 오디오는 자연상의 아날로그 방식의 사운드를 디지탈 방식으로 변환하여 저장하는 방식이다. 0과 1의 디지탈 데이타로 변환하게 되면 음질이 손상되지 않고 저장하는 것이 가능하고 또한 PC에서 마음대로 사용할 수 있다는 장점이 있다. 우리가 게임을 하면서 실감나는 현장 효과음을 즐길 수 있게 된 것도 모두 이 디지탈 사운드 덕분이다.
소리를 마치 텍스트 파일처럼 저장하고 필요할 때 마음대로 편집하고 재생할 수 있는 이 디지탈 사운드의 기술은 대중음악가들에게도 자신의 창의력을 구체화할 수 있는 중요한 도구로 활용되고 있다. 물론 디지탈 사운드를 감상하려면 인간이 청취할 수 있는 아날로그 사운드로 변환하는 작업을 다시 수행하여야 한다.
이런 과정을 DA(Digital to Analog) 컨버팅과 AD(Analog to Digital) 컨버팅이라 한다. 즉, 아날로그 원음을 디지탈로 변환하는 과정을 AD 컨버팅이라 하고, 디지탈로 저장된 데이타를 아날로그로 변환하여 감상할 수 있도록 하는 과정을 DA 컨버팅이라 한다. 우리가 사용하는 사운드 카드나 CD플레이어는 모두 이런 기능을 수행하는 전자회로가 내장되어 있다.
디지탈 사운드에는 16bit의 44.1KHz와 같이 표현하는 변환 방식이라는 것이 있다. 이 형식은 아날로그 사운드를 디지탈로 변환할 때 얼마나 세밀한 요소로 분해하여 저장했는지를 나타내는 것이다. 즉, 8bit는 2의 8승인 256개로, 16bit는 2의 16승인 65356개로 분해하여 데이타를 저장했다는 이야기이고, 이렇게 분해하는 과정을 1초에 몇 번 반복했느냐는 의미로 KHz라는 단위를 사용한다. 44.1KHz라는 의미는 1초에 44100번 분해 작업을 수행했다는 의미이다. 분해도를 더욱 높이고 초당 분해 작업을 더 많이 할수록 원음에 가까운 사운드를 디지탈로 저장할 수 있다.
하지만 분해도를 높이면 엄청난 데이타의 크기 때문에 실용성이 떨어지므로, 실험 결과 인간의 귀로 원음과의 차이를 느낄 수 없다는 16bit에 44.1KHz 형식의 포맷을 많이 사용한다. 하지만 이 포맷도 1분당 약 10M byte의 대용량을 차지하기 때문에 통신을 이용해서 전송하기가 힘들다. 그래서 MP3 방식의 압축을 이용하여 CD급의 음질을 유지하면서 1분당 1M byte로 압축하는 방법을 사용한 것이 주목받게 되었다.


.........................................................................................................................................

3. MP3 압축 원리
MP3의 압축 방식은 우리가 알고 있는 Zip이나 Arj 등과 같은 일반적인 압축 방법과는 매우 다른 복잡한 알고리즘을 갖고 있다. 이런 압축 방법들은 주로 비파괴적인 압축 방식을 사용한다. 비파괴적인 압축 방식이란 데이타를 압축 복원하는 과정에서 데이타가 변경되거나 손실되는 것이 전혀 없는 방식이다.
예를 들어 '한글'로 작업한 문서를 Zip으로 압축해서 인터넷으로 송신했다고 하자. 만약 Zip을 압축하거나 복원하는 과정에서 데이타가 변경되거나 손실이 생긴다면 문서를 받는 사람이 그 내용을 정확하게 알아볼 수 없다. 이런 비파괴적인 압축의 알고리즘은 상당히 단순하다. 주로 연속되는 같은 데이타를 하나와 반복 횟수로 표시하는 방법을 사용한다.
'12222223334'라는 데이타가 있다고 할 때, 이 데이타를 압축하면 '12-63-34'라는 식으로 압축할 수 있다. 원래의 데이타가 11자인데 비해 압축한 후에는 8자로 줄어든다. 압축한 데이타의 표현식을 보면 '2-6'이라는 것은 2가 6번 반복되었다는 것을 의미한다. '3-3'도 역시 3이 3번 반복되었다는 것을 의미한다. 따라서 같은 데이타의 반복이 많은 파일일수록 압축률은 높아진다.
그러면 '한글' 파일과 윈도우용 사운드 파일인 Wave 파일을 WinZip이라는 압축 프로그램을 사용해 압축해 보자. 결과는 '한글'의 경우(물론 정도차는 있겠지만) 3분의 1 이상 줄어든 반면 디지탈 사운드인 Wave 파일은 약간밖에는 줄어들지 않는다. 이유는 사운드와 같은 멀티미디어 데이타들은 일반 문서나 실행 파일과는 달리 연속되는 데이타가 적기 때문에 압축률이 떨어지기 때문이다.
따라서 사운드 파일은 일반적인 비파괴적인 방법으로 압축하지 않고 다른 복잡한 알고리즘을 가진 파괴적인 압축 방법을 사용하게 되는 것이다.
파괴적인 압축 방식이란 불필요한 데이타를 삭제하는 방식으로 압축을 하는 것이고 한번 압축한 후에는 원형으로 복원이 어려운 반면 압축률은 상당히 높아진다. 따라서 일반 문서나 실행 파일과 같이 정확한 복원을 목적으로 하는 경우에는 사용할 수 없는 반면 사운드나 그림 데이타와 같이 약간의 음질 손상이나 화질 저하에도 무리가 없는 경우에 사용한다. JPEG이나 MPEG 등이 파괴적인 압축 방식에 속한다.
그렇다면 이제 MP3의 경우에는 어떤 방식으로 압축이 수행되는지를 알아보자. 여러분이 지하철 플랫폼에서 친구와 이야기를 하고 있는 상황을 생각해 보자. 전동차가 도착하기 전에는 친구와 작은 목소리로 대화를 나눌 수 있는데 전동차가 들어오기 시작하면 그 소음으로 인하여 친구의 목소리는 잘 들리지 않게 된다.
또한 전동차가 지나가도 잠시 동안은 그 소리의 여운으로 귀가 멍해진다. 음악에서도 이와 마찬가지로 큰 소리가 난 후에는 작은 소리는 인간의 귀로 들을 수 없는 경우가 있다. 이런 현상은 인간의 두뇌가 소리를 분석해 내는 과정에서 입력된 소리의 부적절한 부분을 제거하는 작용을 하기 때문이다.
MP3는 디지탈 사운드를 미리 분석해서 인간의 두뇌가 걸러낼 사운드를 미리 잘라내는 방식으로 압축을 수행한다. 그렇기 때문에 CD급의 음질을 유지하면서도 상당한 수준의 압축률을 올릴 수 있는 것이다. 사실 오디오 전문가가 아닌 일반인들의 능력으로는 압축 전의 디지탈 사운드와 MP3를 구별해내기 힘든 이유가 여기에 있는 것이다. 이런 압축 방식을 '인지 압축 방식(Perceptual Coding)'이라고 한다.
아날로그 음원을 MP3로 압축하는 과정을 간략히 나타내면 다음과 같다.
아날로그 음원 -> AD 컨버팅 -> 디지탈 PCM 파형
-> 20Hz에서 20KHz 사이의 주파수를 32단계로 분해
-> 분해된 한 단계를 다시 18단계로 세분 (총 576부분)
-> 각 세부된 부분에서 가장 강한 음의 성분에 대한 정보만을 선택
-> 나머지 음에 대한 음의 정보 삭제
-> 세분된 576부분의 강음 정보만을 모아 재합성
-> MP3 파일

4. MPEG의 종류
MPEG은 MPEG-1, MPEG-2가 현재 사용중이고 MPEG-4에 관한 규격이 재정중인데 오디오의 경우에는 주로 MPEG-1을 사용하기 때문에 일반적으로 MPEG 규격이라고 통칭된다. MPEG 규격의 오디오 부분은 Layer-1, Layer-2 및 Layer-3라는 세부 규격으로 나누어진다.
계층 I : 비트율 인덱스 0000 부터 1110 까지 32Kbps ~ 448Kbps로 압축
계층 II : 비트율 인덱스 0000 부터 1110 까지 32Kbps ~ 384Kbps로 압축
계층 III : 비트율 인덱스 0000 부터 1110 까지 32Kbps ~ 320Kbps로 압축

+ Recent posts