Vinyl 이나 Tape 을 최종 녹음 미디엄 (medium) 으로 사용하던 아날로그 시대를 거쳐

우리는 지금 디지털의 시대에 살고 있습니다.

 

소리는 공기 중의 떨림 입니다.

그 공기 중의 미세한 움직임을 우리의 귀는 우리의 뇌가 이해할 수 있는 형태로 바꾸어 주죠.

즉 하나의 형태의 요소가 다른 형태로 바뀌는 것 입니다.

 

마찬가지로 우리가 소리를 디지털화 시키기 위해선

연속적인 아날로그 소리를 컴퓨터가 이해할 수 있는 디지털 언어로 바꾸어 주어야 합니다.

바뀌는 과정에는 Sampling 을 빼 놓을 수 없습니다.

 

스웨덴 출신의 미국에서 거주하던 엔지니어인 Harold Nyquist 는

1918년 부터 1924년까지 여러가지 연구를 하던 중, 1928년 세상에 처음으로

소리의 디지털 샘플링 이론을 내 놓습니다.

수학에 기반을 한 그 이론은 이론을 테스트 해 볼 수 없는 당시의 현실적 여건에 부딪혀 증명을 하지 못하다가

20년이 지난 1948년 Claude E Shannon 에 의하여 수학적 증명을 받습니다.

 

그리고 우리는 그 이론을 “나이퀴스트 이론 (Nyquist Theorem)” 혹은 섀년/나이퀴스트 이론

(Shannony/Nyquist theorem) 이라 부릅니다.

 

나이퀴스트 이론이 말하는 바를 한 문장으로 줄이면 이렇습니다.

“우리가 샘플 (sample) 하려는 소리의 가장 높은 주파수보다 (Highest frequency)

2배 이상의 샘플링 속도 (Sampling Rate)를 사용하면 정확하게 소리를 다시 만들어 낼 수 있다. 

(아날로그에서 디지털로, 디지털에서 아날로그로)”

 

즉 우리가 만약에 1kHz 주파수를 녹음하고 싶다면 최소 2kHz Sampling Rate 를 사용해야 한다는 것이죠.

 

사람의 가청 주파수는 20Hz 부터 20kHz까지  입니다. 최소한 인체학 적으로 귀를 통하여 들을 수 있는 소리의

가청 주파수 입니다.  즉, 사람이 듣기위한 소리를 녹음하기 위해서는 40 kHz sampling rate 이상을 사용하면

됩니다.

 

자, Sampling Rate 에 대하여 공부하신 분들은 이 정도의 지식은 알고 계실 겁니다.

제가 공부를 하면서 항상 궁금했던 점이 있습니다. 그것은 바로 44.1kHz, 48 kHz, 88.2kHz 96kHz 등

여러 다른 샘플링 수치에 대한 것 이였죠.

 

샘플링을 “쪼개는” 것 이라고 설명하는 걸 참 많이 볼 수 있습니다.

즉 44.1kHz 는 1초에 44100 번 소리를 쪼개서 담는다는 것 이였죠.

이렇게 알고 계신 분들이 굉장히 많으실 겁니다.

 

자 그렇다면, 1초에 44100 번 쪼개는 것이 이득일 까요?

아니면 96000번 쪼개는 것이 이득일까요?

어느 쪽이 더 원본에 가깝게 소리를 다시 만들까요?

당연히 96000번 이겠죠?

 

Sine_Wave

 

자 그런데.. 44.1kHz 로 다시 돌아와 보겠습니다.

1Hz 의 진동 주파수가 있다고 생각해 보겠습니다.

1Hz 란 1초에 진동을 (Compression and Rarefaction) 1번 한다는 뜻 입니다.

1000Hz 진동 주파수가 있습니다. 1초에 1000번 진동한 다는 뜻 이겠죠.

만약에 Sampling Rate 이 1초에 44100번 “쪼개는” 것 이라면

1Hz를 더 많이 쪼갤가요 아니면 1000Hz 를 더 많이 쪼갤가요?

1초라는 시간 안에 1000Hz 보다 1Hz 가 진동이 더 적으니 1 Hz를 훨씬 많이 쪼개게 되겠죠.

그러면 1Hz 가 1000Hz 보다 더 원본에 가깝게 표현이 될 것 입니다.

왜냐면 1초에 44100번 쪼개니, 1Hz 는 44100번 쪼갤 수 있고

1000Hz 는 44.1번 밖에 못 쪼개니까요.

 

하지만 다행이도, 쪼갠다 라는 표현은 틀린 것 입니다.

아니, 적어도 나이퀴스트 이론에는 맞지 않습니다.

 

나이퀴스트 이론을 다시 봐 보겠습니다.

“우리가 샘플 (sample) 하려는 소리의 가장 높은 주파수보다 (Highest frequency)

2배 이상의 샘플링 속도 (Sampling Rate)를 사용하면 정확하게 소리를 다시 만들어 낼 수 있다. 

(아날로그에서 디지털로, 디지털에서 아날로그로)”

 

즉, 몇 번을 쪼개냐가 아니라, 2배 이상이면 정확하게 다시 소리를 만들어 낼 수 있는 것 입니다.

1Hz 와 1000Hz 둘 다 정확하게 말이죠.

 

그러니 만약에 누군가가

“나는 가청 주파수 안의 소리를 더 -정확하게- 담고 싶어서 높은 Sampling Rate 을 선호해”

라고 한다면 맞지 않는 말 이겠죠.

 

우리의 가청 주파수는 20kHz 까지라고 했습니다.

그리고 40kHz 의 sampling rate 이면 가청 주파수 이내의 모든 소리를 담을 수 있다고 했죠.

그런데 왜 디지털 미디엄의 시작인 CD는 44.1kHz 일까요?

40kHz 여야 하는 것 아닐까요? (20kHz x 2 = 40kHz)

 

나이퀴스트의 이론이 적용되기 위해선 우리가 샘플 하려는 소리가 Band-limited 되어야 합니다.

무슨 말이냐면, 세상에는 우리가 듣지 못하는 소리도 있습니다 (가청 주파수 위/아래).

즉 우리가 듣지 못할 뿐이지, 공기 중의 소리는 존재하죠.

우리가 녹음하려는 가청 주파수 안의 소리를 샘플 하기 위해선, 우리가 샘플 하려는 주파수보다

높은 주파수들은 샘플 하지 않아야 합니다.

그러기 위해서는 Anti-Aliasing Filter 라는 쉽게 말하면 Low-Pass Filter- 로우 패스 필터를

걸어 주어야 합니다.

왜냐면 우리가 샘플을 하기 위해선 샘플 하려는 신호보다 2배 빠르게 샘플 해야 하는데

너무 높은 주파수들이 샘플되기 시작하면 Aliasing 이 시작되기 때문이죠.

 

Aliasing 이 무엇인지 아래 영상을 55초 부터 보세요.

바퀴는 한쪽으로 계속 돌아가고 있지만

바퀴를 찍는 카메라의 Sampling Rate (영상은 초당 24번 (혹은 더 많이) 사진을 찍어서 합치는 것 입니다.)

이 따라가지 못하는 더 빠른 속도로 바퀴가 돌아가기 시작하면, 오히려 멈추는 듯한 영상 혹은

뒤로 도는 현상이 나타나죠. 하지만 이것은 실제로 일어나고 있는 일이 아닙니다.

시각적 에러가 일어나고 있는 것이죠.

 

소리의 샘플에서 Aliasing 도 마찬가지 입니다. 원래 존재하지 않던 소리들이 생기면서

소리가 정확하지 않게 되는 것이죠. 소리에 에러가 생기기 시작합니다.

이것 때문에 우리가 정한 Sampling Rate 이상의 소리는 아예 차단해 버리는

Anti-Aliasing Filter 를 만들어야 합니다.

그러나 우리가 생각하는 것 처럼 이상적인 필터 (Brick Wall Filter) 는 만들기가 힘이 듭니다.

 

pic4a

 

그래서 천천히 줄어드는 필터를 만들게 되고 그 필터의 특성 상 22.05Hz 까지 뻗어나가게 되기 때문에

44.1kHz 라는 Sampling Rate이 CD에 채택이 된 것이죠.

 

AAF-filter(필터 디자인의 한 가지 예)

 

여기까지 샘플링 이야기를 해 보았습니다.

굉장히 큰 이야기를 최대한 줄여서 하다 보니 빠진 내용이나 부가 설명이 필요한 부분이 많이 있습니다.

한 글에 담기에는 너무나 방대한 내용이기 때문이죠.

이 글에 담겨진 모든 내용은

“Digital Audio Explained : For The Audio Engineer” – Nika Aldrich 에 레퍼런스를 하고 있습니다.

샘플링을 말하기 까지 책의 138장을 할애할 정도로 샘플링은 말처럼 쉬운 이야기는 아닙니다.

 

다음 이야기 에서는 더 깊은 샘플링 이야기를 해 보겠습니다.

샘플링 이야기 [2]