Vinyl 이나 Tape 을 최종 녹음 미디엄 (medium) 으로 사용하던 아날로그 시대를 거쳐
우리는 지금 디지털의 시대에 살고 있습니다.
소리는 공기 중의 떨림 입니다.
그 공기 중의 미세한 움직임을 우리의 귀는 우리의 뇌가 이해할 수 있는 형태로 바꾸어 주죠.
즉 하나의 형태의 요소가 다른 형태로 바뀌는 것 입니다.
마찬가지로 우리가 소리를 디지털화 시키기 위해선
연속적인 아날로그 소리를 컴퓨터가 이해할 수 있는 디지털 언어로 바꾸어 주어야 합니다.
바뀌는 과정에는 Sampling 을 빼 놓을 수 없습니다.
스웨덴 출신의 미국에서 거주하던 엔지니어인 Harold Nyquist 는
1918년 부터 1924년까지 여러가지 연구를 하던 중, 1928년 세상에 처음으로
소리의 디지털 샘플링 이론을 내 놓습니다.
수학에 기반을 한 그 이론은 이론을 테스트 해 볼 수 없는 당시의 현실적 여건에 부딪혀 증명을 하지 못하다가
20년이 지난 1948년 Claude E Shannon 에 의하여 수학적 증명을 받습니다.
그리고 우리는 그 이론을 “나이퀴스트 이론 (Nyquist Theorem)” 혹은 섀년/나이퀴스트 이론
(Shannony/Nyquist theorem) 이라 부릅니다.
나이퀴스트 이론이 말하는 바를 한 문장으로 줄이면 이렇습니다.
“우리가 샘플 (sample) 하려는 소리의 가장 높은 주파수보다 (Highest frequency)
2배 이상의 샘플링 속도 (Sampling Rate)를 사용하면 정확하게 소리를 다시 만들어 낼 수 있다.
(아날로그에서 디지털로, 디지털에서 아날로그로)”
즉 우리가 만약에 1kHz 주파수를 녹음하고 싶다면 최소 2kHz Sampling Rate 를 사용해야 한다는 것이죠.
사람의 가청 주파수는 20Hz 부터 20kHz까지 입니다. 최소한 인체학 적으로 귀를 통하여 들을 수 있는 소리의
가청 주파수 입니다. 즉, 사람이 듣기위한 소리를 녹음하기 위해서는 40 kHz sampling rate 이상을 사용하면
됩니다.
자, Sampling Rate 에 대하여 공부하신 분들은 이 정도의 지식은 알고 계실 겁니다.
제가 공부를 하면서 항상 궁금했던 점이 있습니다. 그것은 바로 44.1kHz, 48 kHz, 88.2kHz 96kHz 등
여러 다른 샘플링 수치에 대한 것 이였죠.
샘플링을 “쪼개는” 것 이라고 설명하는 걸 참 많이 볼 수 있습니다.
즉 44.1kHz 는 1초에 44100 번 소리를 쪼개서 담는다는 것 이였죠.
이렇게 알고 계신 분들이 굉장히 많으실 겁니다.
자 그렇다면, 1초에 44100 번 쪼개는 것이 이득일 까요?
아니면 96000번 쪼개는 것이 이득일까요?
어느 쪽이 더 원본에 가깝게 소리를 다시 만들까요?
당연히 96000번 이겠죠?
자 그런데.. 44.1kHz 로 다시 돌아와 보겠습니다.
1Hz 의 진동 주파수가 있다고 생각해 보겠습니다.
1Hz 란 1초에 진동을 (Compression and Rarefaction) 1번 한다는 뜻 입니다.
1000Hz 진동 주파수가 있습니다. 1초에 1000번 진동한 다는 뜻 이겠죠.
만약에 Sampling Rate 이 1초에 44100번 “쪼개는” 것 이라면
1Hz를 더 많이 쪼갤가요 아니면 1000Hz 를 더 많이 쪼갤가요?
1초라는 시간 안에 1000Hz 보다 1Hz 가 진동이 더 적으니 1 Hz를 훨씬 많이 쪼개게 되겠죠.
그러면 1Hz 가 1000Hz 보다 더 원본에 가깝게 표현이 될 것 입니다.
왜냐면 1초에 44100번 쪼개니, 1Hz 는 44100번 쪼갤 수 있고
1000Hz 는 44.1번 밖에 못 쪼개니까요.
하지만 다행이도, 쪼갠다 라는 표현은 틀린 것 입니다.
아니, 적어도 나이퀴스트 이론에는 맞지 않습니다.
나이퀴스트 이론을 다시 봐 보겠습니다.
“우리가 샘플 (sample) 하려는 소리의 가장 높은 주파수보다 (Highest frequency)
2배 이상의 샘플링 속도 (Sampling Rate)를 사용하면 정확하게 소리를 다시 만들어 낼 수 있다.
(아날로그에서 디지털로, 디지털에서 아날로그로)”
즉, 몇 번을 쪼개냐가 아니라, 2배 이상이면 정확하게 다시 소리를 만들어 낼 수 있는 것 입니다.
1Hz 와 1000Hz 둘 다 정확하게 말이죠.
그러니 만약에 누군가가
“나는 가청 주파수 안의 소리를 더 -정확하게- 담고 싶어서 높은 Sampling Rate 을 선호해”
라고 한다면 맞지 않는 말 이겠죠.
우리의 가청 주파수는 20kHz 까지라고 했습니다.
그리고 40kHz 의 sampling rate 이면 가청 주파수 이내의 모든 소리를 담을 수 있다고 했죠.
그런데 왜 디지털 미디엄의 시작인 CD는 44.1kHz 일까요?
40kHz 여야 하는 것 아닐까요? (20kHz x 2 = 40kHz)
나이퀴스트의 이론이 적용되기 위해선 우리가 샘플 하려는 소리가 Band-limited 되어야 합니다.
무슨 말이냐면, 세상에는 우리가 듣지 못하는 소리도 있습니다 (가청 주파수 위/아래).
즉 우리가 듣지 못할 뿐이지, 공기 중의 소리는 존재하죠.
우리가 녹음하려는 가청 주파수 안의 소리를 샘플 하기 위해선, 우리가 샘플 하려는 주파수보다
높은 주파수들은 샘플 하지 않아야 합니다.
그러기 위해서는 Anti-Aliasing Filter 라는 쉽게 말하면 Low-Pass Filter- 로우 패스 필터를
걸어 주어야 합니다.
왜냐면 우리가 샘플을 하기 위해선 샘플 하려는 신호보다 2배 빠르게 샘플 해야 하는데
너무 높은 주파수들이 샘플되기 시작하면 Aliasing 이 시작되기 때문이죠.
Aliasing 이 무엇인지 아래 영상을 55초 부터 보세요.
바퀴는 한쪽으로 계속 돌아가고 있지만
바퀴를 찍는 카메라의 Sampling Rate (영상은 초당 24번 (혹은 더 많이) 사진을 찍어서 합치는 것 입니다.)
이 따라가지 못하는 더 빠른 속도로 바퀴가 돌아가기 시작하면, 오히려 멈추는 듯한 영상 혹은
뒤로 도는 현상이 나타나죠. 하지만 이것은 실제로 일어나고 있는 일이 아닙니다.
시각적 에러가 일어나고 있는 것이죠.
소리의 샘플에서 Aliasing 도 마찬가지 입니다. 원래 존재하지 않던 소리들이 생기면서
소리가 정확하지 않게 되는 것이죠. 소리에 에러가 생기기 시작합니다.
이것 때문에 우리가 정한 Sampling Rate 이상의 소리는 아예 차단해 버리는
Anti-Aliasing Filter 를 만들어야 합니다.
그러나 우리가 생각하는 것 처럼 이상적인 필터 (Brick Wall Filter) 는 만들기가 힘이 듭니다.
그래서 천천히 줄어드는 필터를 만들게 되고 그 필터의 특성 상 22.05Hz 까지 뻗어나가게 되기 때문에
44.1kHz 라는 Sampling Rate이 CD에 채택이 된 것이죠.
여기까지 샘플링 이야기를 해 보았습니다.
굉장히 큰 이야기를 최대한 줄여서 하다 보니 빠진 내용이나 부가 설명이 필요한 부분이 많이 있습니다.
한 글에 담기에는 너무나 방대한 내용이기 때문이죠.
이 글에 담겨진 모든 내용은
“Digital Audio Explained : For The Audio Engineer” – Nika Aldrich 에 레퍼런스를 하고 있습니다.
샘플링을 말하기 까지 책의 138장을 할애할 정도로 샘플링은 말처럼 쉬운 이야기는 아닙니다.
다음 이야기 에서는 더 깊은 샘플링 이야기를 해 보겠습니다.
샘플링 이야기 [2]
잘 보고 갑니다. ^^
감사합니다 ^_^
안녕하세요. 나이퀴스트 검색하다가 들렀습니다. 쉽게 비유하여 설명해주셨네요 ㅎㅎ
근데 혹시 질문 하나 드려도 될까요??
가청범위 기준 44.1kHz으로 ‘완벽히’ 샘플링 가능하다는 것은 알겟습니다.
그런데 비트심도 차이에 따른 정확도는 혹시 차이가 있는 것인가요??
즉, 비트수가 높을수록 원음에 더 가깝다고 할 수 있는지 궁금합니다.
좋은 하루 되세요.ㅎㅎ
비트수는 음원의 Dynamic Range 를 구현하는데 사용이 됩니다. 일반적으로 24 bit 이상으로 녹음을 하면 원음에 굉장히 근접했다고 볼 수 있습니다. 물론 이것은 프로세싱에 사용되는 bit 과는 조금 다른 개념 입니다.
아 넵. 비트 심도 여쭤본것이었어요 ㅎㅎ 16bit 보다 24bit이 원음(아날로그)에 더 가깝다고 말할 수 있다는 말씀이군요. 답변 감사합니다. ㅎㅎ
Alan님 요즘 출시하는 디지털 녹음 기기들은 주파수 응답이40Khz~80Khz 나 되는데, 녹음기 자체가 실제로 40Khz~80Khz의 고주파 기록이 가능한건가요?
기록이 가능하다면 안티 엘리어싱 필터도 20Khz부터가 아닌 40Khz~80Khz 구간부터 시작되는 건가요?
안티 에일리어싱 필터가 어디서 시작하는가는 제조사에서 알려주지 않는 이상 절대 알수가 없습니다.
즉 만약에 96kHz sampling rate 으로 녹음을 한다고 하였을 때, 안티 에일리어싱 필터가 20khz 에서 시작할 수도, 30에서 혹은 40에서 시작할 수도 있다는 것이죠.
이것을 테스트하려면 전문적인 tone generator 를 이용하여 기기를 측정해야 합니다.
음향 장비들은 대부분 고주파 녹음을 목적으로 만들어 진 것이 아니기 때문에 안티에일리어싱 필터보다도 마이크의 주파수 응답, 마이크 프리엠프의 주파수 응답에서 이미 40khz 녹음이 불가능한 경우가 대부분이다 라는 점은 여담으로 추가할 수 있습니다.
안녕하세요. 위에 질문 올렸던 사람입니다. 답변 정말 감사햇습니다. ㅎㅎ
다름이 아니라 비트심도 샘플링 이론 관련해서 검색하던 중 궁금한 것이 생겨
혹여 더 질문드릴 수 있는지 해서 이렇게 덧글을 달아봅니다 ㅎㅎ..
비트심도라는 것은 오직 단일한 데시벨값(혹은 단일 정수값)을 가질 뿐인데
이것으로 어떻게 모든 신호들을 양자화 할 수 있는지 궁금합니다. 예컨대,
동시에 발생하는 3Hz와 30Hz의 두 신호를 샘플링ㅇ 이론에 따라60Hz의 샘플링 레이트로
샘플링하고 16bit의 비트심도를 이용한다면 각 샘플 당 2^16개의 값 중 하나의 값만을
정보로 취하는데 어떻게 두 신호 모두를 양자화할 수 있는지 궁금합니다..
질문이 너무 횡설수설이라 죄송합니다 ㅠㅠ
좋은 내용 잘 보고 갑니다.
궁금한 점이 하나 있는데요, 필터 출력이 22.05KHz라고 하더라도 샘플링은 40KHz로 해도 되는 게 아닌가 싶은데요..
2.05KHz만큼 원음과의 차이가 발생하기 때문인가요?
제가 잘못 이해한 것인지요..