1877년 에디슨은 주석을 감싼 원통 표면에 홈을 파 소리의 진동을 그려 넣었다. 이 홈을 따라 움직이는 바늘의 진동에 확성기를 연결하여 본래의 소리를 재생해 냈다. 축음기다. 에디슨의 축음기는 소리를 저장하여 원할 때면 언제나 다시 들을 수 있게 한 중요한 발명이었다. 하지만 음향의 질이나 저장 매체의 성능은 사람들의 기대에 미치지 못했다.
그 이후 원통형 축음기의 단점을 보완하여 딱딱한 비닐 재질의 원판에 소리의 진동을 기록하는 LP(long play)판이 개발되었다. 직경 30 혹은 25센티미터의 LP판에 아주 미세한 홈을 만들어 파동을 그려넣었다. 분당 78회전 또는 33과 1/3 회전하는 턴테이블과 직경 25마이크로미터의 가느다란 바늘을 이용하여 소리를 재생할 수 있었다.
불과 이십 년 전만 해도 우리는 순식간에 공간에 퍼져 사라지는 음악을 들으려면 금속이나 플라스틱 판에 소리의 진동을 새겨 넣는 것 외에는 별다른 방법이 없었다. 지금은 작은 휴대폰에 몇 백곡의 노래를 담아 언제라도 들을 수 있다. 우리는 이런 연속적인 소리의 진동을 어떻게 디지털 기기에 기록할 수 있는 걸까? 그리고 얼마 되지 않는 작은 용량의 디지털 파일에 어떻게 압축해 넣을 수 있는 걸까? 우선 그 이야기를 하기 전에 우리는 눈에 보이지 않는 소리의 진동을 어떻게 시각화하여 표현할 수 있는지부터 생각해봐야 한다. 숫자로 표현할 수 있어야 기록이든 재생이든 처리든 할 수 있을 테니 말이다.
잔잔한 호수에 돌을 던지면 파문이 생긴다. 가만히 관찰해 보면, 돌이 떨어진 자리에서 요동치던 물방울은 금새 가라앉고 사방으로 파동이 퍼진다. 수면에 인 파문은 일정한 파장을 갖고 동심원을 그리며 멀리 퍼져 나간다. 수면의 파동은 물 표면 높이가 진동하는 현상이다. 파동은 떨어진 돌의 충격으로 생긴 에너지를 물 표면의 진동 에너지로 바꿔 멀리 퍼져 나가게 한다. 방금 던진 돌 주변에 또 하나의 돌을 던지면 새로운 파동이 생긴다. 돌이 떨어진 자리를 중심으로 두 개의 동심원을 그리는 파동은 서로 겹쳐지면서 멋진 무늬를 만든다. 각 파동에 의한 물 표면 높이의 진동이 서로 겹치며 더해진다. 그런데 파동이 서로 더해진다는 것은 어떤 의미일까?
우선 우리가 알고 있는 덧셈을 살펴보자. 사과 1개가 놓인 접시에 다른 사과 1개를 올려 놓으면, 접시 위의 있는 사과의 개수는 2개가 된다. 1+1=2은 자명하다. 여기에 또 다른 사과 1개를 더하면, 접시 위에 놓인 사과 개수의 합은 1+1+1=3개다. 이렇게 사과의 개수를 셀 때는 각 사과의 질량 차이는 생각하지 않는다. 사과의 개수가 중요하지, 작은 사과가 몇 개이고 큰 사과가 몇 개인지는 가리지 않는다는 말이다.
하지만 사과의 질량에 대한 덧셈을 하려면 각 사과의 질량을 알아야 한다. 예를 들어, 두 번째 사과의 질량의 크기가 첫 번째 사과의 두 배라면, 접시 위에 있는 두 사과의 ‘질량’을 더하면 그 값은 3배가 된다. 다시 말해, “1(한 사과의 질량)+2(다른 사과의 질량)=3(두 사과의 질량)”이 되는 것이다. 접시 위에 사과 2개를 놓고 덧셈을 하는데, 어떤 때는 1+1=2, 또 다른 때는 1+2=3이 가능하다. 여기서 더 나아가 각 사과의 색깔까지 더하면 어떤 식의 덧셈이 될지 한번 생각해보자. 엄청나게 많을 것이다.
그럼 이제 파동의 덧셈을 시도해보자. 사과는 서로 공간적으로 떨어져 있어, 각 사과가 차지하는 영역이 구분되기 때문에 사과 하나하나를 낱개로 셀 수 있다. 하지만 파동은 공간에 퍼져있기 때문에, 다른 파동이 웬만큼 멀리 떨어져 있지 않으면 각 파동을 낱개로 구분해 내기가 쉽지 않다. 더욱이 인접한 두 개 이상의 파동이 서로 겹친 경우라면 더욱 난감하다. 낱개로 셀 수 없는 파동에는 사과처럼 개수를 세는 ‘1+1=2’라는 덧셈 규칙은 아무 쓸모가 없다.
파동은 잘 겹쳐지고 더해지는 성질이 있다. 겹쳐진 파동을 잘 관찰해 보면 각 지점에서 파동의 높이가 서로 더해지거나 빼지는 것을 알 수 있다. 사과의 경우, 각 사과의 개수 대신 질량을 더할 수 있었던 것처럼 겹쳐진 파동에서는 주어진 위치에서 각 파동의 높이가 더해지는 양이 될 수 있다. 여기서 사과와 파동의 차이점에 유의할 필요가 있다. 사과의 질량은 하나의 숫자인데 반해, 파동의 높이는 공간의 한 지점 ‘x’ 에서 일정한 크기 ‘A’가 주어지는 함수 A(x)가 된다. 따라서 파동의 높이를 더하는 작업은 단순히 두 숫자를 더하는 것이 아니다.
파동 A의 높이와 파동 B의 높이를 더하다는 것은 모든 점에서 두 함수 A(x)와 B(x)의 값을 더하는, 즉, A(x)+B(x)라는 두 함수를 서로 더한다는 것을 의미한다. 사실 공간에 넓게 퍼져있는 파동의 높이를 더한다는 것은 생각만 해도 엄청난 일이다. 설사 모든 지점 x에서 높이의 크기를 모두 더했다 하더라도 그 결과가 무엇을 의미하는지 파악하기도 여전히 쉽지 않을 것이다.
파동의 겹침 현상을 추상적인 함수의 덧셈 대신 좀 더 직관적으로 표현할 수 있는 아이디어를 생각해보자. 사과와 같이 낱개로 구분이 되는 물체는 그 위치를 분명히 정할 수 있다. 시간에 따른 위치의 변화를 알면 그 운동을 정확히 기술할 수 있다. 뉴튼의 운동법칙은 이렇게 낱개로 구분되는 물체의 운동에 적용되는 법칙이다. 그렇다면 공간에 퍼져있는 파동의 상태는 어떤 변수로 기술할 수 있는 걸까? 물체의 운동을 위치와 속도로 나타내듯이 파동의 운동을 표현하는 방법이 필요하다.
파동의 특징은 주기성이다. 공간에 퍼진 모양이나 시간에 따른 진동 모두 주기적으로 이루어진다. 주기적인 운동을 하는 대표적인 모델은 물체의 원운동이다. 반경 r인 원의 원주를 따라 속력 v로 움직이는 물체는 원의 한 점에서 출발하여 시간 T=2 π r/v가 지나면 다시 원래 자리로 돌아온다. 일정한 주기 T마다 같은 운동을 반복하는 것이다. 원의 중심과 물체의 시작점을 잇는 직선을 기준으로 각 θ에 위치한 물체의 높이는 삼각비에 따라 h = r sin(θ)로 표시된다. 따라서 이 물체가 회전하면 θ 값이 증가하고, 높이 방향으로 투영된 물체의 높이는 사인함수의 값이 주기적으로 변하듯이 상하 운동을 반복한다. 이와 같은 특성은 주기적인 진동을 하는 파동의 운동과 일치한다. 그래서 원운동을 하는 물체의 높이를 공간에 펼쳐 놓거나 시간에 따른 변화의 관점에서 바라본다면 정확하게 파동에 대응된다는 것을 쉽게 이해할 수 있다. 수식으로 표현하면, θ = 2 π x/ λ로 정하면, 파동 A(x) = sin(2 π x/ λ)는 일정한 파장 λ를 갖는 파동이고, θ = 2 π t/ T를 대입하면 파동 A(t) = sin(2 π t/ T)는 주어진 위치 x에서 시간 주기 T로 진동하는 운동에 대응된다. 따라서 일정한 파장 λ와 주기 T를 갖는 파동은 반경 r의 원운동에 대응하여 생각할 수 있다.
일정한 원운동 반경 r에 같은 파장를 가진 두 파동이 공간적으로 어긋나게 퍼져나갈 수 있다. 예를 들어, h1 = r sin(θ)과 h2 = r sin(θ – θ0)과 같이 수식적으로 표현할 수 있다. 이런 차이는 원운동의 초기조건, 즉, 시작점을 결정하는 값 θ0에 따라 파동의 상대적인 위치가 달라지기 때문이다. 실제 원운동을 결정하는 변수로 원의 반경 외에 시작점의 각을 나타내는 위상 변수가 있다. 따라서 일정 파장과 주기를 갖는 파동의 특성은 원운동 반경의 크기 r0와 위상 θ0으로 표현할 수 있다.
그리고 파동의 파장과 진동수 사이에는 특별한 관계가 있다. 여기서 진동수는 주기의 역수로 1초 동안 진동한 횟수를 말한다. 예를 들어, 공기 중에서 소리의 속력은 일정하다. 속력의 크기는 섭씨 20도에서 초속 342미터 정도다. 파장과 진동수를 곱하면 속력이 된다. 결국 파장과 진동수는 서로 연결된 양이 다. 비록 소리처럼 단순한 관계는 아니지만, 파장과 진동수 사이에는 파동의 특성을 결정하는 분산관계가 있다.
일반적으로 파동에는 여러 종류의 파장이 겹쳐 있다. 앞선 글 [파장으로 보고, 진동수로 듣는다]에서 모든 악기 소리의 색깔이 독특한 것은 여러 파장이 겹쳐진 배음이 구조라는 것을 얘기했다. 마찬가지로 모든 파동에는 여러 파장의 성분이 존재한다. 서로 다른 파장를 갖는 파동은 서로 다른 진동수로 진동하기 때문에 두 파동이 겹치면 진동수의 차이 또는 합만큼 새로운 진동을 보이게 된다. 한편 같은 파장의 진동은 똑같은 진동수로 움직이기 때문에 두 파동이 겹칠 때 특별한 현상을 나타낸다. 같은 파장과 진동수를 갖는 파동은 그에 대응하는 원운동 반경의 크기 r0과 위상 θ0으로 표현되기 때문에, 파동의 겹침에 대한 특별한 덧셈 규칙도 있다.
파동의 특성을 결정하는 크기와 위상 (r0, θ0)는 길이와 방향을 갖는 2차원 벡터를 극좌표로 표시한 것이다. 따라서 주어진 파장의 (r0, θ0), (r1, θ1)의 두 파동을 합하는 규칙은 (r0, θ0), (r1, θ1)에 해당하는 두 벡터의 합을 구하는 규칙과 동일하다. 예를 들어, 두 파동의 위상이 같은 θ0 = θ1의 경우, 두 파동의 벡터는 같은 θ0 방향을 향하기 때문에 결과적으로 두 파동의 합은 (r0 + r1, θ0)이 되어 단순히 크기 r0와 r1의 합이 된다는 것을 확인할 수 있다. 다시 말해서, 위상이 같은 경우는 사과의 질량을 더하는 것과 같은 결과를 준다. 이렇게 위상이 같은 파동의 합이 서로 상승 작용을 해서 커지는 경우를 보강간섭이라 한다.
이제 두 파동의 위상이 180도(또는 π 라디안) 차이가 나는 θ0 = θ1 + π인 경우를 생각해보자. 180도 위상 차이가 있다는 것은 두 파동의 벡터가 서로 반대 방향을 향한다는 것과 같다. 따라서 벡터의 합은 (r0 - r1, θ0)이 되어 r0와 r1의 차이가 파동의 크기가 된다. 여기서 두 파동의 크기가 같다면, 즉 r0 = r1이라면, 그 합은 r0 - r1 = 0이 된다. 같은 파장이면서 위상이 180도 다른 두 파동을 더하면 그 크기가 0이된다. 다시 말해서 파동이 없어진다는 것을 의미한다. 이런 경우를 상쇄간섭이라 부른다.
이렇게 크기와 위상을 갖는 파동의 덧셈은 사과의 덧셈과 근본적으로 다름을 확인하였다. 사과의 개수나 질량의 덧셈은 1+1=2의 규칙을 그대로 따르는 반면, 파동의 덧셈에서는 위상의 차이에 따라 크기의 합 ‘1+1’이 상쇄간섭 ‘0’에서 보강간섭 ‘2’까지 가능하다. 파동의 보강간섭과 상쇄간섭은 호수의 물 표면의 진동에도 마찬가지로 적용된다. 물에 떨어진 돌이 만든 동심원 파동이 서로 겹쳐지면서 보강 상쇄 간섭을 만들어 멋진 간섭 무늬를 만들어 낸다.
자, 이제까지 우리는 파동을 간단한 수식을 이용해 표현할 수 있는 방법을 알아보았다. LP판은 이렇게 시간에 따른 소리의 진동 변화를 그대로 그려 넣은, 아날로그 방식의 대표적인 유물이라 할 수 있다. 비닐 판에 홈을 파서 제작하는 방식이기 때문에 소리의 진동을 완벽하게 재현하기도 힘들고 사용하는 과정에도 많은 불편이 있었다. 그러면서 컴퓨터 기술의 발전에 따라 LP판의 아날로그 신호를 디지털 신호로 바꾸려는 시도가 있었다. 우리 귀로 구분할 수 있는 소리의 진동수가 초당 20회에서 2만 회, 즉 20 ~ 20,000Hz 사이에 있다는 점에 착안한 것이다.
아날로그 신호를 디지털로 바꾸는 과정에서 디지털 샘플링의 빈도를 우리가 들을 수 있는 최대 진동수 보다 훨씬 높은 4만4천1백 회, 즉, 44.1kHz를 사용하고, 각 샘플링 위치에서 파동의 크기를 65,536 단계로 구분하는 방식을 사용하여 실제로 저장되는 스테레오 음악 데이터의 양은 초당 1411.2 kbit 정도다. 따라서 700 MB(메가바이트) 용량의 CD는 약 65분 정도의 재생이 가능하다. 하지만 CD에 저장되는 파동의 정보는 LP판에 저장되던 아날로그 정보를 불연속적으로 데이터로 변환한 것 외에는 크게 다른 점이 없다.
MP3는 Moving Picture Experts Group(MPEG)에서 정한 음성 데이터 압축(audio data compression) 방식이다.MP3의 기본 아이디어는 우리 귀가 소리의 진동에서 진동수를 분해해 낸다는데서 나왔다. 앞선 글 [파장으로 보고, 진동수로 듣는다]에서 우리는 소리의 색깔, 즉 음색을 시간 경과에 따른 소리의 진동 크기 변화가 아니라, 진동수의 변화로 구분한다고 논의했다. 그래서 음성 데이터도 시간 영역이 아니라 진동수 영역에서 데이터를 최적화하는 것이 효과적이라 짐작할 수 있다.
CD에 저장된 정보는 기본적으로 시간에 따른 파동의 진동을 기록한 것이다. 시간 영역에서 연속적인 함수의 표본을 불연속적인 점에서 추출하고 동시에 잡음까지 최소화하려면 필요 이상으로 많은 데이터를 추출해야 한다. 다시 말해, CD음악 파일에 저장된 시간 영역의 파동 정보는 우리가 듣는 진동수 영역에서는 필요없는 데이터까지 포함하고 있는 것이다.
MP3 인코딩의 기본 작업은 소리를 시간에 따른 크기 변화 그대로 저장하지 않고, 시간 영역에서 샘플링한 데이터를 진동수 영역으로 변환한 다음, 우리 귀에 민감하진 않은 진동수 영역의 데이터를 조정한 후에 압축 알고리즘을 적용하여 저장하는 것이다. 진동수 영역에서 작업할 경우 샘플링을 1411.2 kbit/s에서 128, 160 및 192 kbit/s까지 줄여도 음악의 질을 충분히 유지할 수 있다. 그러면서도 최종 저장 데이터의 양은 11분의 1, 9분의 1, 또는 7분의 1까지 줄일 수 있다.
파동을 시간에 따른 함수가 아닌 진동수 또는 파장으로 분해하여 표현하는 방법에 착안한 MP3 기술의 발전은 음향데이터 압축뿐 아니라 영상데이터 압축 기술로 발전하였으며, 지금은 인터넷을 통한 HDTV시청까지도 가능하게 하고 있다. 디지털 신호처리 기술의 핵심은 디지털-고속-푸리에-변환(digital fast Fourier transform, dFFT)을 포함한 여러 컴퓨터 알고리즘을 하드웨어에 직접 설계해 넣는 것이다. 파동의 시간 변화 정보인 실시간 아날로그 정보를 시간 지연 없이 진동수 영역으로 신속하게 바꿔주기 위해서는 최대한 빠른 속력 계산이 필요하기 때문이다.
MP3 음악 파일처럼 진동수 영역에서 데이터를 압축하면 효율적으로 잡음을 제거할 수 있다. 이런 파동의 진동수 영역과 시간 영역에서의 관계를 이용하면 훨씬 정밀한 측정도 가능하다. 다음 글에서는 정밀한 측정을 위해 어떻게 파동의 성질을 이용하는지 살펴보자.