로봇도 인간처럼 말하는 시대가 온다

김형태원장의 목소리컬럼

예송이비인후과/김형태 원장

인간의 목소리를 인공적으로 만들어 낼 수 있게 된 것은 사실 오랜 역사를 갖고 있다. 최초의 인공후두인 보이스박(VoiceBak)은 암으로 후두를 모두 제거한 환자에게 사용된 밸브가 달린 인공 후두였으나 잦은 보수가 필요하고 너무 비쌌으며, 외형적으로 흉하고 불편해 보편화되지는 못했다.

한편 공기의 흐름을 이용하는 인공후두와 달리 전기로 진동을 만들어내는 인공후두 장치가 1942년 라이트(Wright)에 의해 최초로 소개되었는데 이는 오늘날 사용하는 인공후두와 흡사했다. 소형 손전등 모양의 인공후두를 목에 대고 소리를 내면 그 진동이 스피커를 통해 목소리를 변환되는 원리였는데 이때 나오는 목소리는 로봇처럼 획일화된 기계음이었다. 한편 1957년 허버트 쿠퍼 박사와 랜드개발회사는 후두전적출술을 받은 환자로부터 사랑받는 모델을 개발했고, 최근에는 리모컨으로 음높이와 강도를 조절하는 등 다양하고 실용적인 모델을 개발해 좀 더 목소리를 편리하게 낼 수 있도록 하고 있지만, 이 모델들 역시 자연스러운 인간의 목소리가 아닌 기계음이라는 한계가 있다.

목소리에는 개인의 심리 상태, 사회적 배경, 건강 상태 등이 모두 담겨있는데, 인공후두는 이런 역할을 완벽하게 해낼 수 없다. 인공후두가 더 발전하기 위해서는 인간의 발성기관과 비슷한 구조로 만들어질 필요가 있다.

인간의 목소리를 인공적으로 만들기 위한 연구는 크게 두 가지로 앞서 살펴본 인공후두와 목소리 합성 기술이라고 할 수 있다. 목소리 합성 기술은 잘 만들어진 소리를 상황과 문장에 맞게 조합하는 기술을 말하는데 이 또한 소리 조합만으로는 미세한 감정 변화를 표현할 수 없다. 이를 해결하기 위해서는 인간의 발성기관과 동일한 장비를 만들어 목소리를 창조해야 하며 인간의 발성기관이 겪은 진화와 유사한 개발 과정이 필요하다.

일본 카가와 대학의 히데유키 사와다 박사는 자신의 로봇이 인간과 같은 목소리를 갖길 원해 인간과 동일한 발성, 조음 기관을 만들기 위해 폐, 인두, 성대, 구강, 입술을 만들고자 시도했다. 고무로 성대를 만들고, 실리콘 튜브를 감싸 인두와 비슷하게 만들었으며, 인두강의 횡단면의 변화를 조절하며 목소리를 만들어 냈다. 하지만 이 로봇 음성 시스템은 모음은 만들 수 있었으나 자음을 만들기는 어려웠다. 이 로봇은 간단한 노래를 할 수 있을 정도로 발전했지만 합성을 한 목소리보다 좋지 않아 현재의 많은 로봇들이 기계적인 합성음을 쓰고 있는 것이다.

1950년대와 1960년대만 해도 주로 성대 진동에 관한 목소리 연구를 했다. 연구 초기에 성대가 하나의 덩어리로 움직인다면 다양한 주파수의 목소리를 만들어낼 수 없다는 이론을 설명하기 위해 1개-질량 모델을 만들었고, 이 모델은 이후 성대근육이 서로 다른 2개의 덩어리로서 위아래 쪽이 서로 반대로 작용해 파동 운동을 만든다는 3개-질량 모델로 발전한다. 3개-질량 모델의 성대근육은 서로 독립적으로 물결치듯 움직여 자연스러운 공기의 흐름이 일어난다. 이것은 양쪽 성대가 톱니바퀴처럼 돌아가는 움직임을 갖는 모델이다.

미국 아이오와 대학의 잉고 티체 박사는 3개-질량 모델을 발전시킨 16-질량 모델을 만들어 실험에 사용하고 있는데 이는 인간 성대의 움직임을 사실적으로 재현할 수 있도록 만들어졌다. 위의 모델을 이용한 인공 성대는 인간의 목소리와 비교하면 아직 초보적인 수준이지만 앞으로 어떻게 변화할지 장담할 수 없다. 예를 들어, 최초의 컴퓨터가 책상을 가득 차지할 정도의 큰 장비였지만 지금은 명함 크기의 계산기로도 그 기능을 충분히 수행이 가능할 정도로 발전했다. 이런 발전 속도라면 사이보그처럼 인간과 동일한 외형에 동일한 생각과 동일한 발성 구조로 목소리를 내는 존재가 탄생할 수도 있다. 이때의 목소리는 인간처럼 조절이 가능하며, 감정을 담을 수도 있을 것이다.

지금까지 창조는 신의 영역으로 생각해 30년 전만 해도 인간을 복제할 수 있으리라 아무도 생각하지도 못했지만, 지금은 인간 복제가 불가능하다고 생각하는 사람은 아무도 없다. 인간의 목소리를 창조하기 위한 노력은 계속되고 있다. 미래의 사이보그는 완벽한 외모와 아름다운 목소리를 갖고 감정도 느끼며 친구처럼 대화를 나누고 있을 지도 모른다. 그러나 과학이 아무리 발전해도 절대로 만들어낼 수 없는 것이 있다. 바로 ‘생명’이다. 살아 숨쉬고 성장해가고 따뜻함이 있는 인간의 생명은 그들도 흉내 낼 수 없다. 이것이 바로 신의 창조물과 인간의 창조물 사이의 결정적인 차이다.
* 본 칼럼의 내용은 헬스조선의 편집방향과 일치하지 않을 수도 있습니다.

김형태원장의 목소리컬럼

외모보다 더 중요성이 부각되고 있는 목소리의 모든 것

가톨릭대학교 의과대학
이비인후과 전문의 / 의학박사
가톨릭대학교 의과대학 이비인후과학교실 부교수
현 예송이비인후과 원장

맨 위로