애플이 음성 비서 서비스인 시리(Siri)를 출시한 이후부터 음성(Voice)이 터치(Touch)다음의 직관적인 UI로 인식되며 관련 서비스들이 쏟아져 나오고 있다. 음성이 직관적이라는 것에는 사람들은 태생적으로 말, 즉 음성으로 사람들과 소통하기 때문에 별 거부감없이 받아들일 수 있다는 논리가 있다. 하지만 음성 인식과 관련된 서비스들이 생각만큼 성공적이지 못하다. 여기에는 서비스 완결성 측면의 문제점도 있겠지만, 음성이 스마트폰 등을 포함한 스마트기기를 통한 소통에 직관적인 수단이 아닐 수 있다는 근본적인 문제가 있을 수 있다.
사실 직관성(Intuition)이라는 것은 태생적으로 정해졌다기 보다는 교육되고 생활하는 제반 환경(Context)에 따라 변하기 마련이다. 그래서 어릴 때부터 PC를 사용하고, 메시징을 통해 문자 쓰기 타이핑(Texting/Typing)에 익숙하며 스마트폰을 터치(Touch)로 사용하는 새로운 세대들에게 직관적이고 익숙한 것이 과연 음성일까?라는 질문을 던져 본다.
1. 10대들은 문자(Texting) 선호도가 높고 전반적으로 음성전화 사용 추이가 감소
소비자 조사기업인 닐슨이 2010년 2사분기에 미국 내 세대별 문자(Texting) 사용 추이를 조사한 결과를 보면, 전 세대에 걸쳐 전반적으로 문자 사용은 증가하고, 음성 전화 사용은 줄어들고 있다. 여기서 10대(Teen age)라고 불리는 13-17세가 18-24세보다 2배 가까이 더 많은 문자사용을 하고 있는 것으로 나타났다. 이들 13-17세는 1달에 3,339건의 문자 사용을 했으며, 이는 깨어있는 1시간당 약 6건의 문자 사용을 한 샘이다. 비교 대상인 18-24세들이 1달에 사용하는 1,630건의 2배에 달한다.또 닐슨 자료에 따르면 10대들이 음성 전화보다 문자를 사용하는 이유가 2009년에는 ‘재미있어서(Fun)’이었지만 2010년 쉽고 빠르고 편해서였다. 이렇게 볼때, 성장하는 새로운 세대들에게 더 친숙한 소통 수단은 더 이상 음성이 아니라 문자 쓰기(Texting)라고 볼 수 있다.
[그림1] 닐슨의 세대별 문자/음성전화 사용 추이


Source : Nielsen Company(2010)
2. 음성 수단은 스마트폰 사용시간의 9.5%에 불과
영국 이동통신 사업자인 O2가 2012년 6월에 조사한 자료에 따르면 스마트폰 사용자들이 음성 수단을 사용하는 것은 전체 128분 중 12.13분에 불과하다.
[표1] 스마트폰 사용 시간(일)
Source : news.o2.co.uk(2012.06)
위의 스마트폰 이용 통계에 대해 하루 24시간 중 2시간 남짓에 불과할 뿐이라고 의미를 낮출 수도 있다. 그 외의 시간에 PC를 사용하거나 다른 사람들과 이야기를 할 수 있기 때문이다. 하지만 중요한 것은 사람들이 소통하는 대상에 따라 그 태도가 달라진다는 점이다. 예를 들어 사람들은 휴대폰, 스마트폰, 태블릿PC은 적극적이고 능동적으로 사용을 하는 반면 TV는 여전히 대표적인 수동적 사용(Lean-back)의 대상이다. 심지어 거실이라는 동일 공간 속에서 TV와 함께 스마트폰을 사용하는 경우도 TV에 대해서는 수동적, 스마트폰에 대해서는 능동적인 행태를 보인다. 이렇게 볼 때 스마트폰 사용에 있어 음성이 직관적 수단인지에 대해 알아보는데 [표1] 스마트폰 활동별 사용 시간 자료는 의미있는 수치일 수 밖에 없다. [표1]은 사람들이 스마트폰을 통해 소통을 할 때는 문자쓰기 또는 클릭(Click)이 이제는 좀 더 빠르고 편리한 직관적인 수단임을 보여주고 있다.
3. 이제 음성 전화는 민폐 인식
소비자 생활의 변화를 조사한 CNN의 발표에 따르면 젊은 세대들에게 문자를 남기지 않고 전화를 한다는 것은 방해하거나(Intrusive) 극히 무례(Presumptuous)한 행동으로 치부된다. 그리고 2012년 18-29세들이 하루에 사용하는 문자메시징 수는 88회로 2년 전보다 약 33회가 증가하였고, 전화 통화는 17회로 2년전의 30회 대비 거의 반으로 줄어들었다. 이렇게 볼 때 음성전화는 민폐라는 인식은 시간이 지날 수록 더욱 강해질 것으로 보인다.
4. 세대 변화를 감안한 스마트폰의 직관적 입력 수단 강구 필요
전(全) 세대를 감안할 때, 지금 당장 터치 및 타이핑이 음성보다 더 좋은 수단일 리는 없다. 여전히 40대 이상에게는 음성이 더욱 편리할 수 있다. 하지만 이들 세대가 커나가고 IT 또는 전자 제품의 주요한 소비자가 될 때는 음성이라는 수단이 이들 젊은 세대들에게 불편할 수 있다는 인식이 필요하다.그리고 음성 인식(Voice Recognition)의 미래에 대해 완전히 부정적인 것은 아니다. 여기서 말하고 싶은 것은 기업 내 한정된 자원을 얼마나 최적으로 배분하는가의 관점에서 음성 인식에 투자하는 제조사와 서비스 사업자들에게 화두를 던지는 것이다. 한정된 자원으로 소비자와 스마트 기기간 직관적인 소통 수단에 대한 고민을 하는 기업이라면 적어도 스마트폰, 태블릿PC 등 ICT 또는 전자기기에 있어서는 소비자들에게 터치나 타이핑이 더 직관적인 소통 수단이 될 수 있다고 말하고자 한다.
물론 다르게 봐야할 객체도 있다. 그게 바로 자동차라는 공간이다. 많은 사용자들이 운전 중 문자를 보내는 것이 위험한 것을 알고 있지만, 운전 중 문자 채팅을 한다. 문자 채팅으로 인한 사고가 증가하고 있어 자발적인 행동 규제 움직임과 법적인 규제가 동시에 나타나고 있다. 이렇게 볼 때 적어도 자동차라는 공간에서는 ‘터치’ 또는 ‘타이핑’ 보다는 음성이 더 적합한 수단이 될 가능성은 열어둬야 할 것이다.
