스마트폰 이젠 목소리로 조작한다
2014-12-24 PC사랑
삼성전자의 S보이스부터 LG전자의 Q보이스, 애플의 시리에 이르기까지 최근 출시된 대부분의 스마트폰에는 음성 인식이 탑재돼 있다. 또 네이버와 구글 등 검색 엔진에도 음성 검색 기능이 포함돼 있다. 하지만, 이런 프로그램을 실제로 활용하는 사람은 드문 편이다. 이는 보이스 프로그램의 음성 인식률이 낮다는 사람들의 인식 때문이다. 그렇다면 정말 스마트폰의 보이스 프로그램이 실용성이 없는 기능일까? 결론만 말하자면 아니다. 주로 사용하는 단어는 거의 100%에 가까울 정도로 높은 인식률을 보이며, 사용하지 않는 단어도 입력 패턴만 잘 알고 사용하면 얼마든지 편리하게 사용 가능한 것이 음성 인식 기능이다. 이번 호에서는 이런 음성 인식 기능의 활용 방법을 알아봤다. 스마트폰에 탑재된 음성 인식 기능부터 검색 엔진의 음성 검색 기능까지 면밀히 알아보자.
임지민 기자
“ 기술이 몇 년 사이에 참 많이 발전했어요. 전 문자도 손으로 타이핑하기보단 전화하듯이 음성으로 작성 후 오탈자 몇 개만 수정 후 발송할 정도예요. 인식률도 매우 높아서 수정할게 거의 없더라고요”
취재 때문에 만난 한 PC업계 관계자가 지나가는 말로 기자에게 한 말이다. 실제로 그 관계자는 문자나 간단한 메모 입력 시 음성인식 기능을 활용한다고 설명했다. 인식률도 매우 높다고 강조하면서 기자에게도 써보라며 강력히 추천할 정도였다.
여기서 그치지 않고 동일한 기종을 사용하는 다른 관계자에게 음성 인식 기능에 대해 물어보니 정 반대의 의견이 나왔다. 음성 인식률이 너무 낮아 실용성이 전혀 없다는 것이다. 왜 이런 극과 극의 나오는 것일까? 이는 음성 인식 기능의 사용법과 한계를 제대로 인식하지 못함으로 인해서 발생되는 결과다.
예를 들어 기자가 직접 사용하는 갤럭시S3의 S보이스에서 문자 메시지를 보내는 방법을 알아보면, ‘문자메세지 이름 내용’이나‘이름에게 문자메세지 내용’으로 말하면 문자메세지 전송창이 출력된다. 하지만,~에게라는 단어를 빼고‘이름 문자메세지 내용’순으로 말할 경우 연락처에서 이름을 검색하는 것이 아닌 내용을 검색하게 된다. 이처럼 패턴이나 인식 순서를 모른 상태에서 음성 인식을 활용하기 때문에 인식률이 낮다고 느끼게 되는 것이다.
음성 인식 어떻게 활용할까?
음성 인식 기능을 직접 활용해보기에 앞서 스마트폰 별로 자체 탑재된 음성 인식 기능은 어떤 것들이 있는지 먼저 알아보면 삼성전자 갤럭시 스마트폰에는 S보이스, LG전자 옵티머스에는 Q보이스, 애플 아이폰에는 시리가 탑재돼 있다.
음성 인식 기능을 직접 활용해보기에 앞서 스마트폰 별로 자체 탑재된 음성 인식 기능은 어떤 것들이 있는지 먼저 알아보면 삼성전자 갤럭시 스마트폰에는 S보이스, LG전자 옵티머스에는 Q보이스, 애플 아이폰에는 시리가 탑재돼 있다.
각 제조사마다 탑재된 앱이 다르긴 하지만 기본적으로 지원하는 기능은 비슷하다. 먼저 간단한 알람 기능부터 메모, 검색을 비롯해 뉴스 읽어주기, 문자 전송, 연락처, 검색, 날씨 확인 등을 음성 인식 기능을 통해 사용할 수 있다.
그렇다면 이런 음성 인식 기능을 사용하기 위해 가장 먼저 해야 하는 일이 무엇일까? 바로 명령어와 패턴의 확인이다. 이런 음성인식 기능들은 각각 고유의 명령어와 패턴을 가지고 있어 이를 파악 후 활용해야 음성 오차가 거의 없이 활용이 가능하다. 이런 패턴 파악 없이 음성 인식 기능을 활용할 경우 문자 발송 시 발송하고자 하는 사람의 이름이 내용으로 들어가거나 앱 실행 시 웹페이지를 통해 검색하는 등 동문서답을 진행하는 경우가 생길 수 있다. 물론, 설정된 명령어를 기반으로 진행하는 만큼 100% 정확한 인식이 가능하지는 않지만 이런 패턴과 적용된 명령어를 정확히 파악 후 사용한다면 오작동을 최소화 할 수 있다.
음성 인식 앱을 실행하면 각 음성인식 프로그램에 등록된 명령어를 볼 수 있다. 이런 명령어 목록에는 메모부터 문자, 음악, 트위터 등 앱에 따라 예시가 기재돼 있으니 확인 후 상황에 맞춰 변경해 사용하면 된다. 예를 들어 S보이스를 살펴보면 애플리케이션 열기부터 알람, 메모, 할 일, 음악, 소셜 업데이트, 음성 통화, 문자 메시지, 연
락처 찾기, 길 찾기, 알람, 영화, 영화 검색 등을 위한 명령어 예시가 자세히 기재돼 있다.
만약 명령어 확인이 불가능한 상황이라면 단어를 끊어서 입력하면 된다. 예를 들어‘PC사랑’이라고 메모를 남기고 싶은데 명령어 패턴이 기억나지 않을 경우 메모, PC사랑을 두 번으로 나눠 입력하면 오작동 없이 메모가
가능하다.
이런 음성 인색 앱 사용에 익숙해진다면 문자나 이메일과 같은 작업도 전화하듯이 말로써 전송이 가능하다. 평소에 대화할 때n목소리 크기로 입력하면 대부분제대로 인식되며 특정 용어와 같은 자주 사용하지 않는 단어만 인식률이 떨어지는 편이었다. 이 경우 잘못 입력된 단어를 클릭 후 수정할 수 있어 전화하듯이 문자를 입력 후 일부분만 수정 해 발송하는 식으로 응용이 가능하다.
또 이런 음성 인식 앱은 과거 심심이 앱처럼 농담을 주고받는 것도 가능하다. 특히 Q보이스나 시리에는 이런 농담 대화가 다수 탑재돼 있어 재밌는 농담을 찾는 재미도 쏠쏠하다.
자비스보단 못하지만 그래도...유용하다
영화 아이언맨을 보면 토니 스타크가 비서에게 명령하듯이 컴퓨터인 자비스에게 명령하는 모습을 자주 볼 수 있다. 음성 인식 앱을 이용하면 영화처럼은 불가능 하지만 어느 정도는 가능하다. 예를 들어 갤럭시 스마트폰의 경우 S보이스 호출 명령인‘하이갤럭시’라고 외치면 S보이스를 실행 시킬 수 있다. 물론 S보이스 내에서 호출 명령 옵션을 켜 놓은 상태에서만 가능하다. 또 잠금화면에서 호출을 설정해 놓으면 스마트폰을 만질 필요 없이 음성으로만 구동이 가능하다. 이런 호출 명령은 변경이 가능하며 부재중 전화 확인, 미확인메시지 확인, 일정 확인 등 특별한 작업을 호출 명령으로 설정할 수도 있다. 여담으로 기자는 S보이스호출 명령을‘하이 자비스’로 등록
해 놓았다.
음성 인식 기능은 전화에 대고 명령을 해야 되는 만큼 등산이나 운전과 같이 스마트폰을 사용하기 힘든 상황에서는 매우 유용하다. 음성으로 스마트폰의 잠금을 열고 문자를 전송하거나 전화를 걸 수 있기 때문이다. 운전 중에는 음성만으로 네비게이션 앱인 T맵의 실행도 가능하다. 자동차에 충전기와 지지대만 설치해 놓는다면 최근 출시되는 음성 인식 네비게이션처럼 사용할 수 있다. 여기에 최근 출시된 갤럭시 기어와 같은 스마트 와치를 사용하면 급박한 순간에서 스마트폰을 주머니에서 꺼낼 필요도 없다.
실제로 기자가 한 달간 이런 음성 인식 기능을 이용해 스마트폰을 사용해본 결과 주변이 시끄러운 곳에서도 인식률이 꽤 높은 편이었으며 아침에 울리는 알람의 종료도 음성 인식만으로 가능했다. 물론 운전 시 음성 인식 기능의 유용함은 말이 필요 없을 정도였다.
사진 촬영 시에도 유용하다. 별도의 셔터 버튼이 없는 스마트폰의 경우 사진 촬영을 위해서는 두 손으로 카메라를 지지한 상태에서 촬영 버튼을 터치해야 해 터치 하는 순간에 카메라의 흔들림이 발생하는 경우가 많았다. 손떨림 보정 기능이 탑재된 스마트폰이 적은 만큼 이런 조작법으로 인해 사진의 초점이 나가는 경우가 다수 발생됐다.
하지만, 음성 인식 기능을 활용하면 두 손으로 안전하게 스마트폰을 지지한 상태로 촬영할 수 있어 흔들림이 적을 뿐만 아니라 먼 곳에서 지지해 놓고 촬영 시 별도의 리모컨 없이 촬영이 가능하다. 또 셀프 촬영 시에도 화소가 낮은 전면 카메라를 사용하지 않고 후면 카메라로 촬영하면서 음성으로 셔터를 조작하면 돼 고화질의 사진 촬영이 가능하다.
또 이런 음성 촬영은 스마일과 촬영 등 이미 등록된 명령어로 구동하는 것이기에 목소리를 너무 작게 내지 않는 이상 거의 대부분 인식돼 인식률 걱정도 없다.
앱이랑 연동하면 활용도 UP
애플에서 시리를 처음 공개했을 때 스마트폰을 비서로써 활용할 수 있게 하겠다는 말을 한바 있다. 하지만 한국에서 제조된 프로그램이 아닌 만큼 한국어 인식률이 낮아 국내에서 인지도가 높은 편이 아니었다. 또 초기 버전은 활용할 수 있는 범위 자체가 적기도 했었다.
하지만, 시리를 비롯해 후발 주자인 S보이스와 Q보이스의 기술이 발전하면서 현재는 말하는 대화 내용을 그대로 텍스트로 인식할 정도의 높은 인식률을 보이고 있을 뿐만 아니라, 최근 출시되는 스마트폰에 탑재된 음성 인식 앱은“뉴스 읽어줘”라고 음성으로 명령하면 뉴스의 내용을 소리로 읽어주는 것 까지 가능하다.
네이버 앱에 내장 된 음성 검색 시스템을 활용하면 거리에서 흘러나오는 음악 소리를 스마트폰으로 인식해 그 노래의 제목을 찾는 것 까지 가능하다. 애플이 주장했던 스마트폰을 비서로 활용하는 것이 가능해진 셈이다.