abulaphiaa

Keep Yourself Social

[2] 데이타 축소필터에서 로보틱스와 인간의 두뇌가 결합된 가상 인격체의 탄생까지

with one comment

이번 포스트에서는 앞선 글에서 코슬라가 첫번째 카테고리로 정의한 “Data Reduction” 카테고리에 대해 살펴 보도록 하겠습니다.

1. Data Reduction or Filters (Siri, Donna, Recorded Future, and many others)

유저의 특정 컨텍스트, 우선순위, 소셜 네트워크, 관심사에 적합하게 데이타 스트림을 축소하고, 필터링하고, 프로세싱해서 이 유저와 관련성이 높은 정보나 액션을 전달할 수 있는 것. 지금 우리에게 들이 닥치는 엄청난 양의 정보를 축소시켜 주는 툴 – 웹상에 존재하는 프락시나 에이전트 – 이 필요한 시기이다. Siri가 처음으로 시작한 이 대리인(Proxy)은 현재 우리의 컨텍스트와 선호도를 파악하고 있는 Virtual Assistant로서 뉴스와 아티클의 피드, TV Show와 YouTube, 반드시 보아야만 하는 이메일 등의 우선선위를 정해줄 것이다. 광고주들은 우리의 프락시에 직접 접근할 수 있게 되고, 프락시는 우리의 관심사가 무엇인지 스스로 결정해서 스팸으로부터 원하는 광고(wanted advertising)만을 자동으로 걸러 줄 것이다. 이를 위해서는 인공지능 (Artificial Intelligence)과 진보한 머신 러닝(Machine Learning), 그리고 Big Data Analytics가 필수적이다.

코슬라가 정의한 “Data Reduction” 카테고리는 정보 홍수의 시대에 유저에게 의미있는 정보만을 선택적으로 필터링해서 전달해 준다는 의미에서 이른바 인터넷 초창기부터 많은 사람들이 개념화하고 구현하고자 했던 “개인화(개인맞춤형)” 서비스 또는 요즘 유행하는 “큐레이션(Curation)”과도 개념적으로 유사합니다. 다만 코슬라는 빅데이타, 인공지능, 머신러닝과 같은 최신 테크놀로지와 “음성인식” 기술이 결합됨에 따라 유저의 모든 것을 웹상에서 대리해 주는 “가상의 인격체” – 소프트웨어적으로 존재하는 유저의 온라인 페르소나 ? – 가 탄생하여, 굳이 검색하지 않더라도 유저의 컨텍스트에 적합한 정보를 스마트하게 전달해 줄 것이라는 점을 더욱 강조하고 있습니다.

1. 데이타 필터링 툴로서의 큐레이션

Data Reduction 카테고리에서 코슬라는 아직 걸음마 단계에 불과한 SIRI를 대표적인 사례로 꼽고 있으나, 현재 단계에서 웹에 공개되어 있는 다양한 소스로부터 방대한 컨텐츠를 수집한 후 유저가 관심을 가질만한 뉴스나 블로그 등의 컨텐츠를 자체 알고리즘을 통해 필터링해서 Feed List를 생성해 주는 Flipboard나 Zite, ShowYou, Circa, Google TV의 Redux 등이 더 적절한 사례인 것 같습니다. 특히 얼마전 업그레이드된 플립보드는 유저들이 “+” 버튼 하나로 직접 여러 개의 퍼스날 매거진을 생성한 후 다른 사람들과 공유할 수 있도록 함으로써 기존 기계적 큐레이션의 한계를 집단적 휴먼 알고리즘으로 보완할 수 있게 되었습니다. 이리하여 플립보드는 단순히 컨텐츠 큐레이션 App.이라기 보다는 “컨텐츠의 수집과 필터링, 검색엔진, 소셜과 개인화 시스템“을 기반으로 오프라인 잡지의 Reading Experience를 스마트폰과 태블릿 단말에서 에뮬레이션해서 제공하는 새로운 형태의 소셜 브라우저“로 업그레이드된 것 같습니다.

이런 범주의 App.들이 매우 혁신적이긴 하지만 이것이 진실로 정보과부하와 파편화 문제를 해결해 주는 것이냐 ? 아니면 페이스북, 트위터, 포탈 뉴스 등으로 이미 충분히 머리가 복잡해진 상황에서 유저가 소화할 수 없는 양의 새로운 “Contents Feed”를 추가로 제공함으로써 지금 당장 읽지 않으면 시대에 뒤떨어질 것 같은 강박관념을 오히려 가중시키는 것은 아닌가라는 의문이 제기됩니다. 즉 문제의 해결이 아니라 악화가 아닌가 ?

2. 인공지능과 음성인식 기술이 결합되어 가상비서가 탄생

이런 상황에서 디지털 시대 정보과부하 문제의 해결책으로서 큐레이션의 개념을 유저 자신보다 유저를 더 잘 아는 대리자(Proxy)가 웹상에서 상주하면서 그의 컨텍스트와 선호에 적합한 컨텐츠를 알아서 제공해 준다는 의미에서 이른 바 “가상비서”의 개념으로 확장시키는 것은 논리적으로 자연스러운 것처럼 보입니다. 음성인식과 검색 등 관련 분야의 많은 전문가들에 따르면 Big Data Analytics, Machine Learning, Artificial Intelligence, Natural Language Understanding과 같은 테크놀로지들이 결합되어 향후 몇년 후에는 헐리우드의 SF 영화와 같이 실제로 사람과 컴퓨터간 자연스러운 대화가 가능하게 될 것이라는 전망이 최근 들어 많이 나오고 있습니다. 예를 들어,

  • 검색엔진 Guru인 구글의 Singhal은 2013년 SXSW에서 구글의 4가지 과제로 그라프 검색, 음성인식, 자연어 이해, 대화 이해를 꼽으면서 “우리의 꿈은 검색을 – 사람과 자연스럽게 소통이 가능한 – 스타트렉의 컴퓨터로 발전시키는 것이다 (Our dream is for search to become the Star Trek computer).”고 말한 바 있습니다 (Google’s 4 Biggest Technical Challenges, Accroding To Search Guru Amit Singhal, Forbes, 2013년 3월 10일)
  • 세계 1위의 음성엔진 회사인 Nuance의 CTO인 Vlad Sejnoha는 “우리는 급진적으로 개선되고 있는 자연어 이해와 인공지능이 역시 급진적으로 발전하고 있는 단말의 파워, 유비퀴터스한 초고속 네트워크, 클라우드 기반의 컨텐트와 서비스 및 어플리케이션과 결합됨으로써 발생하는 엄청난 파괴력(combined power)을 이제 어디에서든지 볼 수 있게 되었다.”면서, GUI와 터치 인터페이스에 이어 음성인식이 “Virtual Personal Assistant“로 발전하면서 컴퓨팅의 제3의 혁명을 일으킬 것이며 2013년이 이러한 “Intelligent System”의 원년이 될 것이라고 전망하고 있습니다 (Beyond Voice Recognition : It’s The Age of Intellignet Systems, Forbes, 2013년 1월 11일).

현재로서는 SIRI보다는 GoogleNow가 이러한 개념에 가장 근접한 서비스라고 할 수 있을 것 같습니다. 지금까지 검색은 유저가 키워드나 문장을 검색창에 입력하면 관련성이 가장 높다고 판단되는 웹페이지의 리스트를 결과값으로 출력해 주었으나, GoogleNow는 유저 단말의 위치정보와 검색이력 또는 선호도에 기초하여 관련성이 높은 정보(Contextual Search)를 유저가 명시적으로 검색쿼리를 던지기도 전에 푸쉬해 줄 뿐만 아니라 모바일에서 쉽게 정보를 한눈에 알아볼 수 있도록 웹페이지를 지식으로 조직화(knowledgization)해서 전달해 주고 있습니다 (Forget Searching For Content – Content Is About To Start Searching For You, ReadWriteWeb, 2013년 4월 25일).

반면 시리의 경우 코슬라가 언급한 가상비서처럼 현재로선 그렇게 똑똑한 프로덕트는 아닌 것 같습니다. PandoDaily에 따르면, 애초 미국방부 프로젝트로 추진되어 왔던 시리를 Verizon이 안드로이드에 프리인스톨(Preinstall)하여 출시하려 했으나, 이것이 효과적으로 동작하는 것을 확인하고 애플이 막판에 가로챈 결과, 원래 42개 서비스와 연동되어 똑똑하고 관련성이 높은 답변을 제공했던 시리가 멍청한 프로덕트가 되었다고 합니다 (Killing the SIRI-Verizon Deal Helped Android not iOS, PandoDaily, 2013년 1월 23일). 애플이 시리를 출시할 때 “당신 대신 전화를 걸어주고, 문자를 보내주고, 무엇인가를 상기시켜 주는 똑똑한 비서 (Intelligent Assistant)“라는 컨셉의 광고와 달리, 지금까지 직접 테스트해 본 결과 적어도 한글은 사람이 말하는 컨텍스트와 의도를 이해하고 아웃풋을 출력해 주는 수준이 LG Optimus Q-Voice보다 훨씬 후지다는 생각이 들었습니다.

어쨌든 이런 이야기를 들으면 왠지 우리나라에서 아직까지는 비현실적인 먼나라의 SF적인 이야기처럼 들립니다. 스마트, 개인화, 자연어 이해, 인공지능, 클라우드, 빅데이타와 같은 용어들이 난무하고 있지만 우리가 일상적으로 사용하는 다수의 어플리케이션들에는 이러한 기술들이 실제로 적용된 케이스가 별로 없을 뿐만 아니라 유저들도 자주 사용하고 있지 않기 때문입니다. 예를 들어, 최근 국산 단말 제조사들이 SIRI를 견제할 목적으로 최신 스마트폰에 S-Voice나 Q-Voice와 같은 지능형 음성인식 엔진을 탑재하고 있으나, 음성인식 자체의 정확도나 컨텍스트에 대한 이해가 확연히 떨어지기 때문에 주변에서 이것을 자주 사용하는 유저들이 그리 많지는 않은 것 같습니다.

시리의 사례에서 보듯이 음성인식의 정확도를 높이고 관련성이 높은 정보를 출력해 주려면 주변의 소음으로부터 유저의 목소리만을 잡아내는 노이즈 필터링 테크놀로지나 통계적 모델을 정교화하는 등 음성인식 기술 자체도 중요하지만, 클라우드에 얼마나 많은 음성 데이타 샘플을 확보하고 있느냐, 그리고 3rd Party App. 또는 컨텐츠들이 얼마나 효과적으로 연결되어 있느냐가 중요합니다. 그러나 우리나라에서는 이와 관련하여 아직까지 대중적인 App.들이 많지 않기 때문에 첫번째 과제인 한글에 관한 음성 샘플 데이타 자체가 매우 빈약한 상태라고 할 수 있습니다. 구글은 안드로이드폰에 탑재한 구글 보이스를 통해 한글 데이타 샘플을 더 많이 확보함에 따라 우리나라보다 구글이 한글을 더 잘 이해한다는 말이 나오고 있습니다. Q-Voice 또한 문장을 처리하고 의미를 추출하기 위해 LG가 자체 개발한 Wernicke 엔진에 구글의 음성인식 소프트웨어를 결합해서 사용하고 있습니다 (LG renames Quick Voice tool “Q-Voice” With English Version Set For Early 2013, The Verge, 2012년 6월 23일).

그러나 이것은 비단 한글에만 국한된 문제가 아니며 프랑스어, 독일어, 이탈리어 등 유럽의 많은 언어들도 마찬가지입니다. META-NET이라는 유럽의 비영리 연구단체가 스펠 체크, 시리, 구글 번역, 내비게이션 시스템 등을 조사한 결과, 영어를 제외한 대부분의 유럽어들의 경우 샘플 데이타의 규모가 너무 적기 때문에 인식을 위한 통계적 모델이 제대로 작동되지 않는다고 합니다. 그리고 여러가지 언어에 관한 풍부한 리소스를 확보하고 필요한 테크놀로지를 적시에 공급하지 않으면 이러한 언어들의 디지털 멸종(digital extinction)을 막을 수 없을 것이라고 경고하고 있습니다 (Most European Languages Are Unlikely To Survive Online, Mashable, 2012년 9월 27일).

3. 안드로이드의 탄생 : 비생물학적 인간두뇌를 컴퓨터에 업로드하다

가상 비서의 개념이 나왔으니 이 글의 문맥에서 약간 옆길로 새서 러시아의 젊은 갑부 “Dmitry Itskov”의 “2045 Initiative”라는 프로젝트 이야기를 좀 더 하겠습니다(This Man Is Not Cyborg Yet, NYT 013년 6월 1일). 이츠코프는 대학시절 플레하노프 러시아 경제 아카데미에서 “러시아 인터넷의 대부”라고 불리우는 Konstantin Rykov를 만나서 1999년 “Goodoo Media” (향후 New Media Stars로 회사명을 변경)를 창립하고, 러시아 인터넷에 관한 블로그 tarakan.ru, 스포츠와 정치, 연예에 관한 타블로이드 뉴스매체 dni.ru, 온라인 게임사이트들과 인터넷 TV 채널 등을 런칭함으로써 막대한 광고수익을 창출하는 인터넷 기반의 거대 미디어 제국을 만들었습니다.

이츠코프가 추진중인 “2045 Initiaive” 프로젝트 우리가 어릴때 보았던 만화영화 “마루치 아라치”에 나오는 파란해골 13호처럼 인간의 물리적 신체를 제거하고 컴퓨터 시스템 내부에서 존재하는영원 불사의 안드로이드를 만드는 것을 목표로 하고 있습니다. 처음 들으면 황당무계하게 들리지만, 계획대로 추진된다면 인간에 대한 근원적인 질문을 제기할 수 밖에 없는 프로젝트라고 할 수 있습니다.

이츠코프는 이 프로젝트를 장기간에 거쳐 단계적으로 추진할 계획입니다. 향후 7년간 진행되는 1단계, 아바타 A는 영화 Surrogate에서 Bruce Willis가 자신을 최적화시켜 복제한 안드로이드 – 감각기관이 존재하는 인공지능 (Artificial Intelligence With Sensation) – 의 개념을 구현하는 것인데, 유저는 이것을 원격지에서 마치 자신의 신체인 것처럼 조정할 수 있습니다.

다음은 인간의 뇌를 안드로이드에 이식하는 아바타 B단계(2020년 ~ 2025년)로서 신경외과 의사가 – 사망하기 직전에 – 사람의 뇌와 척수를 분리시켜 생명연장 장치와 연결시킨 후 아바타 A에서 업그레이드된 안드로이드에 이식하는 단계이고, 3단계(2030년 ~ 2035년)는 인간의 뇌를 비생물학적 형태로 만들어 컴퓨터에 업로드하는 단계입니다.

마지막으로 2045년에 완성되는 아바타 D 단계는 인간의 물리적 신체를 홀로그램 바디로 완전히 대체할 것이라고 합니다. 이 단계에서 인간은 컴퓨터 속에서만 존재하고, 인간의 물리적 형태는 스타워즈 Leia 공주처럼 자신을 홀로그램으로 드러내게 됩니다 (Physical Manifestation of A Self As A Hologram).

이츠코프는 지금 단계에서 스스로 안드로이드의 모델로서 마루타가 되어 역사상 사람의 얼굴과 가장 동일한(lifelike) 형태의 로보틱 헤드(robotic head)를 만드는데 주력하고 있습니다. 이 프로젝트를 진행중인 Hanson Robotics의 창업자 David Hanson에 따르면, 보통의 로보틱 헤드는 20개의 모터로 구동되지만, 이것은 36개의 모터를 사용하기 때문에 얼굴의 주요 근육의 움직임을 대부분 시뮬레이션해서 보다 많은 표정을 만들어 낼 수 있을 것이라고 합니다.

Avartar

David Hansom이 제작중인 아바타 : 잇프코프 자신의 기계적 얼굴의 모델

글을 마치면서

지금까지 약간 옆길로 센 것 같긴 하지만, 1) 현재 단계에서 빅데이타와 인공지능 기술이 결합되어 탄생한 응용서비스인 Data Reduction 또는 Curation App.들을 우리가 모바일 단말에서 일상적으로 사용하고 있으며, 2) Google Now처럼 이것이 음성인식 기술과 결합되어 유저의 컨텍스트에 적합한 정보를 대화형으로 또는 알아서 제공해 주는 가상비서 개념을 구현한 어플리케이션들이 등장하고 있고, 3) 여기서 한발 더 나아가 인공지능에 로보틱스와 뇌과학 등 여러가지 테크놀로지가 연결되어 홀로그램 형태로 사람이 컴퓨터 속에 존재하는 SF적인 미래의 프로젝트가 진행되고 있음을 살펴 보았습니다 (특히 3번째 프로젝트는 테크놀로지 발전에 의한 혁신이 궁극적으로는 컴퓨터 속에 존재하는 파란해골13호로 귀결될지도 모른다는 강한 공포를 느끼면서, 우리 자녀들이 살아가는 세계에서 현실로 구현될 가능성도 있기 때문에 21세기 버전의 러타이트 운동이라도 전개하고 싶은 심정입니다).

그러나 미래는 그때에 가서 생각하고 현재 단계에서 우리는 무엇을 해야할까요 ? 우리나라에서는 웹에 넘쳐 나는 노이즈를 제거하고 유저에게 원하는 정보만을 선별적으로 전달해 주는 첫번째 단계의 상용서비스도 아직까지는 존재하지 않습니다. 올해 안에 단순히 해외 성공한 서비스를 카피하는 수준을 넘어서 우리나라 상황에 적합한 개념적 모델을 제대로 구현한 큐레이션 앱이 탄생하기를 기대해 봅니다.

또한 향후 스마트폰뿐만 아니라 통신, 자동차, 홈네트워크, 콜센터, 스마트 TV 등 다양한 분야에서 유저 인터페이스의 혁신을 위해 구글이나 뉘앙스와 같은 글로벌 음성인식 솔루션을 값비싼 로얄티를 지불하면서 계속 사용할 것인지 또는 자체적으로 막대한 투자비를 감수하고라도 한글의 디지털 멸종을 막을 뿐만 아니라 국내 IT 산업의 경쟁력을 높이기 위해 전세계에서 가장 과학적인 언어라고 하는 “한글”의 소프트웨어화를 국가적인 차원에서 추진할 것인지를 결정해야 할 때라고 봅니다. 하나의 개별 기업이나 연구소에서 추진하기에는 너무 덩치가 크고 여러가지 분야의 지식이 상호 연결되어야 가능하기 때문에 당장 ROI가 안 나오더라도 “창조경제”를 위해서 국가적인 차원에서 이런 정도는 해야하지 않을까요 ?

Written by abulaphia

June 17, 2013 at 11:29 pm

One Response

Subscribe to comments with RSS.

  1. […] 수도 있고, 사용자의 맥락과 의사를 자동으로 파악하여 상대에게 알리는 대리자 역할을 수행하는 지능형 에이전트일 수도 있을 것입니다. 아이폰의 시리의 미래가 비슷할 지 모릅니다. […]


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: