인공지능(AI)의 핵심이론과 응용분야, 향후 전망
페이지 정보
본문
인공지능(AI), 매력적인 판도라의 상자 4차
산업혁명 이끌 핵심기술
공상과학영화 속의 인공지능은 감정을 갖고 경험을 통해 지식을 축적하는 인간형 로봇에서부터 두뇌를 복제하여 자의식을 갖는 모습으로 발전하고 있다. 모두 재미있는 허구라고 생각해 왔는데, 최근 빌 게이츠나 스티븐 호킹과 같은 사회 지도층 인사들이 이 인공지능을 우려하고 있다. 한걸음 더 나아가 미래학자 레이 커즈와일의 경우에는 2045년이면 기계의 지능이 인간의 지능을 뛰어넘는 특이점(singularity)에 도달한다고까지 경고하고 있다. 과연 현실속의 인공지능은 어느 정도 수준일까.
현재 최고의 인공지능이라고 하면 구글의 알파고를 떠올릴 것이다. 바둑을 인간 최고수보다 더 잘 두는 프로그램이니 확실히 대단한 인공지능인 것만은 틀림없다. 하지만 바둑에서 다음 수를 결정하는 몬테카를로 트리탐색(Monte Carlo Tree Search)을 사용하는 프로그램이란 점에서는 기존 바둑프로그램과 다를 바 없다. 알파고는 다음 수의 경우의 수를 줄이기 위하여 착수할 경우의 수를 줄이는 함수와 각 수의 승패를 계산하는 함수를 각각 정책망과 가치망이란 이름의 신경망(neural network)으로 설계했다. 그리고 나서 많은 양의 기보로부터 딥러닝(deep learning)을 통해 이의 최적값을 구하는 방법을 사용했다. 여기에 기존 기보이외에도 가상의 게임을 반복하면서 얻은 새로운 기보 데이터까지 활용하는 심층강화학습(deep reinforcement learning)이란 방법도 사용했지만, 결국 바둑게임의 과정을 프로그램화한 소프트웨어라고 할 수 있다.
이 이외에도 구글의 자율주행차나 애플의 비서 소프트웨어인 시리, 또 퀴즈대회에 나가서 인간챔피언을 이긴 IBM의 왓슨 등이 현 시점을 대표하는 인공지능 시스템이라고 할 수 있겠다. 이런 소프트웨어가 공포로 다가오는 이유는 뭘까. 이제까지 놀랄만한 결과를 내서 성공했던 인공지능은 모두 적절히 만들어진 소프트웨어와 이를 빠르게 실행시키는 컴퓨터였음을 이해한다면 무지가 가져온 불필요한 혼란이라 하겠다. 이 글에서는 인공지능을 만드는 핵심기술과 응용분야를 소개하고, 향후 미래의 전망을 통해 청소년들이 무엇을 준비해야 할지 생각해본다.
인공지능의 핵심이론…
설계기반 방법론과 학습기반 방법론
인공지능은 한마디로 정의하기 어렵다. 지능이란 것 자체가 모호하기 때문에 이를 인공적으로 재현한다는 것이 쉽지 않다. 일반적으로 지능은 외부를 인식하고 추론하며 적응하는 능력이라고 보는데, 인간조차 어떻게 그런 기능을 하는지 명확히 모르는 상태에서 전통적인 환원주의(reductionism)에 입각한 과학적 방법으로는 구현이 어렵기 때문이다. 따라서 기계가 지능을 갖고 있는지를 판별하기 위해서는 그 내부의 진위를 따져서가 아니라 결과로 나온 행위가 인간과 구분이 될 수 없을 정도인지를 검사하는 튜링테스트(Turing test)가 사용된다.
이제까지 인공지능을 구현하는 기술은 수없이 많이 시도되었지만 방법의 합리성 보다는 그 결과를 접하는 인간이 어떻게 판단하는가에 따라서 평가된다. 이렇게 만든 인공지능이 인간처럼 생각하고 감정을 가지며 심지어 자의식이 있는 것처럼 판단된다면 그때 사용된 기술은 강한 인공지능이라고 할 수 있고, 인간의 사고나 창의력까지는 아니지만 특정 문제를 인간처럼 해결한다면 그때 사용한 기술은 약한 인공지능이라고 할 수 있다. 문제는 그 둘에서 사용된 기술이 다르다고 볼 수 없다는 것이다. 사실 인간도 상대방이 지능이 있는지는 외부에서 보이는 행태로 판별하는 것이지, 그 사람이 실제 지능이 있는지는 모르는 것이 사실이다.
이와 같은 인간의 지적 기능을 구현하는 기술은 크게 설계기반 방법론과 학습기반 방법론으로 대별될 수 있다. 1956년 다트머스 회의에서 인공지능이란 용어가 만들어진 이후로 먼저 시도된 방법은 지능을 보유하는 사람이 갖는 해당 영역의 지식을 기호로 표현하여 저장하고, 이를 논리적인 추론에 따라 처리하는 방식으로 문제를 지능적으로 해결하고자 시도한 전자의 방법이었다. 지금도 전문가 시스템이나 논리/탐색기반 문제해결 방법과 같은 형식으로 널리 사용되고 있다.
반면에 학습기반 방법론은 최근에 기계학습(machine learning)이나 데이터마이닝(data mining)이란 이름으로 널리 사용되고 있는데, 해당 문제의 사례를 데이터로 제공하고 이로부터 귀납적으로 지식을 추출하여 문제를 해결하는 것이다. 데이터로부터 모형을 구축하는 것은 전통적인 통계학에서 오래 전부터 시도하던 방식이기 때문에 기계학습의 많은 방법들이 이에 기반한 것이 많은데, 통계적인 가정이나 제약을 극복하기 위하여 신경망과 같은 다소 융통성 있는 방법이 시도되고 있다. 이에 따라 이제까지 성공적인 인공지능 이론을 정리해보면 다음과 같이 크게 네 가지를 들 수 있다.
○ 탐색 : 문제를 해결 공간상에 표현하고 초기점에서부터 해답을 찾아가는 것이다. 이는 알파고의 인공지능을 구성하는 기본 구조이기도 한데, 무한에 가까운 방대한 공간에서 체계적인 방법으로 해답을 찾는다. 이를 위해서는 해결하고자 하는 문제를 정형화된 공간상에 표현하는 것과 불필요한 탐색을 최소화 하면서 적절한 시간내에 해답을 찾아내는 것이 필요하다. 이것은 단순히 게임에서만 유효한 것이 아니라, 복잡한 변수가 포함된 문제에서 의사결정을 하는 일반적인 문제에 적용될 수 있다. 예를 들면, 다양한 조건에서 환자의 상태와 의학적 지식의 공간상에서 최적의 치료방법을 찾는 것이나, 방대한 법률문서와 판례 상에서 최선의 판단을 내리는 등의 문제에 사용될 수 있다.
○ 규칙기반 시스템 : 문제를 해결하는데 필요한 지식과 규칙을 적절하게 표현하고 이들의 추론을 통해서 결과를 도출하는 것이다. 이는 전통적인 전문가 시스템을 구현하는 핵심적인 방법으로서, 복잡한 문제도 논리적인 추론과 계획으로 설명 가능한 결과를 만들어 낸다. 이를 위해서는 해당 분야의 도메인 지식을 효과적으로 추출하는 것이 필수적인데 일반적으로 매우 어려운 문제이다. 특히 특정 분야의 전문가를 모방하는 시스템은 상대적으로 쉽게 구현할 수 있는데 비해, 소위 상식이라고 알려진 보편적인 지식에 대해서는 처리가 어렵다는 인식이 있었는데, 최근에 이를 해결하는 기술이 실증적으로 시도되면서 심층 Q&A를 수행하는 IBM 왓슨이 완성되기도 하였다. 이 시스템은 제퍼디(Jeopardy!)라는 미국 퀴즈쇼에 나가서 인간 챔피언을 이긴 것으로 유명해졌고, 현재는 암진단과 같은 의료분야에서 활용되고 있다.
○ 신경망 : 기계학습은 문제의 사례로부터 주어진 입력에 대한 적절한 출력을 자동으로 결정할 수 있는 방법으로 인공지능 연구의 초기부터 다양한 기법이 시도되어 영상이나 음성과 같은 패턴인식의 문제에 널리 사용되고 있다. 그 중에서도 인간의 두뇌를 이루는 기본구조인 뉴런(neuron)을 모방한 신경단위를 대규모로 연결하여 문제를 해결하는 신경망은 모형의 형태를 가정할 필요가 없어서 쉽게 사용할 수 있는 장점이 있다. 사실 두뇌를 모방하여 자동 학습된다는 식으로 표현되는 경우가 많지만, 실제로는 입력값에 가중치를 매겨서 모두 더한 후 비선형 함수를 통해 출력하는 단순한 계산단위를 대규모로 연결한 것이기 때문에 일반인의 기대와는 사뭇 다르다. 즉, 이런 식으로 구성하고 주어진 데이터에 대한 입출력관계를 표현하는 가중치만 구한다면 문제를 해결하는 것이고, 이를 자동으로 하는 학습방법이 존재한다는 정도이다.
○ 딥러닝 : 최근에는 노드간의 연결을 상당히 여러 개의 층으로 표현하고 많은 양의 데이터로부터 관계를 학습할 수 있는 딥러닝이 좀더 실용적인 패턴인식의 문제를 해결해줄 것으로 기대하고 있다. 이번 알파고는 12개의 층을 사용했는데 최근 가장 진보한 딥러닝 방법은 150개가 넘는 층을 사용하기도 한다. 물론 신경망의 층이 많아지면 좀더 복잡한 입출력의 관계를 표현할 수는 있지만, 이의 선형적인 진보로 자의식까지 갖춘 인공지능이 실현되리라곤 기대하기 어렵다.
그럼 이 방법들을 적절히 선택하여 문제를 해결하면 될까. 실제로 최근의 성공적인 인공지능 시스템을 보면 이 중 어떤 한 기술을 사용했다기보다는 문제의 해결방안을 구조화하고, 여러 가지 기술을 복합적으로 활용하여 솔루션 아키텍쳐를 구성하는 식이 일반적이다. 앞서 소개한 알파고의 경우에도 전체 구조는 탐색기술을 따르지만 세부적으로 탐색의 가짓수를 줄이는데 신경망기술을 사용하였다. 또, IBM 왓슨의 경우에도 상식수준의 방대한 지식을 체계적으로 표현하는 규칙기반 시스템을 기반으로 정답의 가설을 만들고 이를 효과적으로 줄이는 과정에서 기계학습 방법을 사용하는 등 수백 가지의 인공지능 알고리즘을 복합적으로 사용하였다.
인공지능의 응용분야
인간의 지적능력을 모방하는 인공지능은 말 그대로 인간이 투입되는 분야라면 어디라도 적용될 수 있다. 인공지능의 핵심기술이나 지원기술이외에도 기업과 산업, HCI 등의 분야에서 활동하는 업체들은 수없이 많다. 먼저 인공지능의 응용으로 기반산업 분야를 알아본다. 이것은 인공지능이 핵심이 되어 그 자체만으로 산업의 플랫폼이 되는 분야로 인공비서, 지능로봇, 추천시스템을 살펴본다.
○ 인공비서 : 최근 음성으로 대화하며 사용자가 필요로 하는 작업을 도와주는 인공비서(virtual assistant)가 거대 IT기업의 비즈니스 플랫폼으로 대두되고 있다. 선두주자는 애플의 시리인데, 스마트폰 상에서 음성대화로 식당예약이나 영화추천과 같은 서비스를 제공한다. 사용자가 다소 식상하여 현재는 정체되어 있지만, 이를 뒤이어 등장한 다양한 인공비서의 효시라는 점에서 주목할 만하다. 뒤이어 구글의 나우, 마이크로소프트의 코타나, 페이스북의 M 등이 이와 유사하게 개인비서 기능을 제공하고 있다. 최근에는 아마존의 에코가 상품을 추천하거나 구매하는 부분까지 연동하여 크게 각광받고 있다. 이들 인공비서의 공통점은 완벽한 서비스로서의 제품이라기보다는 비즈니스를 일으키는 사용자 접점으로서의 플랫폼을 지향하여, 이를 통해 다양한 사용자 데이터를 수집함으로써 부가적인 서비스를 유도하고 또 자체의 성능을 향상시키고 있다는 것이다.
○ 지능로봇 : 로봇분야에 인공지능을 도입하고자 하는 시도는 상당히 오래전부터 시작되어 산업용 로봇이나 서비스 로봇에서 큰 효과를 보고 있다. 최근의 경향은 이를 정보통신 기술과 접목하여 유용성을 극대화하는 방향을 가고 있는데, 대표적인 예가 소프트뱅크의 페퍼라 할 수 있다. 로봇 자체의 조작기능이나 제어기능에 중점을 두기 보다는 사용자와의 상호작용에 집중하여 정보를 제공하거나 감성적인 교감이 가능하도록 유도하고 있다. 페퍼는 IBM 왓슨의 Q&A 기술을 장착하여 로봇의 모양을 한 심층 질의응답을 강점으로 하며, 현재 일부 현장에서 리셉션 기능이나 식당에서 주문을 받는 서비스 등에 활용되고 있다. 이 밖에도 MIT의 지보는 인간과 대화로 상호작용하며 사진을 찍어주거나 발생한 사실의 요약을 해주는 등의 기능을 목표로 개발되고 있다.
○ 추천시스템 : 사용자의 과거 구매이력이나 비슷한 성향의 다른 사용자의 구매이력을 분석하여 구매할 가능성이 높은 제품을 추천하는 시스템이 활발히 개발되고 있다. 구글의 유튜브는 비디오를, 아마존은 제품을, 넷플릭스는 영화를, 판도라는 음악을 추천하는 서비스를 운영 중이다. 기본적으로 각 사용자가 구매했던 제품이나 온라인 사이트에서 브라우징 했던 제품을 기록한 후, 이런 데이터를 협력적인 필터링 방식으로 분석하여 유사한 성향의 사용자에게 추천하는 방식을 사용한다. 좀 더 고차원적인 사용자의 의도파악이나 반복되는 동일제품 추천을 방지하는 방향으로 연구되고 있다.
다음에 고려할 인공지능의 응용으로 응용산업 분야를 알아본다. 이것은 인공지능의 전분야가 가능하지만, 그 중 가장 대표적인 의료, 법률, 금융 분야를 소개한다.
○ 의료 : 의료분야에는 방대한 분량의 환자 데이터와 새로운 치료사례를 소개하는 수많은 문서가 쏟아지고 있다. MD 앤더슨 센터에서는 IBM 왓슨을 도입하여 환자의 발암여부를 진단하는데 활용하고 있다. 또한, 트위터와 같은 SNS 서비스 업체에서는 가입자가 입력한 내용을 분석하여 감정 상태를 인식하는 기술을 개발하여 산후우울증 여부를 판정하는 서비스를 개발하기도 하였다. 이 밖에도 의료영상을 분석하여 질병의 여부나 예후를 판정하는데 기계학습이나 딥러닝을 사용한 기업이 우후죽순으로 늘어가고 있다.
○ 법률 : 법률분야는 기본적으로 인공지능이 활용되기 적합한 특성이 있다. 대부분의 법률자료가 문서화되어 보존되고 있고, 사건이 의뢰되면 맨 처음 하는 것이 기조 법률자료를 조사하여 판례를 분석하는 것이기 때문이다. 최근에 ROSS 인텔리전스에서 이러한 법률문서 자동분석 기법을 도입하여 실제 활용한 사례가 보고되기도 하였고, 블랙스톤 디스커버리(Blackstone Discovery)에서도 이와 유사한 시스템이 개발되었다. 국내에서도 심층 Q&A 시스템의 응용분야로 법률 자문시스템을 개발하려는 시도가 있다.
○ 금융 : 최근 금융권에서는 로보어드바이저란 이름으로 투자를 인공지능 기법으로 수행하는 시스템이 인간 투자자보다 높은 수익률을 올리고 있다고 하여 주목받고 있다. 대표적인 예로 싱가폴 개발은행에서는 인공지능 기술을 도입하여 우수고객의 투자선호도를 파악하여, 맞춤형 투자자문을 한다든지 자산을 관리하는 서비스를 활발히 펼치고 있다. 방대한 데이터가 가용한 분야에서는 인간의 직관을 넘어서는 인공지능이 우수한 성능을 낼 가능성이 있다. 최근에는 P2P 서비스를 장착한 핀테크 분야에서 방대한 온라인 데이터를 분석하여 개인신용 평가나 포트폴리오 추천에도 인공지능 기술이 폭넓게 활용되고 있다.
인공지능의 전망
앞서 소개한대로 인공비서는 인공지능의 응용으로 크게 부상하고 있다. 애플과 구글, 마이크로소프트는 물론이고 온라인 쇼핑으로 유명한 아마존 등이 모두 인공비서를 개발해 상용화에 나서고 있다. 최근에는 국내에서도 SK의 누구나 KT의 기가지니 등까지 이 시장에 나서고 있다. 인공비서는 말 그대로 개인의 비서 역할을 하는 인공지능 시스템을 의미한다. 시장에서 가장 유명한 아마존의 알렉사는 음성인식형 사용자환경을 통해 TV와 스피커 등 다양한 기기에서 서비스를 이용할 수 있는데, 특히 아마존을 통해 쇼핑 업무와 연계하여 많은 사용자를 끌어 모으고 있다, 구글 어시스턴트는 아마존 알렉사와 경쟁하기 위해 구글이 개발한 인공비서이고, 구글 나우는 사용자의 데이터와 행동 패턴을 분석해 사용자가 원하는 날씨, 뉴스, 유머, 교통편, 경기 일정 등을 사전에 제공하는 예측형 사용자 환경을 제공한다. 이를 통해 업무를 신속하게 처리하고 삶의 질을 향상시키는 각종 편의 서비스를 제공하는 것인데, 이런 제품이 정말 필요한 것일까?
아직 완벽하지 않은 음성인식 방식으로 메뉴선택 방식의 인터페이스를 대체하는 수준에 그치고 있는데, 굳이 거대 IT기업들이 경쟁적으로 인공비서를 개발하는 이유는 무엇일까? 보통 기업들은 소비자가 필요한 제품을 최적화하여 가급적 완벽한 제품을 시장에 내고자 한다. 그런데 애플의 아이폰은 스티브 잡스가 말했듯이 고객이 정말로 필요로 하는 새로운 제품을 만든 것이다. 인공비서도 고객이 현재 필요한 것이라기보다는 고객이 정말로 원하도록 하는 제품을 개발하는 것이라고 생각한다. 아직 미완성인 제품이라도 선제적으로 출시하여 고객을 끌어 모으고 수집된 데이터로 음성인식과 같은 제품 자체의 성능을 향상시키는 것과 함께, 수집된 데이터의 분석을 통해 사용자의 성향이나 선호를 파악하여 다른 상품이나 서비스 추천과 같은 새로운 비즈니스를 창출한다. 또한, 단순히 제품의 판매에 그치지 않고 개발 API를 공개하고 개발자들도 함께 끌어 모아 일종의 생태계를 형성함으로써 훨씬 큰 시장을 만들어 새로운 가치를 창출하는 방식으로 발전하고 있다.
인공지능과는 직접적으로 관련되지는 않지만 우버의 사례를 통해서 최근 불고 있는 공유경제의 활용에 대한 시사점을 얻을 수 있다. 우버는 자동차를 필요로 하는 사람과 자동차를 가지고 있는 사람을 중계하는 비즈니스를 한다. 보통 이런 비즈니스를 하려면 온라인 지도가 필요한데 구글맵을 사용했고, 교통비의 결재를 위해서는 애플페이를 사용하는 식으로 이미 공개된 온라인 플랫폼들을 연계하여 자신만의 서비스를 제공하는 비즈니스이다. 일견 현대판 봉이 김선달처럼 보이는 사업을 하는 우버가 자동차 제조분야에서 선전하고 있는 현대자동차 보다 시가총액을 크게 앞서있는 상황은 어떻게 설명할 수 있을까? 일견 불합리해 보이지만 어쩌면 앞으로 펼쳐질 공유경제에서는 공개된 온라인 플랫폼들을 적극적으로 활용하여 고객에게 큰 편의를 제공하는 새로운 비즈니스 모델의 경쟁이 핵심이 될 수 있다.
확실히 세상의 변화는 엄청나게 빨라지고 있고 이에 적응하지 못하면 도태되고 마는 것이 역행할 수 없는 시대의 흐름인 듯하다. 최근 인공지능의 발전 속도도 매우 빠르기는 하지만, 한편으로는 모든 내용을 공개하는 오프소스의 선두에 있기도 하다. 딥러닝을 위시한 다양한 인공지능 기술들이 아이디어는 물론 심지어 컴퓨터 코드까지도 인터넷을 통해 공개되고 있다. 오랜 기간 기술을 축적하는 조직만이 할 수 있던 일이 오픈소스를 통해 기술 민주화로 실현되고 있는 것이다. 오픈소스를 통해 최신 기술을 습득하고 소수라도 참신한 아이디어로 혁신적인 기술을 만들어낼 수 있는 인공지능에 도전해보기 바란다.
조성배. 연세대에서 전산과학을 공부하고 카이스트에서 전산학(인공지능)으로 박사학위를 받았다. 인공지능과 패턴인식 분야에서 발표한 1,000편이 넘는 학술 논문이 국제적으로 9,500회 이상 인용되어 공인을 받았다. 현재는 연세대 컴퓨터과학과에서 학생들을 가르치고 있고, 한국BI데이터마이닝학회 회장, 한국정보과학회 부회장을 역임하고 있다. 최근 청소년들을 위한 인공지능 책 '왜 인공지능이 문제일까'를 출간했다.