조성준 서울대학교 산업공학과 교수
페이지 정보
본문
인공지능(AI), 기능이 아닌 목표
이제 빅데이터로
세상을 읽어라
서울대학교 산업공학과 조성준 교수는‘대한민국 최고의 데이터마이닝 전문가’로 꼽힌다. 서울대학교 산업공학과를 졸업하고 동 대학원에서 석사 학위를 받은 후 미국으로 건너가 워싱턴대학교에서 인공지능 연구로 석사 학위를 받았으며, 메릴랜드 대학교에서 신경망과 기계학습을 연구해 박사 학위를 받았다. 4차 산업혁명이 가속화되는 지금, 요즘 사회에서 가장 주목하는 키워드는 ‘빅데이터’다. 서울대학교 데이터마이닝센터 센터장, 국무총리 산하 공공데이터전략위원회 공동위원장을 맡고 있으며, 정부 3.0추진위원회 빅데이터 전문위원장 및 한국데이터마이닝학회 회장 등을 역임한 조성준 교수를 만나 인공지능 시대의 새로운 언어인 빅데이터에 관한 이야기를 들었다.
조성준 교수는 인공지능, 뉴럴네트워크 을 시작으로, 머신러닝, 데이터마이닝 을 연구했으며, 최근에는 딥러닝, 텍스 트마이닝을 연구 중이다. 이러한 방법 론을 바탕으로 제조, 금융, 마케팅, 인사 분야에서 대량 생산되는 IoT 센서 데이터, 텍스트 데이터, 거래 데이터 등 으로부터 인사이트를 도출하고 있다.
조성준 교수는 자신을 과학자가 아닌‘공학자’라고 강조했다. 바람은 왜 부는지, 해는 왜 동쪽에서 뜨는지 등 이미 존재하는 현상을 이해하는 것은 과학의 영역이다. 고급스럽게 말하 자면 원리를 발견하고 찾는 것. 반면, 공학은 실질적으로 우리 삶을 편리하게 만들어준다. 일례로 태양이 동쪽에서 뜨는 이유를 안다고 해서 한여름에 시원하게 지낼 수 있는 것은 아니다. 하지만 공학자들이 개발한 에어컨은 실제로 무더위를 피할 수 있게 했다.
조성준 교수는 “공학이 없던 몇백 년 전으로 돌아가면 현대인은 하루도 버티지 못한다”고 이야기한다. 21세기를 살아가는 우리들에게 공학이 전해준 생활의 편리는 너무나도 당연하게 느껴진다. 그러나 알고 보면 우리 삶의 상당 부분이 공학의 혜택을 입고 있다. 최근 인류의 산업지도를 바꾸고 있는 빅데이터도 마찬가지다.
산업공학도, 인공지능의 매력에 빠지다
현재 국내 여러 공대에 개설된 공학 전공은 10여 개 이상이다. 대다수 전공은 이름만 들어도 어떤 연구를 하는지 가늠할 수 있다. 건축공학은 집, 항공공학은 비행기, 전자공학은 전자 제품 등 공학적인 지식이 전혀 없는 사람도 해당 전공의 이미지를 쉽게 떠올린다. 반면, 조성준 교수가 전공한 산업공학이나 컴퓨터공학은 일반인이 쉽게 이해하기 어려운 면이 있다.
“산업공학은 쉽게 말하면 기업에서 산업에 투자할 때 고려해야 하는 사항을 수리적으로 의사 결정 할 수 있게 돕는 분야입니다.”
산업의 영역까지 가지 않더라도 사람들은 생활하며 다양한 의사결정을 내린다. 예를 들어, 친구들과 생일파티를 한다고 해도 몇 명의 사람들이 모여 얼마나 되는 음식을 장만할지 예측 하고 고민한다. 만약 한두 명이라도 불참하거나, 초대하지 않았던 친구들이 갑자기 등장하면 음식이 남거나 모자랄 수 있다. 이런 일상 영역에서의 의사 결정은 큰 손해로 이어지지는 않는다. 하지만 기업에서 공장을 짓는다면 이야기가 달라진다. 생일파티처럼 몇만원 단위가 아닌 조 단위까지 투자 규모가 올라가기 때문이다. 그래서 사전에 철저하게 불확실성을 예측하고, 언제 어디에 어떻게 공장을 지을지 계획을 세우고 운용한다.
이러한 불확실성을 해소하기 위해 사용하는 도구는 확률이다. 조성준 교수가 학생이었던 시절에는 수백가지 시나리오를 구상해 각각의 상황에 문제가 일어날 수 있는 확률을 ‘수학적으로’ 풀었다. 그런 과정이 조성준 교수에게는 남다른 재미이기도 했다. 하지만 한국경제 개발 초기 단계에는 이러한 전략이 무의미했다. 한국경제가 급속도로 성장하는 가운데, 누구든 더 빨리, 더 많이 공장을 짓기만 하면 됐다. 산업공학의 존재 의의인 ‘최적화’가 무색했던 시절이었다.
“공부는 즐거웠지만 사회에서 사용하지 않으니 고민이 많았습니다. 그런데 제가 배운 지식을 컴퓨터에 적용하면 좋겠다는 생각이 들었어요.”
컴퓨터 세상에서는 예측 불확실성이 크게 줄어든다. 컴퓨터와 관련한 다양한 지식 을 접하면서 인공지능의 매력에 빠졌다는 조성준 교수. 그렇게 박사과정에서 인공지능을 연구하기 시작했다.
빅데이터가 산업적 의사결정에 미치는 영향
요즘 인공지능과 관련해 가장 빈번하게 등장하는 키워드는 ‘머신러닝’이다. 머신 러닝은 컴퓨터가 데이터로부터 지식을 습득하는 것. 최근 화두가 되는 자율 주행 자동차 역시 머신러닝과 연관이 있다. 비유하자면 백지 상태의 컴퓨터를 운전석에 앉혀 놓고 운전자의 동작과 습관, 상황 등을 옆에서 보게 하는 것이다.
인공지능을 만드는 두 가지 방법이 있다. 지식 기반 방식은 전문가들이 모여서 자신의 전문지식을 명제 형태로 정리하여 코딩 하는 방법이다. 연역적 추론을 한다. 데이터 기반 방식은 데이터로부터 지능을 학습하는 방법이다. 귀납적 추론이다. 빅데이터가 나타나면서 데이터 방식의 인공지능이 대세를 이루고 있다. 조성준교수는“귀납적추론의 질을 좌우하는 것은 결국 데이터의 양”이라 고 말한다. 빅데이터가 중요한 이유다.
“데이터의 양이 절대적으로 부족했던 과 거에는 머신러닝이 그다지 쓸모가 없었습 니다. 하지만 데이터가 말 그대로 빅데이터 가 되면서 머신러닝이 활성화되기 시작했습니다.”
빅데이터를 활용한 예측은 다양한 영역 에서 활용되고 있다. 일례로 영화 개봉을 앞두고 길일을 받던 시절은 지났다. 이제는 빅 데이터에 근거해 관객들이 극장에 가장 잘 모이는 시기를 파악한다. 이처럼 빅데이터는 데이터 사이언티스트의 분석을 통해 인사이트로 바뀌고, 의사결정자의 액션을 거쳐 가치를 창출한다. 세계적인 온라인 상거래기업 아마존 역시 고객의 빅데이터를 바탕으로 누가 어떤 제품을 구매할지 이해하고 매출의 40%를 추천을 통해 얻고 있다. GE 역시 항공 엔진 운항 데이터에서 각 부품의 고장 가능 확률을 계산해 엔진뿐만 아니라 서비스도 판매한다.
데이터를 읽을 줄 알아야 한다
데이터에 숨은 뜻을 알면 사회적 현상도 좀더 객관적으로 보게된다. 코로나19와 관련한 데이터만 해도 국가마다 발표 기준이 달라 실제와 괴리가 발생하는데, 데이터를 이해하면 겉으로 보이는 숫자 이면의 의미를 제대로 이해할 수 있다.
전 세계적으로 빅데이터에 대한 관심은 올라가지만, 산업적으로 이를 뒷받침할 인재는 부족하다. 여전히 대학은 공급자 위주 마인드로 교육이 이루어지고 있다. 현재 국내에서 데이터 전공과목이 개설된 곳은 산업공학과, 컴퓨터공학과, 통계학과 등이다. 그러나 이를 제외한 다른 학과에서는 데이터 수업을 접할 기회가 거의 없다. 이미 데이터 사이언티스트의 사회적 수요는 매우 높다. 앞으로는 데이터 사이언티스트뿐만 아니라 일반인들도 데이터를 보는 눈을 키워야 한다.
“예전에는 글을 읽지 못하는 문맹이 있었죠. 얼마 전만해도 컴퓨터를못하는 컴맹이라는 단어가 있었고요. 지금은 전공을 불문하고 문맹도 컴맹도 없습니다. 하지만 미래에는 데이터나 숫자를 이해하지 못하는데 맹혹은 수맹이 나올 수 있어요.”
조성준 교수는“ 공학을 전공하지 않아도, 문과라도 데이터사이언스를 배워야 하고 배울 수 있다. 코딩 못해도 할 수 있다” 고 말한다. 전공이 무엇이든 데이터라는 도구를 이용하여 새로운 방식으로 문제 해결이 가능해지는 까닭이다. 물론 빅데이터나 인공지능이 만능은 아니다. 코로나19처럼 컴퓨터가 예측할 수 없는 일들은 끊임없이 발생한다. 다만 인간의 역할은 단순한 것에서 더욱 더 지능적인 것으로 차원을 높여갈 것이다. 인공지능 시대의 새로운 언어인 빅데이터에 관심을 기울여야 하는 이유다.