요즘 인공지능이 시대의 화두인 것은 두말할 나위가 없다. 추석 연휴 때에 잠시 본 TV에서는 ‘인공지능’ 어쩌고 하는 광고가 10개 넘게 지나갔고, 인공지능 관련 책이 서점에서는 쏟아져 나온다. 하지만 우리의 손에 실질적으로 닿는 인공지능(AI)이란 어떤 것일까. 사실 지금도 Siri같이 바로 옆에서 사용해 볼 수 있는 것도 있고, 우리네가 사용하는 시스템에는 머신 러닝이 적용된 분야도 보이지 않게 많이 있다.
인공지능의 정의는 크게 인간적 사고, 합리적 사고, 인간적 행위, 합리적 행위의 네 가지 범주로 분류하지만, 기본적으로는 기계가 인간의 인지 활동을 모방하도록 하는 것이다. 그리고 그 인간의 인지 활동을 구축하기 위한 것은 말 그대로 ‘인간’의 사고 구조를 모방하는 것에 가깝다. 흔히 말하는 ‘강 인공지능’에 가까운 형태다.
하지만 이는 하얀 백지에 논리 체계를 구축하는 것에 가까운 형태이자, 신생아부터 어린 아이까지를 키우는 과정에 가까운 형태이다. 하지만 서비스에서 AI를 적용한다는 것은 실제로 기업에서 인간을 대체하는 용이다. 말 그대로 전문가를 대체하는 것이다. 따라서 흔히 말하는 서비스에서의 AI를 이런 ‘강 인공지능’적인 형태로 접근하면 사람들 간의 생각에 많은 격차가 발생할 수 밖에 없다.
잠시 과거를 짚어보자.
인공 지능 연구의 첫 번째 호황기에서 실제 연구 결과가 기본 논리 구조를 겨우 따라잡은 수준의 연구 결과들 밖에 나오지 못한 것에 실망하면서 막을 내린 첫 번째 호황기의 두 번째 호황기(196일0년대 초)에는, 펀딩을 하는 사람들이나 연구나자 모두 ‘실용적인 지능’에 초점을 맞추었다. 이 때 등장한 것이 이른바 ‘전문가 시스템(Expert System)’이다. 실제로 이 때 화학, 생물 분야에서 Dendral, Mycin 등의 시스템이 등장하고, 실제 비즈니스에서도 Xcon(컴퓨터 조립 시스템) 등이 등장하면서 실제로 비즈니스에 활용 가능하고, 이익을 창출하는 것이 등장한다.
하지만 여기에서도 명확한 한계가 드러난다. Mycin처럼 성공적인 경우도 있지만, 대부분의 사람들의 지식은 데이터화 되어 있지 않다(이는 비즈니스에서의 총체적인 문제로 다루어져서, 이후 Knowledge System/Information System 등의 분야가 생기고 여러 연구가 되지만, 장기적/실용적으로 실제 사용되는 경우는 드문 분야가 된다). 기본적으로 전문가 시스템이란, 인간 전문가로부터 그들의 경험적/학습적 지식을 습득해서 데이터화 한 후 기계에 적용해 주어야 하는데, 이 과정에서 ‘병목 현상’이 발생한다. 더불어 이를 운좋게 데이터화한다고 하더라도, 지속적으로 변화하는 비즈니스 환경에 맞추어 이런 데이터/규칙도 변화 내용이 반영되어야 하는데, 이 과정에서 많은 공수가 발생한다. 그러다보니 전문가 시스템이란 결국은 조금의 알고리즘과 상당수의 규칙 기반 시스템 형태로 만들어졌고, 간혹 시스템에 반영된 불편향적 지식으로 인해, 전문가 시스템은 실수를 일으키는 경우가 일쑤였고, 그 실수는 많은 비용으로 돌아왔다.
이로 인해 전문가 시스템의 거품도 꺼지긴 하였으나, 이를 통해서 ‘약 인공지능’의 개념 및 인공 지능 분야에서의 ‘Divide and Conquer’ 의 흐름이 태동되었고, 점진적인 실용과 발전이 함께 하는 실사구시적 경향이 나타나게 되었으니 이 것이 꼭 인공지능 연구에 부정적인 결과만 미친 것은 아니었다(물론 실패보다는 성공이 좋은 건 당연한 이야기지만).
그러다 인공지능 분야의 전반적인 암흑기가 잠시 길어지면서, 이 중간의 추세 역시 잠시 잊혀져 갔다가, 다시 인공지능 붐이 생기면서 이런 현상도 같이 돌아온 것이다. 어쩔 수 없는 역사의 흐름은 반복되기 마련이다.
이에 따라, 현대에 나오는 인공지능도 서비스에서 활용하고자 하는 형태는 기본적으로 (이상적인) 전문가 시스템 형태일 것이다. 그리고 그 전문가 시스템은, 어린 아이의 지능 + 해당 도메인의 지식을 충분히 학습한 형태이므로 (아무리 컴퓨터가 학습을 빠르게 한다고 해도) 더 높은 차원의 알고리즘과, 데이터를 필요로 한다. 하지만 실제 해당 도메인의 모든 데이터가 충분한 양에 잘 정제되어 있기란 어렵다. ES, IS 등의 분야는 아직까지 장기적으로 성공적인 사례를 도출하지 못했고, 요즘 비즈니스에 ML을 적용하는 경우 많은 사람들이 ‘Data is one of the biggest pitfall’이라고 이야기하며, 여전히 많은 경우 비즈니스란 잘 되었을 때 얻는 비용보다 잘 안 되었을 때의 손해 비용이 커서 risk management 가 중요한 부분이므로, 최근의 트렌드인 딥 러닝만을 사용해서는 부자연스럽거나, 정확도가 낮은 결과가 발생해서 risk management 에 어려움을 겪을 가능성이 있다. 결국 정제된 데이터의 확보(특히 감독 학습에 사용할 수 있는 라벨링 데이터를 얻는 것에 대해서는 한 꼭지의 글로 따로 구분해도 길어질 것이다), 지식의 데이터화, 머신 러닝의 위험 관리는 (전과는 조금 다른 형태이기는 하지만) 여전히 한계로 다가오는 것이다.
그래서 현재 구글 등 많은 기업에서도 실제로 머신 러닝(요즘은 주로 딥러닝)을 주로 활용하는 부분은 데이터 수집이 쉽고 손해 비용이 거의 없는 예술 분야(magenta project 등)나 개인 비서 및 기계 번역 분야, 단순하지만 많은 공수가 들거나 혹은 물리적 위험 요소가 있어서 실패 비용이 많이 들지 않으면서도 비용 절감을 꾀할 수 있는 식별 분야(현재 연구되는 자율 주행은 이 분야가 극단적으로 고도화된 경우다)다. FDS나 실제 다른 분야의 경우 머신 러닝을 적용하더라도 주가 되어서 사용한다기 보다는 일반 업무와 같이 사용하면서 규칙을 추가로 적용한다든가 사람의 검수를 동시에 진행하는 방식으로 사용한다.
물론 딥 러닝 등 최근 나오는 머신 러닝 쪽 연구는 API 및 라이브러리가 많이 공개되어 있어서 바로 적용 혹은 일부 수정 후 적용하기가 용이하다. 또한 이전과는 비교도 안 될 만큼-아마도 빅데이터 라는 말이 괜히 나온 것만은 아닐 것이다- 많은 데이터가 있고, 알고리즘 등도 눈부시게 발전했다. 하지만 현재까지 서비스 단계에 응용하는 인공지능은 순수하게 알고리즘 만으로 이루어진 강 인공지능과는 차이가 있고, 이 것만으로 완벽하게 무언가를 하기에는 아직까지는 한계가 있으므로, 해당 도메인의 분야에서 좀 세부적으로 접근해야 할 필요가 있다. 아직 비즈니스에서 AI를 완전히 사용할 수 있는 분야는 많지 않다. 무조건적으로 ‘우리는 인공지능을 합니다. 딥러닝은 정말 좋아요’ 가 아니라, 딥러닝, 머신 러닝, 인공지능 등에 대해서 이해를 하고, 이에 대한 장단점을 이해한 후 서비스에 어떤 식으로 ‘도움이 되도록’ 적용할 수 있을 지를 고민해야 할 것이다.
데이터 분석의 꽃은 예측 분석이다, 라고 한다. 이런 예측의 궁극적인 형태가 결국은 인공 지능이다. 최선의 솔루션을 알고 그대로 이행하는 것이다. 하지만 이를 위해서는 해당하는 분야에 대한 충분한 데이터가 필요하고, 이는 위험관리가 필수적인 서비스 분야에서는 더욱 그러하다. 그런 의미에서 앞서 언급한 분야를 제외하고 많은 곳에서 이야기하는 ML이나 AI는 조금 거품이 낀 듯한 느낌이 있다. 이런 거품에 같이 떠다니기 보다는, ML이나 AI의 장단점을 고려하여 어느 쪽에 붙였을 때에 가장 유용할 지를 고민하고, 이를 조금씩 발전시키면서, 잘 가꾼 데이터를 점진적으로 확보하는 방향의 실사구시적 접근이 더욱 필요한 시기라고 생각한다.
Reference
- [Artificial Intelligence: A Modern Approach(Third Edition)], Stuart Russell and Peter Norvig, Pearson, 2010
- [인공지능은 뇌를 닮아가는가], 유신, 컬처룩, 2014
- [구글에서 배우는 딥러닝], 닛케이 빅데이터, 영진닷컴, 2017