데이터 과학의 정의는 보통 ‘데이터를 다양한 방법으로 분석하여 의미있는 지식을 찾아내어 이를 기반으로 넓은 분야의 의사 결정에 활용할 수 있도록 한다’라고 되어 있다. 그래서 데이터 과학의 범위를 좁게 잡아도 통계, 알고리즘, 데이터 처리, 시각화, 데이터 스토리텔링 등등 여러 범주의 지식이 필요하다. 하지만 예전부터 가끔씩 이야기되어 왔지만 여전히 가장 해결되지 않는 문제는 ‘how to make data actionable’, 즉, 실제로 데이터를 어떻게 활용하는가에 대한 이야기다. 그리고 이 부분이 가장 해결되지 않는 것은 ‘의사 결정에 사용하기’다.
요즘 데이터 과학 관련된 트렌드를 살펴보면, 조금씩 튀어나오고 있는 것이 ‘의사 결정 과학’에 대한 이야기다. 대략 1-2년전부터 조금씩 언급되고 있었고, 이제는 꽤 찾기도 쉬워지고 관련 JD도 보이기도 한다. 놀랍게도, ‘의사 결정 과학(Decision Science)’ 이란 이름은 ‘데이터 과학’보다 훨씬 오래되었다. 주로 경영과학 관련 분야에서 나왔던 이야기지만, 이제는 이 역시도 의미가 바뀌어서 은근히 여기저기서 사용되는 듯 하다. 데이터 분야의 지옥으로 가는 길은 버즈워드로 포장되어 있을 것이다. 워낙에 기존 단어 오염이 심한 분야여서 이 역시도 2%는 반갑지 않지만, 그래도 데이터 분석의 궁극적 목표가 ‘의사 결정에 활용되는’ 것이었기 때문에 그나마 다른 용어들 보다는 거부감이 적다. (물론 기존의 경영과학에서 이 분야를 하던 사람들은 어떤 기분일 지는 잘 모르겠다. 검색하기 조금 어려워지지 않았을까.)
하지만 이 것이 무엇이냐, 하고 뚜렷하게 정의된 것은 거의 없다. 이런 버즈워드들은 늘 그래왔지만, 말하는 것은 조금씩 다 다르다. 어디에서는 요즘 흔히 사용되는 BA와 비슷하게 쓰기도 하고, 혹자는 Growth Hacker와 비슷하게 쓰기도 한다. 혹자는 SQL을 할 줄 아는 전략 분야의 사람을 말하기도 하더라. 당장 데이터 과학자의 범위만 해도 멋대로다보니, 크게 새삼스럽지는 않다. 데이터 분석의 범위가 너무 넓어서 이를 쪼개고 쪼개다 보니 나온 단어일 지도 모른다. 하지만 뭐가 되었든, 보다 의사 결정 관련된 쪽의 데이터 분석을, 실현 가능하게 한다는 맥락은 가지고 있다. 그 외에 대해서는 말하는 사람들마다 아무말 대잔치지만. (그리고 이 글 역시 그런 아무말 대잔치에 무게를 더 하게 되겠지.)
페이스북, 구글, 인스타그램 등의 Chief Decision Scientist의 인터뷰나, Decision Science 학제의 최근 커리큘럼 등을 보면, 기본적인 데이터 분석 외에도 이를 실제로 ‘적용 가능한’ 것에 대한 이야기를 한다. 데이터 활용 방안, 의사 결정 프로세스 등. 그리고 이 때 무엇보다 중요한 것은, ‘이 문제에 대해서 당신의 마음을 바꾸려면 무엇이 필요한가’다. 이는 결국 명확하게 문제 정의를 하는 것이고, 적확한 실험 설계를 하는 것이며, 그래서 나온 결과에 따라 바로 판단을 할 수 있도록 의사 결정 구조를 수립하는 것이라고 생각한다. 내가 무엇을 보고자 하는 지 명확히 알지 못하고, 어떤 기준으로 의사 결정을 내려야 하는 지 알지 못하면, 이는 ‘내 마음 나도 몰라’ 상태나 ‘답정너’ 현상을 만들 뿐이고, 데이터는 그 겉의 장식이 될 뿐이다.
데이터를 열심히 분석하고, 알고리즘을 멋지게 만들어내는 것에 대해서는 많이 이야기를 하였지만, 이를 잘 활용하는 것에 대해서는 많이들 언급하지 않았다. A/B테스트를 하면 세상 모든 것이 해결될 것처럼 이야기하지만, 정작 그 테스트를 어떻게 만들고 이 결과를 어떻게 사용하는 지에 대해서는 말하지 않는다. 혹은 ‘사람 바이 사람’이라서 어떤 접근방법이 정리될 수 없다고 생각해서일 지도 모른다. 이 부분은 ‘수학’과 ‘컴퓨터 공학’의 영역에서 살짝 빗겨나는 것처럼 보여서일 지도 모르고, 멋지지 않아서일 지도 모른다. 이는 ‘학문적’이지 않아서일지도 모른다. 하지만 데이터 과학이 다루는 범위가 넓은 만큼, 이에 대해서도 넓은 영역의 학문을 토대로 살펴볼 수 있을 것이다. 데이터가 그저 내부 사람들에게 ‘가 닿는 것’만이 끝이라면, 굳이 데이터를 흐르게 할 이유가 없다.
데이터 과학, AI의 한계는 기술이 아니라 사람의 문제라는 것은 이미 한참 전부터 나온 이야기였다. 그럼에도 불구하고 사람들은 이를 기술로 풀고자 했다. 은총알은 없다는 것을 알면서도 어떻게든 은총알을 만들겠다고, 혹은 은총알을 판다고 떠들었다. 하지만 데이터 과학이나 AI도 결국 서비스 내부, 외부의 의사 결정으로 실현이 되고, 코드로 이루어진 기술 자체도 당연히 중요하지만, 이는 결국 사람의, 사람에 의한 일인지라, 이를 원활하게 돌아가게 만드는 설계와 프로세스와 시스템을 만들어가는 것이 필요하다. 이렇게 말하면 뭔가 거창해 보이지만 사실 이는 매우 작은 형태부터 시작되는 일이기도 하다. 데이터-의사 결정 과학이란- 결국 이런 것이 아닐까. 그리고 이는 사람을 위한 일이기도 하다.
데이터 분석 일을 해오면서 회의가 들었던 것은 결국 꾸역꾸역 기껏 만들고 분석하고 했던 것이 제대로 반영되지 않아서 였다. 이에 대해서 어떻게든 무언가를 해보고 싶어서 경제학도, 경영학도 조금씩 뒤적거리고, 뱅만년전에 보았던 책들도 다시 뒤져보고 했지만, 이게 이렇게 어떤 이름이 붙어서 다시 튀어나오게 된 것은 역시나 세상만사 다들 비슷해서일 것이다. 그래서 예전부터 흐린 눈으로 지켜보고 있었지만, 그래도 몇 달 만에 나왔다 들어가는 단어는 아니어서, 나도 이런 쪽에서 무언가를 해볼 수 있지 않을까, 작게나마 생각하고 있다. 물론 여러 다양한 분야는 짬짬이 보는 것들만으로도 머리가 아프고, 사람에 의한 피곤한 일들이 잔뜩 있겠지만, 데이터 분석이 실제로 실현되고 효용 가치를 가지면, 데이터로 더욱 재밌는 것들도 많이 해 볼 수 있을테니까 말이다.