2021년 가트너 Data Science hype graph에 등장한 용어들

가트너의 하이프 그래프. 솔직히 빅데이터가 나오면서 이 그래프를 보기 시작해서인가, 나는 이 그래프를 한 번도 좋아해 본 적이 없다. 하지만 어쨌든 영향을 받을 수밖에 없으니 눈을 돌릴 수도 없는, 그런 애증의 무언가가 되어버렸다. 그리고 한동안은 잊고 살다가 올해 어쩌다 또 보게 되었다. 작년 여름에 발표된 데이터 과학/기계학습 분야 hype graph.

붉은 상자/밑줄로 표기한 부분이 데이터 과학 관련 분야다. 그런데, 앞의 1, 2단계 (거품이 끼기 시작하는/말이 많이 나오는)에 있는 데이터 과학 분야는 이제 기술이라기 보다는 보다 활용/문화적인 단어들이 주목을 받고 있다.

1, 2단계의 단어들 뜻을 몇 가지만 살펴보자.

  • X Analytics: 기업의 모든 데이터에 쉽게 접근해서 복합적이고 다양한 분석 결과를 만들어 내는 것
  • Decision Intelligence: 참고 (유의어임)
  • Data Science Education : 데이터 과학 교육. 기업의 많은 사람들에게 데이터를 더 접근하기 용이하게 교육을 하자는 것. 이 것은 뱅만년전부터 ‘데이터를 흐르게 하기 위해 필요하다’라고 누누히 강조하던 것이므로 생략
  • Analytics Governance: 분석 프로세스와 정책을 정비하고, 분석 결과를 보다 잘 활용할 수 있도록 정비하는 과정
  • Chief Data Scientist: 데이터 과학자를 최상위 경영진으로 올려 데이터에 보다 힘을 실어주는 것
  • Small and Wide data: 데이터의 규모보다 다양성에 좀 더 초점을 맞춰서 여러 범위의 데이터를 동시에 분석하는 것
  • Composable Data and Analytics: 데이터와 분석 단계를 모듈화, 시스템화해서 보다 여러 사람이 쉽게 접근하고 쉽게 문제를 해결할 수 있도록 하는 것

참 다들 좋은 말인데, 사실 ‘용어’만 없었을 뿐 옛날부터 나도 많은 데이터 분석가들도 하던 이야기라서 별로 할 말이 없고 이제는 같은 말 하기도 조금 지겹기도 하다. 그나마 희망이라면 데이터를 ‘기업에서 잘 쓰게 하기 위한 문화 및 정비’가 버즈워드로 나오면 빅데이터때 데이터 분석이 정착되었던 것처럼 데이터 문화도 이제 좀 정착이 되지 않을까 하는 것이다. 물론 대부분의 단어는 바로 3단계로 들어가서 사라질 것이라고 믿어 의심치 않지만.

데이터가 기업 문화에서 제대로 된 활용이 되지 않은 것은, 데이터를 적확하게 기업에서 사용하지 않은 영향이 크다. 데이터가 의사 결정에서도 끝까지 그 분석적인 힘을 발휘해야 하고, 데이터 분석은 많은 경우 바이너리가 아닌 확률의 문제인데, 대부분의 사람들은 확률에 익숙하지 못하고 이 것이 절대적인 답을 주는 양 굴었다. 그리고 이를 더 빠르고 적극적인 답을 주는 도구로 만드는 것에 초점을 맞춰왔다. 하지만 데이터와 확률, 통계는 의사 결정 서포트용 레시피가 아니라 하나의 제품의 구성 요소이자 하나의 분야 임을, 촘촘한 논리로 쌓아올렸지만 이는 불확실성을 줄이기 위해서일 뿐 제거할 수는 없음을, 많은 경우 데이터를 단순히 집계 내고 통계 내는 것보다 질문을 잘 설계하고 데이터를 잘 구축하고 관리하는 데에 초점을 맞추는 것이 문제 해결에 더 큰 도움이 된다는 것을 이제는 정말로 많은 사람들이 알 때가 되었다.

실망한 사람들이라면 어쩔 수 없지만 생각을 바꾸기 위해 노력해야 하고, 데이터가 ‘수단’이 아닌 ‘프로그래밍’이나 ‘기획’같은 명확한 한 분야고, ‘데이터’는 ‘서비스’와 같은 하나의 회사의 자산으로 자리잡기를 바라는 것은 너무 이상적인 생각일 수도 있지만, 어쨌든 가고 있는 방향은 결국은 그렇지 않은가.

Written on January 29, 2022