Home 서비스에서의 데이터팀에 대한 단상
Post
Cancel

서비스에서의 데이터팀에 대한 단상

11월 초에 모 처에서 ‘서비스에서 다양하게 데이터를 사용하는 법’에 대해서 발표를 했었다. 강의 자료는 오픈하지 않기로 했으므로 오픈하지 않지만, 간단하게 요약하면 다음과 같다

  • 디자인, 마케팅, 경영 등에서도 데이터를 보는 것이 트렌드고 실제로도 필요하다.
  • 데이터를 기반으로 문제를 푸는 것은 기본적인 데이터 분석의 프로세스를 따르게 된다.
  • 사람들은 문제를 정의하고, 문제를 풀어 결과를 전달하는 데에는 집중하지만 그 사이에서는 생각을 잘 하지 못한다.
  • 필요한 데이터를 찾아서 만드는 것, 그 것을 문제에 적절하게 적용하는 것이 중요하고, 이 과정을 다른 사람(데이터 분석가 등)에게 맡기고 처음과 끝만 취하려 하는  것은 데이터를 쓴다고 할 수도 없는 것이고, 문제를 복잡하게 만들고, 오래 걸리게 만들고, 일이 제대로 이루어질 수 없게 한다.
  • 일반적으로 회사에서 관리하는 데이터의 종류에는 여러 가지가 있다. 이 중 우리가 가지고 있는 데이터가 어떤 건지, 어떻게 남는 건지는 남기고 관리하는 사람(개발/데이터)에게 물어보자.
  • 데이터를 적절하게 적용하기 위해서는 문제를 쪼개서 보는 것을 생각해 보자. 문제를 쪼개고, 그 문제에 필요한 데이터가 무엇인지를 찾자. (https://dataintelligence.podbean.com/ 데이터지능 팟캐스트에 3회차 게스트로 참여했을 때에도 비슷한 이야기를 했다.)
  • 기타 등등.

사실 이 발표 전후로, 나는 많은 생각을 했고 많은 회의가 들었고 많이 혼란스러웠으며 많이 부끄러웠다. 아마도 그런 내용이 발표에서도 조금 느껴졌을 지도 모른다.

물론 이 발표의 청중은 데이터를 그다지 자주 사용하지 않는 사람들(이라고 전달받았다)이었으므로, 대상에 맞춘 발표를 했을 뿐이다. 하지만, 그렇다면 나나, 다른 데이터 관련자(엔지니어, 분석가, 혹은 데이터를 남기는 개발자 등)들은 그냥 하던 일을 하면 될까? 당연히 그럴 리 없다.

고전적인 비유로, 데이터 분석을 요리라고 생각해 보자. 하지만 모든 요리가, 레스토랑에서만 이루어지는 것은 아니다. 요리를 집에서도 할 수 있어야 하고, 특히 가구 수가 증가하면서 요리를 처음 시작하는 사람들도 늘어난다. 이 사람들이, 요리법은 레시피를 책이나 인터넷에서 찾아서 보고 할 수 있지만 최소한 집 근처에 어디서 어떤 재료를 살 수 있는 지, 최소한 가게 위치는 알게 해 주어야 하고-가장 가까운 가게가 10km 떨어져 있거나 하면 안 될 것이고, 기본적으로 이 동네에서 파는 걸로 어떤 기본적인 것을 먹을 수 있는 지 정도는 알게 해주어야 할 것이다. 인터넷 사이트로 재료를 주문할 수 있다면 더욱 좋을 것이다. 하지만 본인의 입맛에 맞춰서 그 때 그 때 먹고 싶은 요리를 해먹는 것은 본인의 몫이다. 아니면 아주아주 비싼 음식값과 배달료를 내거나. 물론 독립적인 가구라면 1인 이상의 성인이 있고, 성인이라면 자기 음식은 자기가 알아서 먹어야 할테니 굶거나 음식을 썩히는 건 그 사람 책임이지만, 기본적인 것 정도는 해야 인구가 유지되지 않겠는가.

모든 일은 그 일과 엮인 모든 사람들의 적당한 밀당을 통해 균형을 잡게 된다. 어느 한 쪽만 신경써서 될 수 있는 일은 아무 것도 없다. 서비스에서 데이터를 다양하게 사용하기 위해서는, 문제를 해결하려는 당사자의 역할도 중요하지만, 그 데이터를 관리하고, 그에 대해서 이해하고, 그 것이 더 익숙한 데이터 관련자의 역할 또한 무시할 수 없다.

물론 다 만들어진 예쁜 데이터, 아니, 필요하게 만들어진 숫자들을 가져다 쓰는 것이 데이터를 사용하는 것은 절대 아니고, 현재의 데이터에서 올바르게 가져다 쓰는 것은 각자의 몫이다. 하지만 어디에 어떤 형태의 데이터가 있다는 것을 알려주는 것은 데이터 관련자들의 역할이다. 물론 거기서 나아가서, 서비스에서 데이터가 제대로 사용되는 지를 알고, 그 서비스 내에서 많이 활용되는 데이터를 찾고, 그 데이터부터 차근차근 더욱 접근하기 쉬운 형태를 고민하고 만드는 것 역시 (안타깝게도)데이터 관련자의 역할일 것이다.

데이터 분석가의 경우는 조금 애매한 데가 있다. 분석가가 데이터를 이해하는 것은 일을 하기 위해서 이해하고 있는 목적인 것이라 다른 업의 사람들과 어떻게 보면 비슷한 입장이고, 보다 먼저 깊이 이해하고 있을 뿐이니까. 하지만 어차피 간단히 데이터에 접근해서 간단한 문제 해결만 하는 목적이라면 분석가가 다른 업의 사람들보다 더 나을 것도 없고, 분석가라는 직함이 무색해진다. 그렇다고 흔히 데이터 사이언스라고 말하는, 다양한 데이터를 깊이 다루는 일을 하기 위해서는 이미 데이터가 그 서비스의 운영 주체(회사)에서 다각도로 널리 사용되어야 한다는 전제조건이 붙는다.  그런 상태가 아닌 데에서 이것저것 한다고 해도, 그 것의 재료가 이미 데이터인 이상 그런 작업은 제대로 쓰일 수 있을 리 없다. 물론 이미 데이터가 너무 잘 도는 상태인 곳이 있다면 굉장히 이상적이겠지만, 그런 알록달록동산(디아)같은 곳은 흔히 입에 오르내리는 정말 잘 나가는 회사 외에는 존재하지 않는다(그런 회사도 사실 이런 지는 잘 모른다). 그렇다면, 어느 정도 회사에 데이터가 혈액마냥 흐르게 하는 데에 리소스를 일부 투입해야 하는 것은 어쩔 수 없다. 물론 그 비중이 과해진다면 그 건 어딘가 동맥경화가 심하게 있다는 뜻이니 치료가 필요하겠지만 말이다.

나도 데이터 분석가로서, 데이터 관련자로서, 많은 고민을 한다. 이 쪽 일을 한 지도 이제 두 자릿수가 훌쩍 넘었고, 세상은 많이 변했고, 고도화된 기술을 쫓아가는 것도 벅차고, 그렇게 쫓아간 기술을 실제로 적용해 보고 싶고, 거기에 투자할 여력도 부족하다. 하지만 그 전에 기본적으로, 조직에서 데이터를 보는 것이 업인 사람에게는 어쨌든 그 조직에서 데이터를 제대로 돌게 하는 것도 분명 분석가의 역할 중 하나다.  데이터가 잘 도는 곳은 모두 비슷비슷하지만, 데이터가 잘 돌지 않는 곳은 안 도는 부위도, 형태도 , 이에 대한 치료법도 각기 제각각이다. 그리고 비슷비슷하게 잘 도는 곳은 사실 많지 않다. 밖에서야 혈색만 좋은 서비스에게 찬사를 보내고, 걱정하는 사람들에게 이런저런 이야기를 하지만, 외견 평가는 사실 쉬운 이야기일 뿐이다. 나마저도 잘 나갈 것 같다고 생각하는 회사의 데이터 관련자에게 데이터에 대한 걱정을 들으면서, 정말 저마다의 이유로 혈액이 안 흐른다는 것을 떠올리고는 한다.

그래서, 내가 이러려고 지금까지 이 업을 하고 있나 하는 자괴감도 뱅만번 느끼면서도, 내가 과연 무엇을 할 수 있나, 무엇을 더 해야 내가 하고 싶은 일들을 할 수 있는 환경이 될까 하는 고민을 하고, 늘 새로운 동맥경화를 보면서 왜 이 분야는, 내가 하는 일은, 엄청 화려하고 발전하는 것 같으면서도 늘 그대로, 혹은 오히려 더 퇴보하는가 하는 생각에 혼란스러워 하고, 부끄러워하기도 한다. 하지만 많이 생각하고, 한숨을 쉬고, 그러면서 전혀 소용없을 것 같다고 생각하면서도 한 발씩 내딛는다. 어쨌든, 현재의 내 자리에서 내가 할 수 있는 일은 해야 하지 않겠는가.

    This post is licensed under CC BY 4.0 by the author.

    비즈니스의 AI와 전문가 시스템

    Presto 쿼리 실행계획 겉핥기