Home 데이터란 무엇인가
Post
Cancel

데이터란 무엇인가

회의하다가 주변 사람을 긴장시키고 싶은가. 그렇다면 무언가 한가득 타이핑을 하면서 소리 내어 말해보라. “분석이란 무엇인가.” 아마 함께 회의하던 사람들이 행동을 멈추고 걱정스러운 눈초리로 당신을 쳐다볼 것이다. 정체성을 따지는 질문은 대개 위기 상황에서나 제기되기 때문이다. 사람들은 평상시 그런 근본적인 질문에 대해 별 관심이 없다. 분석이 무엇인지, 지표란 무엇인지에 대해 궁금해하기보다는, 분석 결과가 어떻게 나왔는지, 어떤 지표가 오늘은 올랐는지, 즉 정체성보다는 결과와 현상에 대해 더 관심을 가진다. 그러나 자신의 존재 규정을 위협할 만한 특이한 사태가 발생하면, 새삼 근본적인 질문을 던지지 않을 수 없다.

내 친구가 그 좋은 예다. 그의 동료는 일상의 아이디어를 토대로 제품을 기획하는 기획자인데, 얼마 전 새로운 프로젝트를 기획하게 되었다. 기획에 쓴 자료 중에는 오래된 분석 보고서를 바탕으로 한 내용이 있었다.
이런 내용도 있었구나 싶어서 그 분석 보고서를 소리내어 읽어보았다. 그런데 그 내용과 논리가 내 머리가 받아들이기에는 너무 비약이 심해서 그만 그 자리에서 ctrl+d를 누를 뻔했다. 혹여 내가 이 내용에 대해 비슷하게 보고서를 쓰게 된다면, 그래프 추이가 같다는 이유로 A가 B때문이라고 확신하지는 않으리라. 함부로 인과관계를 칭하지 않으리라.

짧지만 간결하지 않은 그 보고서가 너무 인상적이어서, 그 보고서를 사용한 기획자에게 이 거 어떤 분이 만들었는지 물었다. 그러자 천연덕스럽게 “예전에 저희 팀 분석가가 작성해서 회사 사람들 다들 아는 내용이에요.”라는 대답이 돌아왔다. 아, 논리적이고 꼼꼼한 그 친구에게 이와 같은 면모가 있었다니! 며칠 뒤, 그 친구를 만날 기회가 있었을 때 급기야 “그거 네가 쓴 보고서라며?”라고 묻고 말았다. 그랬더니 평소 감정의 큰 기복이 없던 그 친구가 정서적 동요를 보이면서, 자신도 요즘 프로젝트 때문에 그 보고서를 다시 보고 충격에 빠졌다고 털어놓았다. 놀리고 싶어진 나는 왜 그런 비약을 만들었냐고 따져 물었다. 그러자 그 친구는 갑자기 과학자다운 평정심을 잃고 고성을 질러댔다. “그 결과를 쓰던 때의 나와 지금의 나는 다른 사람이라고 생각해! 내가 왜 그랬냐고 묻지 마!” 그러고는 벌떡 일어나 괴성을 지르며 나를 할퀴었다. 그 더러운 손톱에 할퀴어지는 바람에, 내 손목은 진리를 위해 순교한 중세 성인처럼 피를 흘렸다.

그 친구의 이러한 난동은 정체성의 질문이란 위기 상황에서 제기되는 것임을 잘 보여준다. 자신이 받아들이고 싶지 않은 과거를 부정하기 위해, 기존에 가지고 있던 자기 정체성을 스스로 파괴하려 들었던 것이다. 하나의 통합된 인격과 내력을 가진 인간으로 살아가기를 포기한 것이다. 오늘도 그는 그 허술한 보고서를 쓰던 자신과 현재의 ‘쿨한’ 자신을 화해시키고, 새 시대에 맞는 새로운 정체성을 구성하기 위해 ‘분석적으로’ 씨름하고 있으리라.

데이터로 뭔가를 하겠다고 모여든 사람들은 늘 그러했던 것처럼 당신이 하는 일에 과도한 관심을 가질 것이다. 분석은 무슨 언어로 했는지, 어떤 화려한 결과를 낼 것인지, 어떤 알고리즘을 쓸 것인지, 데이터 기반 무언가는 언제 나오는 지 등등. 그러나 2022년의 냉정한 과학자가 허술한 분석 보고서를 쓰던 201x년 청년이 더 이상 아니듯이, 당신도 과거의 당신이 아니며, 동료도 과거의 동료가 아니며, 회사도 옛날의 회사가 아니다. 따라서 “그런 질문은 집어치워 주시죠”라는 시선을 보냈는데도 불구하고 동료가 데이터로 뭔가를 한다는 말에 데이터 분석에 대해 캐물어 온다면, 그들이 평소에 직면하지 않았을 근본적인 질문을 던지는 게 좋다. 상사가 “너 언제 딥러닝 적용할 거니”라고 물으면, “곧 하겠죠, 뭐”라고 얼버무리지 말고 “딥러닝이란 무엇인가”라고 대답하라. “데이터 기반으로 무언가를 해야 할 때라서 일부러 물어보는 거란다”라고 하거든, “데이터란 무엇인가”라고 대답하라. 다른 팀 동료가 “너 대체 분석으로 뭐 할 거니 말 거니”라고 물으면, “분석이란 무엇인가”라고 대답하라. 거기에 대해 “얘가 일 안 하나”라고 말하면, “일이란 무엇인가”라고 대답하라. 회사에서 “근사한 데이터 기반 제품 하나 반영해다오”라고 하거든 “데이터 기반 제품이란 무엇인가”. “회사가 위기라서 그런단다”라고 하거든 “위기란 무엇인가”. “동료끼리 이런 이야기도 못하니”라고 하거든 “동료란 무엇인가”. 정체성에 관련된 이러한 대화들은 신성한 주문이 되어 해묵은 잡귀와 같은 오지랖들을 내쫓고 당신에게 자유를 선사할 것이다. 블로그란 무엇인가.

(이 글은 김영민 교수님의 명칼럼 을 패러디한 내용입니다.)

    This post is licensed under CC BY 4.0 by the author.

    데이터 실험에서의 실험자 편향

    제주 올레 후기