Home 질의(Query)에 관하여
Post
Cancel

질의(Query)에 관하여

(부제: 정보의 자유에 대한 사담)

아마도 다들 그렇겠지만, 나는 무언가가 필요하지만 어디서부터 시작해야 하는 지조차 몰라서 헤맨 경험이 잔뜩 있다. 물론 그런 경험 후에는 얄팍한 지식을 조금 얻게 되지만, 그로 인해 너무나도 많은 부분에서 많은 길을 돌아와야 하기도 하고, 자원을 필요없이 많이 소모하기도 했다. 사실 지금도 그런 일련의 과정 중일 것이다. 그러고는 늘 갑갑해한다. ‘남들은 저렇게 다들 척척 잘 하는데, 대체 저거는 어떻게 해야 하는 거지?’, ‘이런 걸 하라는데, 대체 어디서부터 시작해야 하는 것일까?’, ‘다들 저런 거 어떻게 알고 저렇게 하지?’같은 경우가 지금까지 살아온 내내 다반사다. 이래저래 돌이켜보면, 삽을 만들어서 땅을 파다가 다시 묻는 것 같은 일을 조금만 덜 했어도 지금보다는 꽤나 나은 삶을 살고 있지 않을까, 하는 생각을 종종 한다.

하지만 이런 경우, 내가 가장 많이 맞닥뜨려야 했던 문제는 ‘근데 이거 어디 가서 물어봐야 하지?’ ‘뭘 물어봐야 하지?’ 였다. 우리는 흔히 ‘정말 모르면 뭘 질문해야 할 지도 모른다’라고 하지 않던가. 딱 내가 그런 꼴이었다. 어디서부터 손을 대야 할 지, 어디에 가서 어떻게 찾아야 할 지 근본적인 것부터 모르는 것이었다. 그래서 항상 혼자서 이상한 길로 가기 시작하고, 그 와중에 눈에 뵈는 것은 없어서 어떻게든 되겠거니 하고 쭉쭉 가고, 그러다 어둑어둑해져서야 처음 보는 곳의 막힌 길에 도달한 다음에는 돌아오는 길을 찾아 다시 헤매게 된다. 이런 것이 반복되다 보면, 주변에 사람이 있어도 어디서부터 물어야 할 지 몰라서 묻지 못하고, 그러다 질문하는 법마저 배우지 못해서, 어설픈 질문을 하고 나서 서로에게 아쉬워하게 되는 상황만 일으키고야 마는 것이다.

  늘 이런 식이었고, 가끔은 억울하기도 했다. 주변에 물어볼 곳도, 알아서 끌어주는 곳도 많은 사람들이 저렇게 멀리에 널리고 깔렸는데, 왜 나는 어리버리 빙글빙글 제자리에서 돌다가 진을 빼게 되는가. 저기 가는 사람들이 나보다 다리가 더 튼튼하다거나 하는 것도 아닌데 내가 그렇게 길눈이 어두운 것일까, 이 것이 모두 내 능력이 부족해서일까.

 아니, 사실은 그렇지 않았다. 물론 내가 아주 뛰어난 사람은 아니지만, 그렇다고 내가 아주 부족한 사람도 아닐게다. 그저 나는 주변사람보다 질문 능력이 조금 부족했고, 질문할 수 있는 곳이 적었다. 삶에 정보가 부족했다. 내가 항상 갈망하던 것은 정보가 저장되어 있는 곳, 이를 손쉽게 꺼낼 수 있는 곳이었다. 그나마 내가 PC 통신과 인터넷이 발전하는 시대에 살아갈 수 있는 것은 행운이다. 그나마 컴퓨터와 통신의 발달로 조금의 수고만 들이면 많은 정보들을 습득할 수 있는 시대에 살고 있어서, 그나마 이 정도도 길을 훨씬 덜 헤맨 것일게다. 활자중독까지는 아니더라도 글자에 익숙한 기술이 있는 것도 얼마나 복인가. 그나마 이 기술 덕에 지금까지 어케든 살아왔을터다.

세상은 ‘모르는 게 약이다’라는 말을 한다. 행복지수가 높은 나라들은 발전을 평가하는 지수가 다소 낮고, 내부 계급도 많이 나뉘어져 있다며, 부나 재산이나 이런 것에 신경쓰지 말고 본인의 삶에 만족하는 게 최고라고, 안빈낙도의 삶이 좋지 않냐고 이야기한다. 나는 이런 의견에 동의하지 않는다. 당신이나 그렇게 사세요. 일단 그 행복지수가 과장되어 전해지는 것부터 이미 알고 있어요. 각자 문화와 전통이 그리 중하다고 하지만 발전하는 양상은 비슷하고, 부탄의 부자나 중국의 부자나 미국의 부자는 사실 큰 차이가 안 난다는 것도 안다. 대부분의 차이는 빈부의 분포 차이라고. 사람들에게 정보를 틀어막아서 안빈낙도하는 것처럼 보이는 게 얼마나 갈 것 같은가. 언젠가는 본인이 속고 살았다는 것을, 내가 얼마나 잘 모르는 지를 깨닫게 될 것이고 이렇게 삼킨 빨간약이 몸에 퍼지면 돌이킬 수 없다. 이것저것 몰랐을 때가 좋았을 지도 모르지만, 다시 돌아가고 싶은 생각은 1도 없다.

 정보 습득의 불균형, 정보 권력, 정보의 재분배에 대해서 다시금 생각해 본다. 인터넷 시대가 되면서 정보를 습득하는 것이 쉽다고 한다. 크게 틀린 말은 아니다. 첫 걸음인 ‘이걸 어디다 물어봐야 하지’는 예전에 비해서 놀랍도록 해결이 되었다. 우리는 검색엔진에 무언가 글자를 넣으면 대부분의 경우 이것저것 잔뜩 나온다. 하지만 과연 그것으로 모든 것이 해결되었을까. 인터넷에는 좋은 정보도 많지만 이상한 정보는 더욱 많다. 더욱 슬픈 점은 그 이상한 정보 중에 의도를 가지고 만들어진 것이 더욱 많아서, 그런 정보들은 사람들에게 더 쉽게 노출된다. 검색엔진에 단어를 넣으면 많은 경우 땔감위키가 우선으로 걸리고, 파는 물건의 경우 광고 쇼핑몰이 먼저 노출된다. 그 뿐인가. 자극적인 정보는 사람들이 많이 보면서 우선순위가 높아지고, 그러다보니 검색을 잘 하는 법과 정보를 거르는 법에 대해서 익히지 않으면 의도를 가진 주체에 의해 휘둘리기 마련이고, 본인도 모르게 원하는 길로 가게 된다. 그 뿐이랴. 정말로 유용한 정보는 여전히 인터넷이나 무료 공간에 오픈되어 있지 않는다. 정보가 많아질 수록 유용한 정보의 가치는 더 높아지고, 이는 특정 사람들에게만 전해지면서 정보 권력의 힘, 정보 불균형은 더욱 심해진다. 

심지어 이런 무형의 가치는 범위를 나누기도 힘들고, 어떤 시스템으로 정보의 분배를 조율하는 것이 어렵다. 정보를 복제하는 데는 거의 비용이 안 든다고 생각할 수 있지만, 정보의 희소성으로 만들어지는 가치는 하락한다. 그리고 그 때 정보를 만든 사람은 어떻게 추적할 수 있을까? 다양한 면에서 고려해야 할 것이 너무 많고, 이에 대해서는 지식경제학이라는 학문 분야가 있으니 그 쪽을 기회가 되면 살펴보려고 한다.

 내가 대학교에서 데이터베이스 수업을 들으면서 계속 관심을 가지게 되었던 것은, 그 쪽으로 진학을 하게 된 것은, 그리고 지금까지 데이터 분석 일을 하게 된 것은 어쩌면 자연스러운 일인지도 모른다. 데이터를 예쁘게 잘 쌓아두고 필요한 것을 간단히 꺼내서 쓰고, 그걸 가지고 쓸모있는 정보를 만드는 일이라니, 뭐 이런 근사한 일이 다 있을까. 굳이 어디서 물어봐야 하는 지를 안 찾아도 되고, 잘 쌓아져 있기 때문에 내가 찾고자 하는 것도 손쉽게 꺼낼 수 있다니 나에게도 이런 세상이 오는구나. 거기다 심지어 이런 데이터를 잘 꺼내기 위한 구조화된 질의언어(Structured Query Language, SQL)까지 있다니, 이 얼마나 아름다운가. 나에게는 정말 ‘멋진 신세계’가 아닐 수 없었다(물론 나는 염불보다는 잿밥에 관심이 있고 그 데이터베이스를 만드는 것보다는 거기 있는 데이터를 꺼내서 쓰는 데에 주로 눈을 돌렸지만 말이다).

 RDB든 NoSQL이건 뭐건 일단 데이터베이스가 있는 환경이란 정말 좋지 않은가. 그렇지 않은 환경들이 넘치지만 최소한 기업에 한정해서 생각하면, 정보의 불균형은 어느 정도 시스템으로 해결 가능한 문제다. 물론 기업의 발전 관련해서 오래 있는 사람이 체득하는 레거시 정보의 가치는 어마어마하고, 100% 문서화하기 어렵고, 100% 데이터화 되는 것이 현실적으로 불가능하다. 하지만 이런 사람이 누구인지는 금방 알 수 있고, (조금 미안하지만) 가서 좀 귀찮게 하면서 괴롭히면(?) 될 일이다. 그 뿐이랴. 회사들이 갖추고 있는 데이터베이스에는 최소한 서비스가 어떻게 돌아가고 있는지, 고객 수가 얼마나 되는 지 같은 정보는 필요하다면 직접 찾아볼 수 있다. 물론 그 기업이 ‘정보의 분배’에 대해서 관심이 있어야 하며, 개인 정보 활용 등의 보안 문제가 없는 정보에 한해서만이겠지만, 기업 내부의 정보를 충분히 알고 있는 것은 개개인의 업무에 많은 경우 도움이 된다. 본인이 데이터 분석가가 아니라고 해도 마찬가지고, 사람들이 회사의 정보를 잘 알게 되면 회사에게도 직원에게도 이득이다. 직원이 회사에 대한 정보 탐색을 통해 지식을 쌓게 되면 최소한 회사에 대한 관심도가 증가하게 되고 증가할 수밖에 없다. 사람들이 정보에 노출이 되면 그 정보에 관심이 생기게 되고, 이를 위해서 많은 곳에서 의도를 가지고 정보 노출을 많이 시키려고 돈을 들여가며 노력을 하는데, 하물며 하루에 가장 많은 시간을 소모하는 본인의 일과 관련된 정보라면 어떻겠는가. 심지어 본인이 약간의 의도를 가지고 탐색하려는 정보라면 더욱 그러하다. 그런데 그런 정보가 어디 있는 지 알고, 거기서 꺼내기만 하면 된다. 회사라는 곳은 어쩔 수 없이 어느 정도 효율성을 추구하는 곳이고, 그러다보니 직원들에게 정보를 제공하는 것이 좋다고 하더라도 모든 정보를 일일이 떠먹여 줄 수는 없다. 대신 정말 애초에 의도가 없는 곳이 아니면 계정을 얻어, 데이터베이스에 접속하는 방법 자체가 그렇게 어려운 일은 아니다. 정보를 어디서 얻어야 하는지가 너무 명확하다. 얼마나 좋은 환경인가.

게다가 대부분의 데이터베이스에서 활용하는 SQL이란 얼마나 유용한 것인가. 어디에서, 어떤 조건을 가진 무엇을 꺼내라고 명확하게 구조가 만들어져 있다. 이는 많은 검색엔진보다도 유용한데, 검색엔진은 엔진마다 문법이나 결과 구조가 다소 다른 데다가, 보통 ‘무엇’을 찾기만 쉽지 거기서 어떤 조건을 가진 것들에 대해서는 좀 복잡하고(물론 시간이나 이미지 크기 같은 자주 찾는 것은 드롭다운 메뉴 등으로 제공하지만 이도 경우마다 다르다) 설명을 찾는데도 한참 걸린다. 그리고 그렇게 나온 결과를 결국 눈으로 하나하나 봐가면서 걸러야 한다. 사전에 무엇을 찾는 지와 조건을 유사한 등급에서 사용하게 하는 SQL의 영리함이란. 심지어 많은 경우 코드를 쳐서 결과를 찾는 것이 안 익숙할 뿐이지 SQL의 체계는 (다른 프로그래밍 언어 대비) 훨씬 단순하고 사용하기도 쉽다. 데이터를 모아두는 테이블이 여러 개고 그 것들을 조합하거나 할 때 약간의 집합 개념을 사용하는 게 조금 익숙하지 않을 뿐이다(이 것은 많은 경우 집합을 대충 넘어간 중고등학교 교육과정의 탓이다.). 명확한 정보를 얻을 수 있는 방법도 정형화되어 있다. 본인이 하는 일에 대한 정보를 찾는 것이니, 그저 막연히 인터넷 서핑같은 식으로 보는 것도 아닐 것이다. 이를 적재적소에 잘 가공해서 사용하는 방법은 또 다른 이야기지만, 일단 많이 찾아서 보다 보면 그 이후에 하고 싶은 것에 대한 생각이 열린다. 그리고 그렇게 생각의 질의를 따라가는 법은, 처음 그 문을 여는 것에 비해서 훨씬 쉽다. 그런 것을 전문으로 하는 (나같은) 사람들도 있으니 그 때는 이런 사람들에게 물어보면 된다. 처음에 그저 질의 방법을 조금만 익힌다면, 최소한 일에서만이라도 훨씬 넓은 세계가 열릴 수 있다. 정말로 얼마나 좋은 환경인가.

정보의 불균형과 재분배, 어쩌면 영원한 숙제가 될 것이고 어쩌면 이 흐름에서는 나는 영원히 어느 정도 동떨어져서 계속 제자리만 뱅글뱅글 돌면서 여기저기 삽으로 팠다가 다시 묻는 과정에 에너지를 다 써버릴 지도 모르겠지만, 그리고 나같이 제자리에서 도는 사람이 아마도 여기저기 산재해 있겠지만, 최소한 본인이 하는 일터에서는 생각보다 명확한 정보를 얻는 것이 의외로 어렵지 않을 지도 모른다. 물론 그런 환경을 만드는 것은 의외로 쉬운 일은 아니고, 그래서 어려운 곳이라면 어쩔 수 없겠지만, 환경 개선을 추구해 볼 수 있다는 점에서 이 역시 최소한 ‘무엇을 해야 할 지’는 좀 더 명확해 진 것일게다. 혹시나 환경이 만들어진 곳이라면 충분히 활용하자. 질문을 어떻게 해야 할 지 익히는 것이, 아마도 다른 문제에 직면했을 때 ‘어디서 뭘 물어봐야 하지?’보다는 훨씬 쉬운 일일 것이다. 어차피 이번 생에 정보 불균형, 정보에서 소외되고 손해보는 일은 이젠 정말 지긋지긋하지만 여전히 앞으로도 넘치도록 많을 것이다. 그나마 일에서는 조금만 노력하면 이를 손쉽게 깰 수 있는데, 이를 시도하지 않을 이유가 없다.

    This post is licensed under CC BY 4.0 by the author.

    데이터셋을 만들고 모델링까지 한 번에 할 수 있지만 (feat. BQML)

    딥러닝과 바둑-번역 후기