데이터를 보는 사람에게 추천하는 교양서

여름이다. 사람들이 휴가를 내고 책을 읽기 좋은 계절이다.

전부터 ‘읽을 만한 책을 추천해 주세요’라는 이야기를 어쩌다보니 그럭저럭 듣는 편이다. 특히 ‘데이터 분석가가 읽을 만한 책을 추천해 주세요’라는 이야기는 꽤나 많이 듣게 되는데, 이는 어쩔 수 없이 나의 직업과 취미가 합쳐졌을 때의 효과일 것이다. 그리고 그런 이야기를 아주 조금 더 많이 듣게 되는 계절이다. (요즘에는 책을 너무 안 읽어서 조금 부끄럽지만) 그래도 그나마 책 추천은 자신있고, 다행히도 세상에는 타겟이 정해져 있을 때 추천할 만한 좋은 책은 잔뜩 있다. 보통은 책을 추천할 때 그 상대방을 고려해야 하는데다가 세상 사람들의 취향을 파악하는 것이란 꽤나 어려운 작업 중 하나여서 책 추천에 자신이 없지만, 기본적으로 ‘데이터를 보는 사람’들이 읽어서 나쁠 게 없는 책들은 몇 개 추천할 수 있겠다 싶었다. 더불어 같은 질문에 여러 번 같은 답을 하는 것도 꽤나 번거로우므로 (…) 이 김에 아예 한 번 정리를 해보도록 하자.

여기서의 범위는 교양서다. 전문적인 지식은 교과서같은 책에 더 잘 나와있고, 그런 책은 나보다 더 잘 추천할 수 있는 사람들이 있기도 할 것이다. 여기서 이야기하려는 책은 그런 책은 아니다. 그러다보니 어떤 전문적인 이야기보다는 데이터를 보는 사람들에게 있어서 가장 중요한 자세인 ‘논리적이며 수학적인 사고’에 대한 책을 중심으로 골랐다. 그래서 꼭 ‘분석가’만이 아니더라도 누구에게나 좋은 책이라고 생각하지만, ‘데이터를 보는’사람들이라면 좀 더 재밌게 읽을 수 있고, 좀 더 많은 도움이 되지 않을까.

(여기에 소개한 모든 책과 어떤 금전적인 연관관계도 없습니다.)

새빨간 거짓말, 통계

(대럴 허프 저, 박영훈 역, 더불어책, 2004)

이 책은 이 바닥(?)의 고전으로, 이상하게 국내에서는 덜 알려져 있는 듯 하다. 하지만 만약 이런 책 딱 한 권만 추천하라고 하면 이 책을 추천할 것이고, 사실 여기서 가장 쉬우며 필수적인(?) 내용의 책이라 이 리스트에서 가장 유명하면 좋겠다 . 정말 누구에게나 추천하고 싶은 책이다. ‘통계로 장난친다’라면서 한 번이라도 화 낸 적이 있으시다면 일단 읽어보시라. 쉬우면서도 필수적으로 알아두면 사는 데 피가 되고 살이 될 내용(예: 신문 지면의 차트 보는 방법 등)이 가득 들어있는데다 얇기까지 하다.

괴짜경제학

(스티븐 레빗, 스티븐 더브너 저, 안진환 역, 웅진지식하우스, 2007)

‘데이터’라는 분야와 직접적인 연관이 없을 것 같은 이름들을 가졌지만 의외로 관련이 많은 학문 두 가지가 있으니 하나는 경제학이요 하나는 물리학인데, 이 두 학문이 사실은 인간의 활동에서 이루어지는 이라든가 세상에 존재하는 것들의 이치를 다루고 있기 때문이다. 그래서 깊이까지는 아니라도 알아두면 다 피가 되고 살이 되는데, 그 중에서도 이 책을 추천하는 이유는, 문제 해결에 있어서 수많은 ‘이럴 리가 없을텐데’ 하는 것에도 사실은 그런 일이 일어나고 있었고 그런 일에도 다 원인과 결과가 있다는 것을 재밌고 명쾌하게 알려주기 때문이다. 이 책도 이제는 좀 되어서 다음 버전 책도 나오고 여기저기 많이 인용해서 신기한 게 없을 수도 있지만 그럼에도 불구하고 한 번은 볼만한 명작이라고 생각한다.

링크

(앨버트 라블로 바라바시 저, 강병남, 김기훈 역, 동아시아, 2002)

데이터 분석을 하다 보면 아마도 ‘네트워크’‘관계망 분석’ 이런 이야기를 안 들어볼 수는 없을 터. (어쩌다 운이 좋게 아직 안 들었다면 언젠가는 들을 것이다. ) 물론 그냥 데이터로 어찌어찌 이으면 그만이겠지만 그래도 그런 네트워크가 세상에서 어떻게 생겨나고 어떤 성질이 있는 지, 그 구조로 세상을 어떻게 이해할 수 있는 지에 대해서 조금 더 재밌게 생각해 볼 수 있다면 더 좋을 것이다. 이 책은 이런 생각의 가이드로 쓰기에 딱 적절한 책이다.

팩트풀니스

(한스 로슬링, 올라 로슬링, 안나 로슬링 뢸룬드 저, 이창신 역, 김영사, 2019)

어쩌다 좀 된 책들만 추천하고 있는데 그 중 신간에 아마도 여기서 가장 많이 팔렸을 것 같은 베스트셀러. 물론 이 것은 한스 로슬링이 국내 방문도 했었던 유명한 통계/시각화 석학이자 TED로 널리 알려진 스타기 때문일 것이다. 그래서 이 책이 나온다고 할 때도 꽤나 기대를 하고 있었지만, 책은 기대보다 훨씬 더 좋았다. 이 책은 세계에 대한 시각을 보정해 주는 책인데, 그러면서 사람들이 가지고 있는 편향들에 대해서 설명하고, 이로 일어나는 현상과 해결법에 대해서도 편하게 설명해주고 있다. 그런데 이런 확증편향은 거시적인 세계에 대한 관점만이 아니라 일상에서 늘 일어나는 일이고, 어떤 문제를 분석하고 해결하는 데 있어서 매번 마주쳐야 하는 지긋지긋한 것이며, 심지어 우리도 가지고 있는 문제점이다. 자기 생각을 근거없이 몰아붙이는 데 쓰여서 지겨운 ‘팩트’라는 단어를 제대로 쓰면서 문제를 해결하고 싶다면, 이 책을 필히 읽어보자.

틀리지 않는 법

(조던 엘렌버그 저, 김명남 역, 열린책들, 2016)

이 책은 내가 정말 좋아하며 아끼는 책 중 하나다. 내용들도 정말 좋으며 어느 하나 빼놓을 것이 없으며, 나도 종종 잊는 이야기들도 많아서 가끔씩 다시 보면서 기억을 되살리려고 노력한다. 매년 한 번씩은 읽어야지 하고 생각했지만 그러지는 못했다. 그리고 그렇게 좋아하고 훌륭한 책이라고 찬탄을 하면서도 쉽게 추천은 하기 어려운 게, 책이 두껍다.(한글 종이책 기준 616페이지) 더불어 내용도 여기 나온 다른 책들에 비해 아주 조금 더 어렵다. 하지만 그럼에도 불구하고, 이 책은 ‘일상에서의 수학적 사고’에 대한 끝판왕이라고 생각하며, 정말로 일상 생활에서 ‘수학적으로 사고’하며 ‘틀리지 않는’ 법에 대해서 뚜렷이 보여준다.

데이터 분석은 기본적으로 ‘문제 해결 과정’이며, 그 과정에서 무수한 문제 정의와 가정이 들어가는데, 그 사이에서 많은 사람들은 혼란을 일으키게 된다. 데이터 분석가 타이틀을 달고 있어도 그러기는 마찬가지라, 그러다보면 데이터를 다 구하고 멋진 알고리즘을 돌려봤지만 결국 그 것들이 잘못된 선택이었고, 해결된 답은 쓸 수 없다. 그래서 전문적 지식만큼 중요한 것이 논리적 사고와 문제 해결 능력이다. 그런 의미에서 여기서 이야기한 책들은 이런 사고를 함양하기에 정말 좋은 책이라고 자신있게 이야기할 수 있다. 그리고 이런 능력은 이런 일에서만 필요한 것은 분명 아닐 것이다.

그런 의미에서 무덥고 습한 날 시원한 에어컨 밑에서, 이런 책들이 짚어내는 이야기에 놀랍고 상쾌해지는 기분을 느끼면서 가벼운 피서를 보내보는 것도 좋지 않을까.

Written on August 16, 2019