Home
Cojette의 Data Wonderland
Cancel

서비스 분석에서의 대표성

샘플 수가 문제가 아니다. 신문 기사의 설문 통계 기사에서는 표본들을 자세히 보지 않으면 속는다는 이야기를 한다 (실생활에서의 통계 관련 고전 도서인 [새빨간 거짓말, 통계(How to lie with statistics)]에서 가장 먼저 등장하는 사례가 이 예제다(1)). 일반적으로 흔히 이야기하는 부분은 이런 것이다. ‘아니 겨우 몇 백명에...

머신 러닝에서 알고리즘 공부를 말할 때 내가 하고 싶은 이야기

AI Conference에서 인상 깊게 들은 talk으로 머신 러닝 계의 전설이 아닌 레전드 피터 노빅느님의 키노트가 있었다. 무수한 딥러닝/머신 러닝 프레임워크들이 등장하면서 AI 프로그램도 공장제;; 가 되었지만 여기서 간과되는 것이, 머신러닝을 일반 프로그래밍처럼 다루게 되는 것이다. 그래서 모델을 프로그램 짜는 양 만들고, 데이터 trainin...

201704-201706 책 로그

개인적으로 참 징글징글하게 다이나믹한 기간이었고, 그나마 몇 가지 위안 중에 하나는 책이었다. 책을 읽은 직후와 한참 후에 이렇게 다시 돌아보면 책에 대해 냉정해 지거나, 혹은 아예 인상에 안 남아서 기억마저 가물거리는 경우도 허다하다. 재미있지 않은가. (늘 그렇듯 추천은 볼드체로) 2017-04 [너무 시끄러운 고독] : 의...

O’Reilly AI Conference 3일차 후기

드디어 대망(?)의 3일차. Keynotes 2, 3일자 키노트는 유튜브에 다수 올라와 있으니 필요하신 분은 참고하세요. 키노트 답지 않게 상세한 설명을 해주는 학술적(?) 키노트가 많아서 좋았다. Magenta : Machine Learnin Creavity 첫 시작은 구글의 발표. 딥 러닝으로 예술 관련 프로젝트를 하는 마젠타 프로젝트에 ...

O’Reilly AI Conference 2일차 후기

드디어 메인인 세션 발표 날이다. Keynotes 키노트는 보통 1주일쯤 후(?) youtube에 무료로 공유되는 것으로 알고 있다. 키노트들 중 흥미로운 것들이 몇 개 있었으니 관심있으신 분들은 한 번 찾아보는 것을 권한다. Observations on the era 언제부턴가 데이터 관련 O’Reilly 의 간판이 된(?) Ben Loric...

O’Reilly AI Conference 1일차 후기

Prologue 정신을 차려보니 뉴욕에서 O’Reilly AI Conference에 참석하고 있는 자신이 있었다. 이것은 평행세계인가. O’Reilly 주관 Conference에 참석하는 것은 이 번이 세 번째. AI 컨퍼런스는(당연하게도) 처음이다.  Data 쪽 기업 컨퍼런스의 선두주자이며 이를 계속 유지하려고 하는 O’Reilly에서 AI...

Seniority 에 대한 단상

최근 사람들에게 많이 듣게 되는 이야기 중 하나가 ‘주니어신 줄 알았어요’ ‘어려보인다’, ‘젊게 사시는 것 같다(…)’, ‘그 나이인 줄 몰랐다’ 같은 이야기다. 물론 많은 성인들에게 어려 보인다는 이야기는 칭찬이지만, 보통 내가 하는 대답은 이렇다. ‘아하하. 어리게 봐주시는 건 감사하지만 웬지 그건 제가 철이 없고 허술해서 그런 지도 모르겠네요....

스승의 날의 단상

언젠가, TV에서 스타워즈가 방영했다. 조카는 바로 ‘막내 이모- ‘를 외치면서 나에게 이것저것 물어보았고, 나는 이런저런 설명을 해 주었다. 이 이야기를 지인들에게 하면서, 나는 ‘이렇게 알려줄 윗 세대 덕후가 없었어서 매우 힘들었고, 지금도 누군가에게 가르쳐 줄 때 어느 눈높이에 맞춰서 설명을 해주어야 할 지 모르겠다. 물론 가르쳐주려고 노력은...

201701-201703 책 로그

책 로그를 4달로 할까, 3달로 할까의 구분 기준은 3달간 40권 이상을 읽은 경우다 (한 달에 평균 10권을 읽는다고 가정했을 때. 한 번 나누면 1년 유지). 그런데 이번 3달은 (심지어 작년 12월의 남은 책을 빼고도) 어쩌다보니 40권이 넘어버려서 일단 정리하기로 했다. 딱히 많이 읽었다는 생각은 없었는데 그래도 꽤나 읽었구나. (늘 그렇...

머신 러닝, 인공지능, 그리고 데이터

몇 달 전 이 글에서도 언급한 적이 있지만, 인공지능에서 데이터가 왜 필요하냐, 데이터나 통계 하는 사람들은 머신러닝같은 거 나오면 못 쓰게 되지 않냐 하는 질문을 슬금슬금 들어왔고, 최근에는 정말 그 빈도가 매우 높아졌다. 그리고 내 대답은 일정하다. ‘데이터를 사용해서 문제를 풀어서 해답을 찾는 것에서, 최적의 방식은 문제에 따라 다르고, 그 방식...