Home
Cojette의 Data Wonderland
Cancel

에반게리온 신칸센 탑승자를 위한 안내서

몇 달 전, 일본에서 에반게리온 신칸센이 나온다는 기사를 보았다. 그것을 보고 마침 휴가가 남아서 어디든 떠나고 싶었던 나는 ‘어머 이건 타야 해.’ 를 외치면서, 일본어를 하나도 못 함에도 불구하고 기사 및 무수한 웹사이트를 구글 번역기를 돌려가면서 자세한 정체 및 탑승 신청 방법을 알아냈다(정리 내용 링크). 그리고 넘치는 잉여력과 몇 안 되는 본...

개인 정보 바로 알기

사회적으로 ‘데이터’에 대한 이슈와 가능성이 많이 알려지면서 데이터를 어떻게 활용해야 하고 어디에 쓰면 되고 등의 이야기가 많이 거론되고, 이에 대한 관심도 높아졌다. 그리고 그러면서 데이터가 더욱 풍부하게 사용되는 미래에 대한 여러가지 관점이 나타난다. 혹자는 보다 편리한 장밋빛 미래를 꿈꾸기도 하고, 혹자는 [1984]의 ‘빅브라더’가 실재할 것이...

베이즈 이론이 푸리에 정리를 만났을 때

조제프 푸리에(Joseph Fourier)는 토마스 베이즈(Thomas Bayes)를 한 번도 만난 적이 없다. 푸리에는 베이즈가 사망한 지 7년 후인 1768년에 태어났다. 하지만 최근 베이즈 필터와 푸리에 변환 간의 어떤 연결고리가 있지 않을까 하는 생각이 들어, 관련 내용을 찾아보게 되었다. 베이즈 필터라는 건, 베이지안 분류기를 사용해서 스팸...

Non Standard Evaluation in R

Prologue  R은 기본적으로 ‘연산’을 위한 도구다보니, 계산을 통해서 어떤 ‘값’을 구하고 그 ‘값’을 처리하는 것을 위주로 만들어졌다. 하지만 이게 어찌어찌하다보니 이제는 나름 일종의 ‘프로그래밍 언어’로 등극하게 되고,파이썬 등과 비교당하는 위치에까지 올라서게 된다. 우와. (물론 나는 이런 비교는 그다지 좋아하지는 않는다만.) 어쨌든 나...

Data Hackerthon-단기 데이터 분석에 대한 소고

Strata Conference가 끝나고, 메일로 질문을 몇 개 받았는데 그에 대해 답을 주다가 어찌어찌 하다보니 한 메일을 준 분과 그 메일 쓰레드에 같이 참조되었던 사람들과 동시에 짧은 시간에 데이터를 뒤져서 인사이트를 뽑아내는 작업을 할 기회가 있었다. 대략 시간은 10시간. JSON으로 된 로그 파일과 간단한 로그 설명 파일을 넘겨받고 이를 멋...

The thrilling adventures of LOVELACE and BABBAGE

‘러브레이스와 배비지가 분석 엔진(차등기계(difference engine)라고도 알려짐. 컴퓨터의 초기 모형)을 만든 이야기에 대한 게 그래픽 노블로 나왔다’라는 사실을 어디선가 접하고 울고 있었는데, 마침 컨퍼런스차 영국에 갈 일이 생겼다. 그리고 런던서 뵌 모 님께서는 영국의 거대한 서점 Foyles를 알려주시면서 ‘러브레이스 책 있는 건 확...

얼불노 6권에 대한 베이지안 예측

본 포스팅은 http://arxiv.org/abs/1409.5830 의 논문을 요약 번역한 것입니다. 얼불노를 안 읽고 안 봤어도 단번에 씐나게 번역/요약했다. 개념 설명도 꼼꼼하게 되어 있고 무엇보다 내용이 흥미로운 논문. 이런 논문 다이스키. 문제 설명 조지 R.R. 마틴의 [얼음과 불의 노래] (이하 [얼불노] )는 현재 5권까지 나...

GOOGLE SPREADSHEET에서 SCRIPT 사용하기

로컬 컴퓨터에서 사용하기 가장 좋은 통계 도구라면 개인적으로는 “MS Excel”이라고 제창하는 바지만, 간혹 회사별 보안 프로그램에 걸린다든가 공유가 불편하다든가 하는 점이 있어서 이에 대한 대안으로 많이 사용하는 것이 Google Spreadsheet이다. 하지만 아무래도 Excel보다는 기능에 제약이 많고 일부 함수의 경우에는 구현이 안 되어 ...

Doing Data Science (책)

데이터로 무언가를 하는 것에 관심있으신 분들, 진지하게 이 책 추천드립니다. 이 책 꼭 보세요. 두 번 보세요. 수학 기반이든 전산 기반이든 혹은 저처럼 잡과(…) 기반이든, 이미 데이터 업무를 많이 하신 분이든 관심이 있는데 뭘 봐야 할 지 모르겠는 분이든 이제 데이터 쪽에 발을 들여놓으신 분들이든 누구든 상관없이 한 번 꼭 봐서 나쁠 것 없는,...

데이터 계산 언어로서의 R

업무에서 주로 R을 사용하고, R 번역서를 두 권 냈음에도 불구하고, R이라는 언어에 대해서는 항상 의구심과 애증이 존재한다. 다른 프로그래밍 언어와는 좀 다르다보니, 이게 관점에 따라서는 불완전하다는 느낌도 들고, 지저분하다는 느낌도 들며, 특히 다른 프로그래밍언어의 개념에 조금이라도 익숙하다면 불편하고 답답하기 그지 없어진다. 그래서 이제는 굉장히...