리뷰/Book

책 리뷰 "넘버스 숫자가 당신을 지배한다"

스위트스팟 2014. 5. 2. 15:50
반응형

Big Data가 화두입니다. 얼마전 미국의 Target이란 소매업체에서 여학생에게 임신관련 용품 프로모션을 진행하여, 아버지가 회사를 고발하는 사례가 있었는데, 알고보니 여고생이 임신했다고 하죠. Target은 여성이 임신했을때 사는 상품과 기타 구매패턴을 조합하여 '임신 여부'를 판별하는 데이타 모델을 만들었을거라 생각됩니다. 어떻게 보면 편리하기도 하지만 반대로는 무서운 세상이기도 하죠. 어떠한 형태이던 개인의 행동패턴이 모니터 되고 있고, 변화를 감지하여 조치가 되는 식이니까요. 

 

 

 

이러한 데이터를 활용한 방법론에 저변에는 '통계'라는 학문이 있는걸 모두 아실겁니다. 개인적으로는 고등학교때 통계부분은 시험에 잘 출제 안되는 부분으로 소홀히 하였고, 대학교에서도 심화학습을 하지 않아 한동안 멀리 떨어져 있었죠. 그런데 최근  몇년사이에 중요성을 절실히 깨닫고 있는 중입니다. 통계와 비지니스가 결합되어 고도의 정량적 분석을 통해 정밀한 의사결정을 내릴수 있는거죠.

 

오늘 소개해 드릴 책, 카이저 펑의 넘버스, 숫자가 당신을 지배한다는 이러한 통계에 대해 심화이해, 이면의 이야기를 알고자 하고자 하는 분들께 권하는 책입니다.

 

 

책의 내용범위에 대해 먼저 알려드리면, 책은 통계 이론을 적극적으로 알려주지 않습니다. 오히려 어느정도 통계에 대해 이해가 있다는 가정을 하고 이야기를 풀어가죠 (예를 들어, p-value가 뭔지, 베이지안 확률은 뭔지 등입니다.) 그래서 이런 내용을 접하시지 않았다면 다소 어려울수도 있을듯합니다. 그럼에도 제가 추천하는 이유는...

 

통계분석 / 데이터 분석에서 나타나는 오류에 대한 이해

책은 data-based 의사결정을 위한 모델링의 맹점은 물론, 통계 현황 자체를 이해하는 데 있어 어떤 오류가 발생할 수 있는지 설명해 줍니다. 또 숫자를 분석함에 있어 통계학자의 View를 제공합니다. 아래는 책에서 발췌한 내용입니다.

 

"평균화는 다양성을 짓밟고, 무엇이든 가장 단순무식한 개념으로 축소시켜 버린다. 이 과정에서 우리는 평균을 앞세워서 다양성을 무시하거나 회피하는 과대 단순화의 위험에 빠지게 된다."

 

"거짓 양성반응", "거짓 음성 반응"의 오류

 

제가 알기로 대부분의 통계모델(ex 회귀모형)은 거짓 양성반응에 집중하는데, 저자는 거직 음성 반응(통계적 2종오류) 예를 들어, 실제 범인인데 결과적으로 범인이 아니라고 나올 오류에 대해 설명해 준답니다.그리고 거직  양성 반응, 범인이 아닌데 범인이라고 결로지을 오류 (통계적 1종오류) 와의 관계도 자세하게 알려줍니다. 그래서 책에서 1명의 테러범을 잡기위해(실제적으로는 놓치는 오류를 범하지 않기 위해) 수백/수천명의 무고한 시민이 테러범으로 혐의에 오른다고도 합니다.  1종오류와 2종오류에 대한 설명은 아래 표를 보세요.

 

실제 무고한 시민을 테러범이 아니라고 하는건 당연하고, 테러범을 테러범이라고 잡는 경우도 당연합니다. 그런데, 통계적 접근법은 실제 무고한 시민을 테러범이라고 할수도 있고 (1종오류), 테러범을 무고한 시민이라고 결론 내릴수도 있습니다 (2종오류)

 

 실제 무고한 시민

실제 테러범 

 통계분석 결과로 테러범이 아니라고 결론지음

 OK

2종 오류 

 통계분석 결과로 테러범이라고 결론지음

 1종 오류

OK 

생생한 Case Study를 바탕으로 한 이해도

저자는 디즈니랜드 줄서기, 대장균 발병, 신용평점 시스템, SAT시험, 도핑테스트, 거짓말 탐지기, 비행기 추락사고, 복권 당첨을 주제로 과거에 문제가 되었던 사례를 세세하며 묘사하며, 문제가 발생과 해결에 있어 통계적 해석이 적용되는 과정을 잘 설명해 줍니다. 마치 각각 사례에 대해 case study식으로요. 그리고 마지막장에서 다시한번 이 케이스들을 토대로 요약된 통계해석의 인사이트를 제시해 줍니다. 

 

데이터 분석에 관심이 많으신가요? 그럼 한번쯤 넘버스 숫자가 당신을 지배한다를 읽어보길 추천드립니다.

 

 

*카이저 펑: 미국의 데이터 분석, visualization, infographics 전문가. Harvard MBA, Princeton 졸업.


 

 

도움이 되었나요? 그럼 '추천'버튼 클릭주세요

반응형