세미나 광고 이미지
  • 추천 자료
  • 데이터 분석
  • 로그인 전용

데이터 분석을 시작할 때 꼭 읽어봐야할 책 5권

세미나 광고 이미지
세미나 광고 이미지
지금 간편하게 로그인하고 전문성 있는 정보를 확인해보세요.

데이터 분석가들이 직접 쓰는 다른 로그인 전용 글들도 무제한으로 이용할 수 있습니다.

안녕하세요 데이터 분석가 보민입니다.
데이터 분석가로 일을 시작한 후 매년 꾸준히 데이터 분석가를 꿈꾸는 학생분들, 취준생 분들을 만나 이야기를 나누고 있는데요. 대학교에서 강연을 하거나 외부 행사에서 강연을 하고 나면 Q&A 시간에 꼭 나오는 질문 중 하나가 추천 도서에 대한 질문이더라고요.
notion image
그동안 데이터리안에서 여러 가지 테마로 데이터 분석과 관련된 좋은 책들을 추천해왔는데요. 데이터 분석을 ‘시작’하는 분들을 위한 책 추천은 따로 하지 않았던 것 같아서 이번 글에서는 데이터 분석을 시작하는 사람에게 추천하는 책 5권을 추천해보려고 합니다.
그런데 여러분 그거 아시나요? 입문자를 위한 책을 추천하는 것이 가장 어려운 일이라는 것을요… 입문자를 위한 책은 유익하면서도 방향성을 제시해 줄 수 있어야 하며, 무엇보다도 재미(!)가 있어야 하거든요. 공부를 시작할 때도 첫인상이 좋아야 이후로 꾸준히 공부를 해나갈 수 있기 때문인데요.
그래서 오늘은 제가 그동안 읽었던 책들 중에서 가장 쉽고 재미있으면서도 데이터 분석 커리어 또는 실무에 도움이 되는 책들을 선정해 보았어요. 사람마다 책의 난이도에 대해 느끼는 편차가 있을 수 있지만, 아주 주관적인 제 점수와 책 소개를 참고하여 나에게 맞는 좋은 책들을 발견하실 수 있길 바랍니다.
 
 

데이터 분석과 친해지고 싶다면

데이터 읽기의 기술 (난이도 ⭐)

 
notion image
 
데이터 분석이라고 하면 거대한 IT 기업만 사용할 것 같은 뭔가 멋지고 대단한 것이라는 생각이 드시나요? 그렇다면 이 책을 꼭 한 번 읽어보시면 좋겠습니다.
이 책은 스타벅스 코리아 1호 데이터 사이언티스트 차현나님이 쓰신 책인데요. 책에서는 우리가 일상생활에서 쉽게 접할 수 있는 상황들을 예로 들어 평소에 우리가 무심코 지나치는 것들 속에 데이터가 어떻게 숨어있는지, 왜 기업은 그 데이터를 활용해야 하는지, 기업이 성장하기 위해서는 데이터를 어떻게 활용해보면 좋은지 쉽고 명료하게 설명해 주고 있습니다.
사실 어떤 분야를 새롭게 공부해 보겠다고 마음을 먹었을 때, 가장 시도해 보기 쉬운 것은 통계, SQL, 파이썬 같은 툴과 기술을 배우고 습득하는 것입니다. 하지만 제가 현업에서 데이터 분석가로 일하며 살펴보니 이 분야에서 빠르게 성장하는 분들은 단순히 도구를 잘 다루거나 스킬이 뛰어난 분들이 아니라 ‘왜 데이터 분석을 해야 하는지’를 잘 알고 있는 분들이었던 것 같습니다.
그런 의미에서 다양한 예시를 통해 ‘왜 데이터 분석을 해야 하는지’를 알려주는 이 책은 데이터 분석에 이제 막 관심이 생기기 시작한 모든 분들에게 좋은 길잡이가 되어줄 수 있지 않을까 싶네요.
 
영수증 데이터가 있다는 것, 특히 결제 POS가 있다는 것은 오프라인에 매장을 가지고 있다는 의미일 것이다. 오프라인 매장에서 소비자가 받아든 영수증 안에는 기업이 쌓게 될 데이터 정보가 담겨 있다. 이 영수증 안의 데이터만 분석해도 기업은 소비자의 많은 부분을 이해할 수 있다.
그런데 의외로 이 내부 데이터를 충분히 분석하는 회사가 많지 않다. (중략) 사실 올해/이달/오늘 매출이 작년/전달/어제보다 좋다면 데이터 분석이 필요 없을 수도 있다. 계속 성장하는 중이니까. 그런데, 사실은 좀 더 가파르게 성장할 수 있었던 건 아닐까? 잘나가다가 갑자기 매출이 꺾였다면 왜 그런지 그 이유를 설명할 수 있을까?
거창한 솔루션을 들여오는 데 시간과 돈을 낭비하지 말고, 기본이 되는 영수증 데이터 속에서 소비자의 마음을 찾아보는 연습을 해야 한다.
_ ‘소비자의 마음은 영수증 한 장에 들어있다’ 중에서
 
 

업계 선배들의 노하우를 해킹하고 싶다면

월스트리트저널 인포그래픽 가이드 (난이도 ⭐)

 
notion image
 
데이터 시각화에 대해 이야기하다 보면 이런 질문을 종종 받습니다. “차트는 그냥 숫자만 잘 표시되면 되는 거 아니에요?”, “데이터 시각화는 도대체 어떻게 해야 잘하는 건가요?” 라는 질문을 주시는데요. 이런 궁금증이 있는 분들은 아마 이 책을 아직 읽어보지 못한 분들일 것 같아요.
정말 잘 만든 데이터 시각화 자료를 만나면 ‘와.. 잘 만든 차트 하나가 열장의 분석 보고서보다 낫구나’라는 생각을 하게 되는데요. 막상 내가 그런 차트를 만들려고 하면 어디서부터 어떻게 손을 대야하는지 난감하기만 합니다. 역설적이게도 ‘데이터 시각화’는 정해진 기준이 하나도 없고, 무엇이든 할 수 있기 때문에 더 막막한 분야이거든요. 이렇게 막막할 때는 선배들의 노하우를 훔쳐보는 것도 좋은 공부가 될 수 있습니다.
‘월스트리트저널 인포그래픽 가이드’를 쓴 작가 인포그래픽 전문가 도나 M. 웡은 뉴욕타임스, 월스트리트저널 등 유수 언론사에서 20년 이상 경험을 쌓은 데이터 분석 및 시각화 전문가인데요. 20년이 넘는 시간 동안 저자가 쌓아온 데이터 시각화 노하우를 책 한 권으로 손쉽게 엿볼 수 있다는 건 정말 행운이라고 생각합니다.
사실 이 책은 이미 너무나도 유명하고, 데이터 시각화계의 바이블이라고 해도 과언이 아닐 책이라서 제가 굳이 소개를 해드려야 할지 고민을 잠깐 했었는데요. 이제 막 데이터 분석 공부를 시작하신 분들이라면 이 멋진 시각화 가이드에 대해 모르시는 분들도 있을 것 같아서 추천 도서 리스트에 넣어보았어요.
 
이 책의 목표는 독자에게 좋은 차트와 나쁜 차트를 평가할 수 있는 중요한 잣대를 제공하는 데 있다. 이 책을 다 읽을 때쯤이면 도표라는 의사소통 수단을 능숙하고 효과적으로 사용할 수 있게 될 것이다.
나는 이 책이 언제나 여러분 책상의 한자리를 지키게 됐으면 좋겠다.
_ 책 ‘서문’ 중에서
 
 

컨버티드: 마음을 훔치는 데이터분석의 기술 (난이도 ⭐⭐)

 
notion image
 
이 책의 저자인 ‘닐 호인’은 세계 최고의 구글 데이터분석팀을 총괄하며 최대 매출을 만들어낸 전설적인 데이터분석 전략가입니다. 리츠칼튼, 익스피디아 등 2,500개가 넘는 글로벌 기업을 대상으로 고객 경로 분석 및 마케팅 전략을 설계했고, 이를 통해 구매 전환율을 400퍼센트 이상 수직 상승시켰다고 해요.
보이지 않는 고객에게 대화를 걸고 관계를 쌓아가나가는 방법부터 실무에서 유용하게 활용할 수 있는 고객생애가치 분석법까지 그동안 구글에서 직접 시행착오를 겪으면서 배운 생생한 사례들과 노하우를 공유해주는 책입니다. 책의 부제는 ‘마음을 훔치는 데이터분석의 기술’이지만, 데이터를 보는 ‘기술’과 더불어 데이터를 보는 사람이 가져야 할 ‘마음가짐과 태도’에 대해서도 이야기를 많이 합니다. 그래서 기술 관련 서적처럼 공부하면서 읽기보다는 자기계발서처럼 가볍게 읽어볼 수도 있는 책이기도 합니다.
모든 책이 그렇겠지만 특히나 이 책은 연차가 올라갈수록, 회사 내에서 권한과 책임이 커질수록 공감하고 이해할 수 있는 부분이 더 많아지는 것 같습니다. 지금 당장 책 내용이 이해가 잘 안 된다고 해도 실망할 필요 없어요. 나중에 시간이 흘러 책을 다시 한번 읽게 되면 ‘이게 이런 뜻이었구나’ 깨닫게 되는 순간이 올 수도 있으니까요. 지금은 그저 선배들은 이런 고민까지 하고 있구나 가볍게 생각하고 넘어가셔도 괜찮습니다.
 
기업은 쌓여가는 데이터에 파묻혀 그들과의 관계를 소원하게 생각하지만, 오히려 고객은 이전보다 온라인에서 관계 맺기를 더욱더 원하고 있습니다. 이제 고객을 단순히 홈페이지의 방문객이 아니라 친구로 만들어야 할 때입니다. 그러기 위해서는 어떻게 해야 할까요? 바로 고객이 진짜 원하는 것에 관심을 가지고 지속해서 관계를 만들어나가야 합니다.
이 관계가 오래되고 진실할수록 마케팅의 힘은 더욱 강력해집니다. 데이터 분석은 이를 위한 든든한 재료일 뿐 전부가 돼서는 안됩니다. (중략)
이 책을 읽고 나면 어떻게 장기적인 인간관계를 토대로 사업을 전개할지, 어떻게 데이터로 최고의 고객을 발견할 수 있는지, 어떻게 지금과 같은 예외적인 시대에 고객의 니즈를 충족할 사업이나 회사를 만들 수 있는지 알게 될겁니다.
_’한국어판 서문’ 중에서
 
 

남들과 조금 다른 결과를 만들고 싶다면

새빨간 거짓말, 통계 (난이도 ⭐⭐⭐)

 
notion image
 
여러분, 혹시 거짓말 해본 적 있으신가요? 이 글을 읽고 계신 분들은 모두 양심적인 분들일 거라 아마 일부러 거짓말을 하는 분은 없으리라고 생각합니다. 그런데 데이터 분석을 하다보면 의도치 않게 거짓말을 하게 될 때도 있는데요. 바로 통계적인 오류에 빠지는 경우가 그런 경우죠.
이 책은 직접 데이터 분석을 하는 사람 뿐만 아니라 ‘나는 데이터 분석가가 아니니까 통계는 몰라도 상관 없어’라고 생각하시는 분들도 꼭 보시면 좋을 만한 책인데요. 이 책에서 알려주는 통계적인 오류들은 업무에서뿐만 아니라 우리의 일상생활에서도 너무나 빈번하게 일어나는 오류들이기 때문이에요.
신문 기사에 나온 통계적인 수치와 도표들에 어떤 오류들이 숨어있는지, 거짓된 통계에 속지 않으려면 어떤 것들을 유의해서 데이터를 보아야 하는지 궁금하다면 이 책을 꼭 읽어보면 좋겠습니다.
 
평균, 상관관계, 경향, 그래프 등등은 항상 눈에 나타나는 그대로가 아니다. 눈으로 보는 그 이상의 뜻이 포함되어 있을지도 모르고, 또 어쩌면 별 다른 뜻이 없을 수도 있다.
이 책은 통계를 써서 어떻게 사람을 속일 수 있는지에 관한 입문서와 같다. 어쩌면 사기꾼을 위한 사전과도 흡사하다. (중략) 도둑이라면 이미 알고 있는 트릭이기는 하지만 정직한 일반 사람들이 속아 넘어가지 않기 위한 안내서가 될 수 있기 때문이다.
_ ‘프롤로그’ 중에서
 
🔥
이 책 혼자서는 끝까지 읽기 어려울 것 같아 망설이고 있다면,
4월 한 달 동안 데이터넥스트레벨챌린지에서 데이터 분석에 관심 있는 다양한 사람들과 함께 책 읽고 이야기 나눠요.
 
 

빅데이터 시대, 성과를 이끌어내는 데이터 문해력 (난이도 ⭐⭐⭐)

 
notion image
 
글자로 된 기록을 읽고 그 안에 담긴 정보를 이해하는 능력을 ‘문해력’이라고 하죠. ‘데이터 리터러시’라고도 불리는 ‘데이터 문해력은’ 말 그대로 데이터 안에 담긴 정보를 이해하는 능력을 말하는데요. 이전에는 문자로 모든 지식이 공유되던 시대에 글을 읽고 해석할 수 있는 능력을 갖춘 사람이 더 뛰어난 성과를 내는 시대였다면, 이제는 데이터를 해석하는 능력을 갖춘 사람들이 더 뛰어난 성과를 내는 시대가 되어가고 있는 것 같습니다.
사실 데이터를 가공하여 합계를 계산하는 방법, 가공된 데이터의 수치를 표시하는 법은 누구나 가르칠 수 있지만 그 데이터를 왜 그런 방식으로 가공해야만 하는지, 그 수치를 어떻게 해석해야 하는지를 알려주는 것은 정말 어려운 일인데요. 그 어려운 일을 이 책이 해냅니다..!
이 책은 데이터라는 ‘도구’를 이용해서 성과를 내기 위해 꼭 알아야 하는 데이터 활용 방법을 단계별로 자세히 소개해 주고 있습니다. 진짜 중요한 문제를 풀기 위해서는 어떤 부분을 고민해 봐야 하는지, 데이터 분석을 할 때 자주 하는 실수, 빠지기 쉬운 딜레마에는 어떤 것들이 있는지를 구체적인 예를 들어 설명해 주는데요.
데이터 분석 프로젝트로 포트폴리오를 만들고 계시거나, 실무에서 데이터를 활용해 성과를 내고 싶은 분이라면 누구든 이 책을 재밌게 읽을 수 있을 거예요.
 
“데이터 분석 자체가 목적이 되기 십상이다.”
이것은 필자가 절실히 느끼는 부분입니다. 데이터와 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않습니다. 어디까지나 하고 싶은 말과 해결하고 싶은 것이 있기 때문에 이러한 목적에 대한 인프라나 도구로서 데이터를 활용하는 것입니다. 인프라와 도구가 단독으로 일을 성사시킬 수는 없습니다.
독자 여러분에게 ‘기존의 데이터 독해법, 분석법(데이터 중심 접근)’에 대한 기술이나 고난도의 방법론이 아니라 자신의 목적과 문제를 올바른 데이터로 적절히 활용해서 가치 있는 결과물을 낼 수 있도록 하는 사고방식과 기술을 소개하고자 합니다.
_ ‘이 책에서 전하고자 하는 메시지’ 중에서
 
 

데이터 분석과 조금 더 친해질 준비 되셨나요

이번 글에서는 데이터 분석에 대해 이제 막 알아가보려고 하는 분들을 위한 추천 도서 5권을 소개해 드렸습니다. 책 소개만 읽었는데도 어쩐지 데이터와 조금 친해진 느낌이 들지 않으시나요? 오늘 추천해드린 책들을 모두 읽고 나면 여러분은 멀게만 느껴졌던 ‘데이터’ 그리고 ‘데이터 분석’과 부쩍 친해질 수 있을거에요.
혹시 제가 소개해드린 책을 읽어보고는 싶은데 혼자서 책 한권을 끝까지 읽기가 너무 어렵다 하시는 분들은 온라인으로 다양한 사람들과 함께 책을 읽을 수 있는 데이터넥스트레벨챌린지도 한번 살펴보세요. 3기 챌린지에서는 『새빨간 거짓말, 통계』를 함께 읽어볼 예정입니다.
 
 
이전 기수 챌린지 참여자분들의 후기가 궁금하신 분들은 데이터넥스트레벨 챌린지 1기 회고 - 데이터 문해력, 챌린지 2기 회고 - 컨버티드를 참고해 주세요.
이보민데이터 분석가

채용 플랫폼 잡플래닛에서 데이터 분석가로 일했습니다. 지금은 데이터리안에서 마케터 겸 데이터 분석가로 일하고 있습니다.

함께 읽어보면 좋은 글

주식회사 데이터리안