세미나 광고 이미지
  • 데이터 분석
  • 로그인 전용

RFM 고객 세분화 분석에서 합리적으로 기준을 잡는 방법

세미나 광고 이미지
세미나 광고 이미지
지금 간편하게 로그인하고 전문성 있는 정보를 확인해보세요.

데이터 분석가들이 직접 쓰는 다른 로그인 전용 글들도 무제한으로 이용할 수 있습니다.

 
 
안녕하세요 👋🏻 데이터리안에서 수강생 분들의 프로젝트 피드백을 드리고 있는 데이터 분석 캠프 멘토, 데이터 분석가 윤선미입니다.
피드백을 드리다보니까 대부분의 수강생 분들이 RFM 분석을 할 때 R, F, M 각각의 기준을 어떻게 잡고 몇 개의 그룹으로 나누어야 하는지 결정하는걸 가장 어려워하시더라구요. 아마 실무를 하시는 분들도 마찬가지일 것이라고 생각합니다. 그래서 이 글을 통해 RFM 기준을 합리적으로 잡기 위한 가이드라인을 드리려고 합니다.
이 글에서는 RFM 고객 세분화 분석의 기초에 대해서 다루지 않으니까 혹시 RFM 고객 세분화 분석이 처음이신 분들은 데이터리안의 보민님이 작성해주신 이전 글 ‘RFM 고객 세분화 분석이란 무엇일까요’를 먼저 읽어주세요.
 

RFM 고객 세분화 분석은 ‘인사이트’를 내기 위한 분석이 아니다

좀 뜬금없게 느껴질 수 있겠지만 이 얘기를 먼저 해야 할 것 같습니다. RFM 고객 세분화 분석은 ‘인사이트’를 내기 위한 분석이 아닙니다. 농담 반 진담 반으로 데이터 분석을 많이 해보지 않은 조직, 사람을 한 번에 알아보는 방법이 있습니다. 바로 ‘인사이트’라는 단어를 들었을 때 진저리를 치느냐 아니냐인데요. ‘인사이트’라는 단어를 좋아하면 초보자, 싫어하면 고인물이라고 생각합니다.
많은 초보자들이 데이터 분석을 ‘데이터를 이리저리 분석을 하다보면 멋진 인사이트를 발견할 수 있는’ 무언가 정도로 생각합니다. 데이터 분석 문화가 성숙하지 않은 조직 또한 ‘데이터 분석가를 뽑았으니까, 우리가 놀랄만한 멋진 인사이트를 가져와’라는 태도로 데이터 분석가를 대합니다. 물론 우리가 몰랐던 멋진 인사이트를 데이터 호수에서 헤엄치다 우연히 구하게 될 수도 있지만 데이터 분석가가 하는 일, 특히 성과가 나는 일의 대부분은 분석의 목적이 명확하게 있습니다.
RFM 고객 세분화 분석도 마찬가지로 명확한 목적이 있습니다. 보통은 CRM(Customer relationship management) 마케팅을 하기 위해 많이 합니다. CRM이란 아래 설명과 같이 고객 데이터 분석을 통해 고객과 서비스간에 좋은 관계를 만들기 위한 활동들을 통칭하는 용어입니다.
Customer relationship management(CRM) is a process in which a business or other organization administers its interactions with customers, typically using data analysis to study large amounts of information. - 위키피디아 Customer Relationship Management
간단한 예시로 할인 문자, 카카오톡 메시지도 CRM 마케팅 활동의 일환으로 볼 수 있습니다. 고객을 세분화하면 각 그룹별로 메시지의 내용을 다르게 하여 더 효과적으로 고객의 반응을 이끌어낼 수 있습니다. 고객을 세분화 하는 방법에 여러가지가 있지만(요즘에는 머신 러닝도 있습니다), 가장 쉽고 직관적인 방법 중에 하나가 RFM 세분화입니다.
 
notion image
notion image
 
특히 취업, 이직을 위한 분석 포트폴리오 용도로 RFM 분석을 하시는 분들이 기준을 세울 때 어려움을 느끼는 이유가 이 분석의 목적이 없기 때문입니다.
 
 

R(Recency)

R은 이 고객이 얼마나 최근에 방문했는지를 보여주는 지표입니다. 흔히 프로젝트를 하시는 분들이 하는 실수를 예를 들어 보여드리겠습니다.
 
  1. 고객들이 현재를 기준으로 얼마나 오랫동안 방문하지 않았는지를 계산
  1. 최근에 방문한 사람 순으로 줄을 세움
  1. 각 그룹에 비슷한 인원의 사람이 포함될 수 있도록 쪼개 N개의 그룹 만들기
 
만약 3개의 그룹으로 만들기 위해 33%씩 방문한 사람을 쪼갰다고 가정을 해보겠습니다. 여기에서 33%는 얼핏보면 의미가 있는 숫자처럼 보이지만 사실은 아무 의미가 없습니다. 누군가가 이런 질문을 했다고 생각해봅시다. ‘이 그룹이 상위 20%가 아니라 33%여야 하는 이유는 무엇인가요?’ 분석의 목적이 없는 상태에서 기준을 세웠기 때문에 기준에 대해 합리적인 설명을 할 수 없습니다.
분석의 목적을 세워보겠습니다. RFM 분석을 통해 고객 관리 메시지를 보내려고 합니다. 특히 이미 떠나간 고객들 또는 떠나갈 조짐이 보이는 고객들에게 우리 서비스를 리마인드하기 위해 할인 쿠폰을 발송하려고 합니다. 그러면 R 기준을 위 분석과 다르게 세울 수 있습니다. ‘떠나간 고객’, ‘떠나갈 조짐이 있는 고객’을 분석을 통해 정의할 수 있기 때문입니다. 예를 들어 우리 서비스는 의류를 판매하는 서비스로 계절에 한 번씩 고객들이 방문합니다. 특히 여름과 겨울 직전에는 방문을 하는데, 데이터 분석을 해보니 평균적인 서비스 방문 주기가 6개월 정도로 형성이 되어있습니다. 그러면 6개월보다 더 오랫동안 방문하지 않은 고객을 ‘떠나간 고객’, 6개월까지는 아닌데 최근 3개월에 방문을 안 한 고객을 ‘떠나갈 조짐이 있는 고객’, 지금 계절 옷을 판매하는 동안에 다녀간 고객은 ‘활성화 고객’으로 정의할 수 있을거예요. R(Recency)의 기준이 합리적으로 정해졌습니다. (사실 이 분석은 이탈 분석이라는 심오한 세계로도 이어집니다. 좀 더 깊게 공부해보고 싶다면 이탈 기준 정하기를 참고해주세요.)
데이터를 다룰 때에는 항상 ‘이 분석의 목적이 뭘까?’에 대해 생각하고 있어야 합니다. 위에서 예를 들었던 33%와 같이 숫자를 위한 숫자를 만드는건 데이터 분석이 아닙니다.
 
 

F(Frequency)

F는 고객이 자주 구매하고 있는지를 보여주는 지표입니다. F의 기준을 정할 때에도 R과 비슷한 실수를 많이 합니다.
 
  1. 고객들이 얼마나 자주 구매했는지 계산
  1. 자주 구매한 사람 순으로 줄을 세움
  1. 각 그룹에 비슷한 인원의 사람이 포함될 수 있도록 쪼개 N개의 그룹 만들기
 
자 이제는 글을 읽는 분들에게도 문제가 보이죠! 분석의 목적을 세워보겠습니다.
RFM 분석을 통해서 고객 관리 메시지를 보내려고 하는데요. 자주 방문하는 고객과, 자주 방문하지는 않는 고객을 나누어서 보고 싶어요.
특히 자주 방문하지 않는 고객들에게 생필품과 같이 자주 방문을 할 수 있게 만드는 상품군 노출을 늘리기 위해 할인 쿠폰을 보내주고 싶습니다. 자주 방문은 하는데 구매 금액이 높지 않은 고객들에게는 전자 제품과 같이 수익성이 좋은 상품을 추가적으로 노출해주고 싶어요.
 
이런 목적이 있는 경우에는 생필품을 주로 구매하는 고객들의 방문 주기를 계산해 F의 기준으로 삼아볼 수 있을겁니다. 분석을 하다보면 ‘사실 생필품을 주로 구매하고 사이트에 자주 방문하는 충성 고객들이 전자제품도 다른 고객들보다 많이 구매하고 있습니다’와 같은 결론을 낼 수도 있겠지요. 그렇다면 기존의 분석 목적을 약간 수정해볼 수도 있을거예요.
그리고 F 지표에 대해서 한 가지 더 얘기하고 싶은 점이 있습니다. RFM 분석을 한다고 해서 꼭 R, F, M 세 가지 기준으로 분석을 할 필요는 없습니다. 나의 분석 목적에 F가 필요 없다면 빼도 됩니다. 어쩌면 당연한 말인데 처음 하시는 분들은 RFM이라는게 어떤 공식처럼 느껴져서 꼭 세 가지를 지켜야 한다고 생각하시기도 하더라구요. 분석 프레임워크는 목적에 맞는 분석을 효율적으로 하기 위해 있는 도구이지, 꼭 지켜야만 하는 규율이 아닙니다. 데이터 분석 방법에 정답은 없어요. ‘뭐시 중헌디?’라고 물어본다면 ‘오로지 분석의 목적만이 중허다!’라고 답하겠습니다. 나머지는 목적을 달성하기 위한 도구일 뿐이에요. 유연하게 생각해주세요 🧘🏻‍♀️
 
 

M(Monetary)

요즘 캠프 수강생 분들과 함께하는 독서모임인 데벨챌에서 <컨버티드: 마음을 훔치는 데이터분석의 기술>을 읽고 있는데요. ‘가치가 높은 고객을 만나라’, ‘모든 사람은 평등하지 않다’라고 하며 고객 당 매출 분석의 중요성에 대해서 책 전반에 걸쳐 얘기하더라구요. 고객 당 매출을 분석하면 우리 서비스에 결제를 많이 하고 있는 충성 고객인지, 아니면 결제는 별로 없는 고객인지를 분류해 각 그룹에게 적절한 메시지를 줄 수 있습니다.
혹시 2080 법칙이라고도 불리는 파레토 법칙을 아시나요? 이탈리아 인구의 20%가 이탈리아 전체 부의 80%를 가지고 있다고 주장한 이탈리아의 경제학자 빌프레도 파레토의 이름에서 따온 법칙이라고 하는데, 놀랍게도 서비스의 매출도 비슷한 경향을 보입니다. <컨버티드: 마음을 훔치는 데이터분석의 기술> 책의 ‘Chapter 8. 데이터로 현실을 파악하라’를 보면 이런 데이터가 나옵니다. 상위 20%의 고객 집단이 전체 매출의 81%를 점유하고 있습니다.
 
세분 고객 집단
1인당 평균 가치
총 가치
매출 점유율
1
3,200달러
283,200,000달러
81%
2
350달러
30,975,000달러
9%
3
200달러
17,700,000달러
5%
4
120달러
10,620,000달러
3%
5
80달러
7,080,000달러
2%
 
심지어 모바일 애플리케이션에서 애플은 앱스토어 청구 금액의 95.2%가 8퍼센트 미만의 고객 계정에서 발생한다고 하네요! 서비스가 어떤 산업군에 속해있느냐에 따라 상세 수치에는 차이가 있을 수 있지만 요는 모든 고객이 똑같은 고객이 아니라는 것입니다.
이와 같이 M의 기준을 잡을 때에는 전체 매출액에서 고객 집단이 차지하는 비중을 보아야 합니다. 전체 매출의 대부분을 차지하는 특정 고객층, 중간 고객층, 가장 낮은 금액을 구매하는 층을 구분하는 것을 목표로 데이터 분석을 해보고 합리적인 기준을 잡아보길 바랍니다. ‘남들은 어떻게 하나 👀’ 궁금하다면 레퍼런스 서비스의 VIP 등급표를 보는 것도 좋은 방법입니다. 예를 들어, 프리미엄 고객을 대상으로 하는 리테일 서비스를 하고 있다면 백화점 VIP 등급표를 참고해볼 수도 있을거예요.
 
 

마무리

지금까지 R, F, M의 기준을 잡는 방법에 대해서 얘기해봤습니다. 겸사겸사 프로젝트 피드백을 해드리면서 얹는 잔소리들도 글로 적어보았네요. 앞으로 데이터 분석을 하시는데 도움이 됐으면 좋겠습니다.
막간을 이용해 홍보를 해볼게요 😊 이 글은 실제 프로젝트 피드백을 드린 내용을 재구성한 것입니다. 이런 피드백을 받으면서 프로젝트를 만들어보고 싶다면 데이터리안의 SQL 캠프에 합류하세요!
윤선미데이터 분석가

어느새 7년차 데이터 분석가이고, 4년째 데이터 분석 교육을 하고 있습니다. 데이터리안 멤버들과 함께 일하면서 데이터의 힘을 더 믿게 되었습니다.

함께 읽어보면 좋은 글

주식회사 데이터리안