콘텐츠로 이동
Data Prep
상세

고객 분석 (Customer Analytics)

1. 개요

고객 분석은 고객 데이터를 분석하여 고객 행동, 선호도, 가치를 이해하고, 개인화된 경험 제공과 고객 관계 최적화를 위한 인사이트를 도출하는 분야.

정의

고객 분석 = 고객 데이터 + 비즈니스 인사이트

목적:
- 고객 이해 심화
- 고객 가치 극대화
- 이탈 방지 및 리텐션
- 개인화 경험 제공

고객 분석의 범위

영역 질문
세분화 고객 유형은 무엇인가?
가치 분석 고객의 가치는 얼마인가?
행동 분석 고객이 어떻게 행동하는가?
이탈 분석 왜, 언제 떠나는가?
만족도 고객 경험은 어떠한가?

2. 핵심 지표

2.1 고객 생애 가치 (CLV/LTV)

기본 공식:

LTV = ARPU × Gross Margin × Customer Lifespan

또는

LTV = (평균 구매액 × 구매 빈도 × 고객 수명) × 마진율

확률 모델 기반 LTV:

BG/NBD + Gamma-Gamma 모델:
- 구매 빈도 예측 (BG/NBD)
- 평균 구매액 예측 (Gamma-Gamma)

CLTV = Σₜ (E[거래수_t] × E[거래당 가치]) / (1+d)^t

2.2 리텐션 지표

지표 수식 설명
Retention Rate 잔존 고객 / 시작 고객 유지율
Churn Rate 1 - Retention Rate 이탈률
Customer Lifespan 1 / Churn Rate 평균 고객 수명
Repeat Purchase Rate 재구매 고객 / 전체 고객 재구매율

2.3 만족도 지표

NPS (Net Promoter Score):

"이 제품을 추천하시겠습니까?" (0-10)

Promoters (9-10): 추천자
Passives (7-8): 중립
Detractors (0-6): 비추천자

NPS = %Promoters - %Detractors

CSAT (Customer Satisfaction):

"서비스에 만족하십니까?" (1-5)

CSAT = 만족 응답 / 전체 응답

CES (Customer Effort Score):

"문제 해결이 얼마나 쉬웠습니까?"

낮을수록 좋음 (노력 적음)


3. 주요 분석 방법

3.1 고객 세분화 (Segmentation)

RFM 분석:

R (Recency): 마지막 구매 경과일
F (Frequency): 구매 횟수
M (Monetary): 총 구매액

각 변수 5분위 점수 → 세그먼트

세그먼트 특성 전략
VIP 최근, 자주, 많이 로열티 프로그램
Loyal 자주, 꾸준히 업셀/크로스셀
At Risk 과거 활발, 최근 감소 재활성화
New 최근 첫 구매 온보딩, 재구매 유도
Lost 오래 전 마지막 윈백 또는 제외

클러스터링 기반:

K-Means, Hierarchical Clustering
- 행동 패턴 기반
- 다차원 변수 활용
- 해석 가능한 세그먼트 정의

3.2 이탈 예측 (Churn Prediction)

모델링 접근:

타겟: 향후 N일 내 이탈 여부

피처:
- 행동 (활동 빈도, 참여도)
- 거래 (구매 패턴, 금액)
- 인구통계 (연령, 가입 기간)
- 서비스 (문의 이력, 불만)

모델: Logistic Regression, XGBoost, Neural Network

조기 경보 시스템:

이탈 점수 산출 → At-risk 세그먼트
→ 자동화된 리텐션 액션

3.3 고객 여정 분석

인지 → 고려 → 구매 → 사용 → 충성

각 단계별:
- 접점 (Touchpoint) 매핑
- 전환율 측정
- 마찰점 (Friction) 식별

3.4 바스켓 분석

연관 규칙 마이닝:

{기저귀} → {맥주}

지표:
- Support: P(A ∩ B)
- Confidence: P(B|A)
- Lift: P(B|A) / P(B)

Lift > 1: 양의 연관

3.5 코호트 분석

가입 시점별 그룹화 → 시간에 따른 행동 비교

코호트 유형:
- 시간 기반 (월별 가입)
- 행동 기반 (첫 구매 금액)
- 채널 기반 (획득 채널)

4. 실무 적용 사례

4.1 개인화 추천

고객 세그먼트별 추천 전략:
- VIP: 프리미엄 상품, 얼리 액세스
- 신규: 베스트셀러, 입문 상품
- 이탈 위험: 할인, 특별 혜택

개인화 수준:
- 세그먼트 기반
- 협업 필터링
- 1:1 개인화

4.2 이탈 방지 프로그램

파이프라인:
1. 이탈 예측 모델 (주간 스코어링)
2. At-risk 고객 식별 (상위 10%)
3. 맞춤형 리텐션 캠페인
4. 효과 측정 및 모델 개선

액션:
- 개인화 이메일
- 특별 할인
- CS 아웃바운드
- 제품 사용 가이드

4.3 고객 생애 가치 최적화

LTV 드라이버 분석:
- 첫 구매 금액과 LTV 상관
- 채널별 LTV 비교
- 초기 행동 지표 예측력

CAC:LTV 최적화:
- 고LTV 세그먼트 획득 집중
- 저LTV 세그먼트 비용 절감

4.4 VoC (Voice of Customer) 분석

텍스트 분석:
- 리뷰, 문의, 설문 자유응답
- 토픽 모델링
- 감성 분석

인사이트:
- 주요 불만 사항
- 제품 개선 아이디어
- 경쟁사 비교

5. 참고 자료

핵심 서적

서적 저자 주제
"Customer Centricity" Peter Fader 고객 중심 전략
"The Customer Centricity Playbook" Fader & Toms CLV 실무
"Predictive Analytics" Eric Siegel 예측 분석

주요 저널

저널 분야
Journal of Marketing 마케팅 연구
Harvard Business Review 비즈니스 적용
MIT Sloan Management Review CRM 전략

참고 논문

논문 저자 주제
"RFM Analysis: A Simple Tool for Targeting" Bult & Wansbeek RFM
"Counting Your Customers" Schmittlein et al. BG/NBD
"A Hierarchical Bayes Model of CLV" Fader et al. 확률적 CLV

6. 도구

도구 용도
lifetimes (Python) 확률적 CLV
mlxtend 연관 규칙
scikit-learn 클러스터링, 분류
Salesforce CDP 고객 데이터 플랫폼
Amplitude 행동 분석

lifetimes 예시

from lifetimes import BetaGeoFitter, GammaGammaFitter

# BG/NBD 모델 학습
bgf = BetaGeoFitter()
bgf.fit(data['frequency'], data['recency'], data['T'])

# 예상 구매 횟수
data['predicted_purchases'] = bgf.predict(
    t=30,  # 향후 30일
    frequency=data['frequency'],
    recency=data['recency'],
    T=data['T']
)

# Gamma-Gamma 모델 (금액)
ggf = GammaGammaFitter()
ggf.fit(data['frequency'], data['monetary_value'])

# CLV 예측
data['CLV'] = ggf.customer_lifetime_value(
    bgf,
    data['frequency'],
    data['recency'],
    data['T'],
    data['monetary_value'],
    time=12,  # 12개월
    discount_rate=0.01
)

7. 실무 프레임워크

고객 분석 체크리스트

영역 분석 항목
세분화 RFM, 클러스터링, 페르소나
가치 LTV 계산, LTV:CAC
이탈 이탈 패턴, 예측 모델
여정 터치포인트, 전환 퍼널
만족도 NPS, CSAT, VoC