고객 분석 (Customer Analytics)¶
1. 개요¶
고객 분석은 고객 데이터를 분석하여 고객 행동, 선호도, 가치를 이해하고, 개인화된 경험 제공과 고객 관계 최적화를 위한 인사이트를 도출하는 분야.
정의¶
고객 분석의 범위¶
| 영역 | 질문 |
|---|---|
| 세분화 | 고객 유형은 무엇인가? |
| 가치 분석 | 고객의 가치는 얼마인가? |
| 행동 분석 | 고객이 어떻게 행동하는가? |
| 이탈 분석 | 왜, 언제 떠나는가? |
| 만족도 | 고객 경험은 어떠한가? |
2. 핵심 지표¶
2.1 고객 생애 가치 (CLV/LTV)¶
기본 공식:
확률 모델 기반 LTV:
BG/NBD + Gamma-Gamma 모델:
- 구매 빈도 예측 (BG/NBD)
- 평균 구매액 예측 (Gamma-Gamma)
CLTV = Σₜ (E[거래수_t] × E[거래당 가치]) / (1+d)^t
2.2 리텐션 지표¶
| 지표 | 수식 | 설명 |
|---|---|---|
| Retention Rate | 잔존 고객 / 시작 고객 | 유지율 |
| Churn Rate | 1 - Retention Rate | 이탈률 |
| Customer Lifespan | 1 / Churn Rate | 평균 고객 수명 |
| Repeat Purchase Rate | 재구매 고객 / 전체 고객 | 재구매율 |
2.3 만족도 지표¶
NPS (Net Promoter Score):
"이 제품을 추천하시겠습니까?" (0-10)
Promoters (9-10): 추천자
Passives (7-8): 중립
Detractors (0-6): 비추천자
NPS = %Promoters - %Detractors
CSAT (Customer Satisfaction):
CES (Customer Effort Score):
3. 주요 분석 방법¶
3.1 고객 세분화 (Segmentation)¶
RFM 분석:
| 세그먼트 | 특성 | 전략 |
|---|---|---|
| VIP | 최근, 자주, 많이 | 로열티 프로그램 |
| Loyal | 자주, 꾸준히 | 업셀/크로스셀 |
| At Risk | 과거 활발, 최근 감소 | 재활성화 |
| New | 최근 첫 구매 | 온보딩, 재구매 유도 |
| Lost | 오래 전 마지막 | 윈백 또는 제외 |
클러스터링 기반:
3.2 이탈 예측 (Churn Prediction)¶
모델링 접근:
타겟: 향후 N일 내 이탈 여부
피처:
- 행동 (활동 빈도, 참여도)
- 거래 (구매 패턴, 금액)
- 인구통계 (연령, 가입 기간)
- 서비스 (문의 이력, 불만)
모델: Logistic Regression, XGBoost, Neural Network
조기 경보 시스템:
3.3 고객 여정 분석¶
3.4 바스켓 분석¶
연관 규칙 마이닝:
3.5 코호트 분석¶
4. 실무 적용 사례¶
4.1 개인화 추천¶
고객 세그먼트별 추천 전략:
- VIP: 프리미엄 상품, 얼리 액세스
- 신규: 베스트셀러, 입문 상품
- 이탈 위험: 할인, 특별 혜택
개인화 수준:
- 세그먼트 기반
- 협업 필터링
- 1:1 개인화
4.2 이탈 방지 프로그램¶
파이프라인:
1. 이탈 예측 모델 (주간 스코어링)
2. At-risk 고객 식별 (상위 10%)
3. 맞춤형 리텐션 캠페인
4. 효과 측정 및 모델 개선
액션:
- 개인화 이메일
- 특별 할인
- CS 아웃바운드
- 제품 사용 가이드
4.3 고객 생애 가치 최적화¶
LTV 드라이버 분석:
- 첫 구매 금액과 LTV 상관
- 채널별 LTV 비교
- 초기 행동 지표 예측력
CAC:LTV 최적화:
- 고LTV 세그먼트 획득 집중
- 저LTV 세그먼트 비용 절감
4.4 VoC (Voice of Customer) 분석¶
5. 참고 자료¶
핵심 서적¶
| 서적 | 저자 | 주제 |
|---|---|---|
| "Customer Centricity" | Peter Fader | 고객 중심 전략 |
| "The Customer Centricity Playbook" | Fader & Toms | CLV 실무 |
| "Predictive Analytics" | Eric Siegel | 예측 분석 |
주요 저널¶
| 저널 | 분야 |
|---|---|
| Journal of Marketing | 마케팅 연구 |
| Harvard Business Review | 비즈니스 적용 |
| MIT Sloan Management Review | CRM 전략 |
참고 논문¶
| 논문 | 저자 | 주제 |
|---|---|---|
| "RFM Analysis: A Simple Tool for Targeting" | Bult & Wansbeek | RFM |
| "Counting Your Customers" | Schmittlein et al. | BG/NBD |
| "A Hierarchical Bayes Model of CLV" | Fader et al. | 확률적 CLV |
6. 도구¶
| 도구 | 용도 |
|---|---|
| lifetimes (Python) | 확률적 CLV |
| mlxtend | 연관 규칙 |
| scikit-learn | 클러스터링, 분류 |
| Salesforce CDP | 고객 데이터 플랫폼 |
| Amplitude | 행동 분석 |
lifetimes 예시¶
from lifetimes import BetaGeoFitter, GammaGammaFitter
# BG/NBD 모델 학습
bgf = BetaGeoFitter()
bgf.fit(data['frequency'], data['recency'], data['T'])
# 예상 구매 횟수
data['predicted_purchases'] = bgf.predict(
t=30, # 향후 30일
frequency=data['frequency'],
recency=data['recency'],
T=data['T']
)
# Gamma-Gamma 모델 (금액)
ggf = GammaGammaFitter()
ggf.fit(data['frequency'], data['monetary_value'])
# CLV 예측
data['CLV'] = ggf.customer_lifetime_value(
bgf,
data['frequency'],
data['recency'],
data['T'],
data['monetary_value'],
time=12, # 12개월
discount_rate=0.01
)
7. 실무 프레임워크¶
고객 분석 체크리스트¶
| 영역 | 분석 항목 |
|---|---|
| 세분화 | RFM, 클러스터링, 페르소나 |
| 가치 | LTV 계산, LTV:CAC |
| 이탈 | 이탈 패턴, 예측 모델 |
| 여정 | 터치포인트, 전환 퍼널 |
| 만족도 | NPS, CSAT, VoC |