목적별 시각화 가이드¶
데이터로 전달하려는 메시지에 따라 적절한 차트 유형이 달라진다.
차트 유형 빠른 참조¶
| 목적 | 추천 차트 | 대안 | 피해야 할 것 |
|---|---|---|---|
| 시간에 따른 추세 | 라인 차트 | 영역 차트, 스파크라인 | 파이 차트 |
| 범주 비교 | 바 차트 | 점 차트(dot plot) | 3D 바 차트 |
| 부분-전체 관계 | 스택 바, 트리맵 | 파이 차트(5개 이하) | 3D 파이 |
| 분포 | 히스토그램, 박스플롯 | 바이올린 플롯, 밀도 플롯 | 바 차트 |
| 상관관계 | 산점도 | 버블 차트, 히트맵 | 라인 차트 |
| 지리적 패턴 | 코로플레스 지도 | 버블 맵, 히트맵 | 파이 차트 on 지도 |
| 전환/흐름 | 퍼널 차트, 산키 다이어그램 | 스택 바 | 라인 차트 |
1. 추세 파악 (Trend)¶
시간에 따른 변화를 보여줄 때 사용한다.
라인 차트 (Line Chart)¶
적합한 상황: - 연속적인 시계열 데이터 - 여러 시리즈 비교 (최대 5-7개) - 트렌드와 계절성 파악
주의점: - 시계열이 아닌 범주형 데이터에는 부적합 - 너무 많은 라인은 스파게티 차트가 됨 - Y축 0에서 시작하지 않으면 변화가 과장될 수 있음
좋은 예시:
월별 매출 추이
- X축: 시간 (월)
- Y축: 매출액 (0부터 시작)
- 라인: 올해 vs 작년 (2개 라인, 색상으로 구분)
- 제목: "올해 매출이 작년 대비 15% 증가"
나쁜 예시:
영역 차트 (Area Chart)¶
적합한 상황: - 누적량을 강조하고 싶을 때 - 전체 대비 부분의 변화를 보여줄 때 (스택 영역)
주의점: - 비스택 영역 차트에서 겹침 발생 시 가독성 저하 - 스택 영역에서 아래 시리즈의 패턴 파악 어려움
| 유형 | 장점 | 단점 |
|---|---|---|
| 기본 영역 | 볼륨감 강조 | 겹침 시 가독성 저하 |
| 스택 영역 | 전체 대비 부분 표현 | 중간 시리즈 패턴 파악 어려움 |
| 100% 스택 영역 | 비율 변화 명확 | 절대값 파악 불가 |
2. 비교 (Comparison)¶
범주 간 크기를 비교할 때 사용한다.
바 차트 (Bar Chart)¶
적합한 상황: - 범주 간 값 비교 - 순위 표현 - 이름이 긴 범주 (가로 바)
주의점: - Y축은 반드시 0에서 시작 - 범주가 20개 이상이면 Top N만 표시 - 색상은 의미 있을 때만 구분
좋은 예시:
나쁜 예시:
그룹 바 vs 스택 바¶
| 유형 | 적합한 상황 | 부적합한 상황 |
|---|---|---|
| 그룹 바 | 하위 범주 간 직접 비교 | 하위 범주가 많을 때 (4개 이상) |
| 스택 바 | 전체 크기 + 구성 동시 표현 | 하위 범주 정확한 비교 필요 시 |
| 100% 스택 바 | 비율 비교만 중요할 때 | 절대값도 중요할 때 |
점 차트 (Dot Plot / Cleveland Plot)¶
바 차트의 대안으로, 데이터-잉크 비율이 더 높다.
적합한 상황: - 범주가 많을 때 - 변화량(before/after) 표시 - 바의 시작점이 0이 아닐 때
3. 분포 (Distribution)¶
데이터의 퍼짐 정도와 형태를 보여줄 때 사용한다.
히스토그램 (Histogram)¶
적합한 상황: - 연속형 변수의 분포 파악 - 이상치, 다봉 분포 발견 - 단일 변수 탐색
주의점: - 빈(bin) 너비에 따라 모양이 달라짐 - 너무 좁으면 노이즈, 너무 넓으면 패턴 손실
실무 팁: - 빈 개수 경험 규칙: sqrt(n) 또는 Sturges' rule - 여러 빈 너비로 먼저 탐색 후 결정
박스플롯 (Box Plot)¶
적합한 상황: - 여러 그룹의 분포 비교 - 중앙값, 사분위수, 이상치 요약 - 공간 효율적 표현
구성 요소:
이상치 (*)
|
─────┬───── 최대값 (Q3 + 1.5*IQR 이내)
│
┌────┴────┐
│ │
│ ─ │ 중앙값 (Q2)
│ │
└────┬────┘
│ └─ Q1 (25%)
─────┴───── 최소값 (Q1 - 1.5*IQR 이내)
│
이상치 (*)
주의점: - 분포의 형태(다봉 등)는 보이지 않음 - 비전문가에게는 설명 필요
바이올린 플롯 (Violin Plot)¶
박스플롯 + 밀도 추정을 결합한 형태.
적합한 상황: - 분포의 형태(다봉 여부)가 중요할 때 - 기술 청중 대상
주의점: - 비전문가에게 직관적이지 않음 - 표본 크기 작으면 밀도 추정 불안정
4. 구성 (Composition)¶
전체 대비 부분의 비율을 보여줄 때 사용한다.
파이 차트 (Pie Chart)¶
적합한 상황 (매우 제한적): - 범주가 5개 이하 - 하나의 범주가 50% 이상으로 압도적일 때 - 청중이 비전문가이고 친숙함 중요
피해야 할 상황: - 범주 간 크기 비교가 중요할 때 - 범주가 6개 이상 - 시간에 따른 변화 표현
실무 팁: - 대부분의 경우 바 차트가 더 효과적 - 파이 차트를 쓸 거면 비율 레이블 필수
트리맵 (Treemap)¶
적합한 상황: - 계층 구조의 구성 표현 - 범주가 많을 때 (파이 대안) - 중첩된 부분-전체 관계
주의점: - 정확한 크기 비교 어려움 - 작은 영역의 레이블 가독성 문제
와플 차트 (Waffle Chart)¶
100개의 사각형으로 비율을 표현.
적합한 상황: - 단일 비율 강조 (예: "10명 중 3명") - 인포그래픽 - 비전문가 대상
5. 관계 (Relationship)¶
변수 간의 상관관계를 보여줄 때 사용한다.
산점도 (Scatter Plot)¶
적합한 상황: - 두 연속형 변수의 관계 - 상관관계, 클러스터, 이상치 파악 - 회귀선 추가로 추세 표현
주의점: - 점이 많으면 오버플로팅 발생 - 해결책: 투명도, 밀도 플롯, 샘플링
좋은 예시:
광고비와 매출의 관계
- X축: 광고비 (원인)
- Y축: 매출 (결과)
- 색상: 채널별 구분 (3개)
- 추세선: 전체 선형 회귀
- 제목: "광고비 100만원 증가당 매출 약 500만원 증가"
버블 차트 (Bubble Chart)¶
산점도에 세 번째 변수를 크기로 추가.
주의점: - 버블 크기는 면적 기준으로 스케일 - 버블이 겹치면 가독성 저하 - 최대 3개 변수 권장
히트맵 (Heatmap)¶
적합한 상황: - 두 범주형 변수의 조합별 값 - 상관관계 매트릭스 - 시간 x 범주 패턴 (요일별/시간별)
주의점: - 색상 스케일 선택 중요 (순차/발산) - 값 레이블 없으면 정확한 비교 어려움
6. 지리적 패턴 (Geospatial)¶
지리적 위치와 데이터를 연결할 때 사용한다.
코로플레스 지도 (Choropleth)¶
영역을 색상으로 채워 값을 표현.
적합한 상황: - 행정구역별 비율/밀도 데이터 - 지역 간 비교
주의점: - 면적이 큰 지역이 과대 표현됨 - 절대값보다 비율/밀도 사용 - 경계를 넘는 패턴은 표현 불가
좋은 예시:
버블 맵 (Bubble Map)¶
점의 크기로 값을 표현.
적합한 상황: - 절대값 표현 (인구수, 매출액) - 여러 카테고리 동시 표현 (색상)
주의점: - 버블 겹침 - 기저 지도가 혼잡해지지 않도록
7. 흐름/전환 (Flow)¶
단계별 전환이나 흐름을 보여줄 때 사용한다.
퍼널 차트 (Funnel Chart)¶
적합한 상황: - 전환율 분석 (마케팅, 영업) - 단계별 이탈 파악 - 순차적 프로세스
좋은 예시:
산키 다이어그램 (Sankey Diagram)¶
적합한 상황: - 복잡한 흐름 표현 (에너지, 비용, 사용자 경로) - 여러 경로가 있는 전환
주의점: - 복잡하면 가독성 급락 - 노드 개수 제한 필요
차트 선택 의사결정 트리¶
질문: 무엇을 보여주고 싶은가?
├─ 시간에 따른 변화?
│ ├─ 단일 시리즈 → 라인 차트
│ ├─ 여러 시리즈 비교 → 다중 라인 (5개 이하)
│ └─ 누적 비교 → 스택 영역
│
├─ 범주 간 비교?
│ ├─ 단순 비교 → 바 차트
│ ├─ 하위 범주 포함 → 그룹 바 / 스택 바
│ └─ 많은 범주 → Top N + 기타
│
├─ 분포 파악?
│ ├─ 단일 변수 → 히스토그램
│ ├─ 그룹별 비교 → 박스플롯
│ └─ 형태도 중요 → 바이올린
│
├─ 부분-전체 관계?
│ ├─ 5개 이하 → 파이 (조심해서)
│ ├─ 계층 구조 → 트리맵
│ └─ 시간 변화 포함 → 스택 바
│
├─ 변수 간 관계?
│ ├─ 2개 연속형 → 산점도
│ ├─ 3개 변수 → 버블 차트
│ └─ 매트릭스 → 히트맵
│
├─ 지리적 패턴?
│ ├─ 비율/밀도 → 코로플레스
│ └─ 절대값 → 버블 맵
│
└─ 흐름/전환?
├─ 순차적 단계 → 퍼널
└─ 복잡한 흐름 → 산키
실무 체크리스트¶
차트 완성 전 확인:
| 항목 | 체크 |
|---|---|
| 제목이 인사이트를 담고 있는가? | |
| Y축이 0에서 시작하는가? (바/라인) | |
| 색상이 의미 있게 사용되었는가? | |
| 범례가 차트 가까이 있는가? | |
| 불필요한 장식이 제거되었는가? | |
| 출처가 명시되었는가? | |
| 타겟 청중이 이해할 수 있는가? |