콘텐츠로 이동

목적별 시각화 가이드

데이터로 전달하려는 메시지에 따라 적절한 차트 유형이 달라진다.

차트 유형 빠른 참조

목적 추천 차트 대안 피해야 할 것
시간에 따른 추세 라인 차트 영역 차트, 스파크라인 파이 차트
범주 비교 바 차트 점 차트(dot plot) 3D 바 차트
부분-전체 관계 스택 바, 트리맵 파이 차트(5개 이하) 3D 파이
분포 히스토그램, 박스플롯 바이올린 플롯, 밀도 플롯 바 차트
상관관계 산점도 버블 차트, 히트맵 라인 차트
지리적 패턴 코로플레스 지도 버블 맵, 히트맵 파이 차트 on 지도
전환/흐름 퍼널 차트, 산키 다이어그램 스택 바 라인 차트

1. 추세 파악 (Trend)

시간에 따른 변화를 보여줄 때 사용한다.

라인 차트 (Line Chart)

적합한 상황: - 연속적인 시계열 데이터 - 여러 시리즈 비교 (최대 5-7개) - 트렌드와 계절성 파악

주의점: - 시계열이 아닌 범주형 데이터에는 부적합 - 너무 많은 라인은 스파게티 차트가 됨 - Y축 0에서 시작하지 않으면 변화가 과장될 수 있음

좋은 예시:

월별 매출 추이
- X축: 시간 (월)
- Y축: 매출액 (0부터 시작)
- 라인: 올해 vs 작년 (2개 라인, 색상으로 구분)
- 제목: "올해 매출이 작년 대비 15% 증가"

나쁜 예시:

- 10개 제품의 라인을 모두 한 차트에
- Y축을 900에서 시작하여 작은 변화를 과장
- 범례가 차트 아래 작게 배치

영역 차트 (Area Chart)

적합한 상황: - 누적량을 강조하고 싶을 때 - 전체 대비 부분의 변화를 보여줄 때 (스택 영역)

주의점: - 비스택 영역 차트에서 겹침 발생 시 가독성 저하 - 스택 영역에서 아래 시리즈의 패턴 파악 어려움

유형 장점 단점
기본 영역 볼륨감 강조 겹침 시 가독성 저하
스택 영역 전체 대비 부분 표현 중간 시리즈 패턴 파악 어려움
100% 스택 영역 비율 변화 명확 절대값 파악 불가

2. 비교 (Comparison)

범주 간 크기를 비교할 때 사용한다.

바 차트 (Bar Chart)

적합한 상황: - 범주 간 값 비교 - 순위 표현 - 이름이 긴 범주 (가로 바)

주의점: - Y축은 반드시 0에서 시작 - 범주가 20개 이상이면 Top N만 표시 - 색상은 의미 있을 때만 구분

좋은 예시:

지역별 매출 비교
- 가로 바 차트 (지역명이 길어서)
- 내림차순 정렬
- 상위 10개 지역만 표시
- 모든 바 같은 색상 (순수 비교)
- 타겟 라인으로 목표 표시

나쁜 예시:

- 30개 지역 전부 표시 (읽기 어려움)
- 알파벳 순 정렬 (비교 어려움)
- 각 바마다 다른 색상 (의미 없는 구분)
- 3D 효과로 실제 길이 왜곡

그룹 바 vs 스택 바

유형 적합한 상황 부적합한 상황
그룹 바 하위 범주 간 직접 비교 하위 범주가 많을 때 (4개 이상)
스택 바 전체 크기 + 구성 동시 표현 하위 범주 정확한 비교 필요 시
100% 스택 바 비율 비교만 중요할 때 절대값도 중요할 때

점 차트 (Dot Plot / Cleveland Plot)

바 차트의 대안으로, 데이터-잉크 비율이 더 높다.

적합한 상황: - 범주가 많을 때 - 변화량(before/after) 표시 - 바의 시작점이 0이 아닐 때

3. 분포 (Distribution)

데이터의 퍼짐 정도와 형태를 보여줄 때 사용한다.

히스토그램 (Histogram)

적합한 상황: - 연속형 변수의 분포 파악 - 이상치, 다봉 분포 발견 - 단일 변수 탐색

주의점: - 빈(bin) 너비에 따라 모양이 달라짐 - 너무 좁으면 노이즈, 너무 넓으면 패턴 손실

실무 팁: - 빈 개수 경험 규칙: sqrt(n) 또는 Sturges' rule - 여러 빈 너비로 먼저 탐색 후 결정

박스플롯 (Box Plot)

적합한 상황: - 여러 그룹의 분포 비교 - 중앙값, 사분위수, 이상치 요약 - 공간 효율적 표현

구성 요소:

      이상치 (*)
         |
    ─────┬───── 최대값 (Q3 + 1.5*IQR 이내)
    ┌────┴────┐
    │         │
    │    ─    │ 중앙값 (Q2)
    │         │
    └────┬────┘
         │    └─ Q1 (25%)
    ─────┴───── 최소값 (Q1 - 1.5*IQR 이내)
      이상치 (*)

주의점: - 분포의 형태(다봉 등)는 보이지 않음 - 비전문가에게는 설명 필요

바이올린 플롯 (Violin Plot)

박스플롯 + 밀도 추정을 결합한 형태.

적합한 상황: - 분포의 형태(다봉 여부)가 중요할 때 - 기술 청중 대상

주의점: - 비전문가에게 직관적이지 않음 - 표본 크기 작으면 밀도 추정 불안정

4. 구성 (Composition)

전체 대비 부분의 비율을 보여줄 때 사용한다.

파이 차트 (Pie Chart)

적합한 상황 (매우 제한적): - 범주가 5개 이하 - 하나의 범주가 50% 이상으로 압도적일 때 - 청중이 비전문가이고 친숙함 중요

피해야 할 상황: - 범주 간 크기 비교가 중요할 때 - 범주가 6개 이상 - 시간에 따른 변화 표현

실무 팁: - 대부분의 경우 바 차트가 더 효과적 - 파이 차트를 쓸 거면 비율 레이블 필수

트리맵 (Treemap)

적합한 상황: - 계층 구조의 구성 표현 - 범주가 많을 때 (파이 대안) - 중첩된 부분-전체 관계

주의점: - 정확한 크기 비교 어려움 - 작은 영역의 레이블 가독성 문제

와플 차트 (Waffle Chart)

100개의 사각형으로 비율을 표현.

적합한 상황: - 단일 비율 강조 (예: "10명 중 3명") - 인포그래픽 - 비전문가 대상

5. 관계 (Relationship)

변수 간의 상관관계를 보여줄 때 사용한다.

산점도 (Scatter Plot)

적합한 상황: - 두 연속형 변수의 관계 - 상관관계, 클러스터, 이상치 파악 - 회귀선 추가로 추세 표현

주의점: - 점이 많으면 오버플로팅 발생 - 해결책: 투명도, 밀도 플롯, 샘플링

좋은 예시:

광고비와 매출의 관계
- X축: 광고비 (원인)
- Y축: 매출 (결과)
- 색상: 채널별 구분 (3개)
- 추세선: 전체 선형 회귀
- 제목: "광고비 100만원 증가당 매출 약 500만원 증가"

버블 차트 (Bubble Chart)

산점도에 세 번째 변수를 크기로 추가.

주의점: - 버블 크기는 면적 기준으로 스케일 - 버블이 겹치면 가독성 저하 - 최대 3개 변수 권장

히트맵 (Heatmap)

적합한 상황: - 두 범주형 변수의 조합별 값 - 상관관계 매트릭스 - 시간 x 범주 패턴 (요일별/시간별)

주의점: - 색상 스케일 선택 중요 (순차/발산) - 값 레이블 없으면 정확한 비교 어려움

6. 지리적 패턴 (Geospatial)

지리적 위치와 데이터를 연결할 때 사용한다.

코로플레스 지도 (Choropleth)

영역을 색상으로 채워 값을 표현.

적합한 상황: - 행정구역별 비율/밀도 데이터 - 지역 간 비교

주의점: - 면적이 큰 지역이 과대 표현됨 - 절대값보다 비율/밀도 사용 - 경계를 넘는 패턴은 표현 불가

좋은 예시:

시도별 인구 밀도
- 인구수(X) → 인구 밀도(O)
- 순차적 색상 스케일
- 범례 명확히 표시

버블 맵 (Bubble Map)

점의 크기로 값을 표현.

적합한 상황: - 절대값 표현 (인구수, 매출액) - 여러 카테고리 동시 표현 (색상)

주의점: - 버블 겹침 - 기저 지도가 혼잡해지지 않도록

7. 흐름/전환 (Flow)

단계별 전환이나 흐름을 보여줄 때 사용한다.

퍼널 차트 (Funnel Chart)

적합한 상황: - 전환율 분석 (마케팅, 영업) - 단계별 이탈 파악 - 순차적 프로세스

좋은 예시:

구매 퍼널
방문 (100%) → 상품조회 (60%) → 장바구니 (20%) → 결제 (8%)

각 단계에 전환율과 이탈률 표시
병목 구간 강조

산키 다이어그램 (Sankey Diagram)

적합한 상황: - 복잡한 흐름 표현 (에너지, 비용, 사용자 경로) - 여러 경로가 있는 전환

주의점: - 복잡하면 가독성 급락 - 노드 개수 제한 필요

차트 선택 의사결정 트리

질문: 무엇을 보여주고 싶은가?

├─ 시간에 따른 변화?
│   ├─ 단일 시리즈 → 라인 차트
│   ├─ 여러 시리즈 비교 → 다중 라인 (5개 이하)
│   └─ 누적 비교 → 스택 영역
├─ 범주 간 비교?
│   ├─ 단순 비교 → 바 차트
│   ├─ 하위 범주 포함 → 그룹 바 / 스택 바
│   └─ 많은 범주 → Top N + 기타
├─ 분포 파악?
│   ├─ 단일 변수 → 히스토그램
│   ├─ 그룹별 비교 → 박스플롯
│   └─ 형태도 중요 → 바이올린
├─ 부분-전체 관계?
│   ├─ 5개 이하 → 파이 (조심해서)
│   ├─ 계층 구조 → 트리맵
│   └─ 시간 변화 포함 → 스택 바
├─ 변수 간 관계?
│   ├─ 2개 연속형 → 산점도
│   ├─ 3개 변수 → 버블 차트
│   └─ 매트릭스 → 히트맵
├─ 지리적 패턴?
│   ├─ 비율/밀도 → 코로플레스
│   └─ 절대값 → 버블 맵
└─ 흐름/전환?
    ├─ 순차적 단계 → 퍼널
    └─ 복잡한 흐름 → 산키

실무 체크리스트

차트 완성 전 확인:

항목 체크
제목이 인사이트를 담고 있는가?
Y축이 0에서 시작하는가? (바/라인)
색상이 의미 있게 사용되었는가?
범례가 차트 가까이 있는가?
불필요한 장식이 제거되었는가?
출처가 명시되었는가?
타겟 청중이 이해할 수 있는가?