공공 데이터 소스¶
대한민국 공공 데이터 분석에 활용 가능한 주요 데이터 소스.
주요 데이터 포털¶
| 소스 | URL | 운영 | 주요 데이터 |
|---|---|---|---|
| 공공데이터포털 | https://data.go.kr | 행정안전부 | 전 부처 공공데이터 |
| KOSIS(국가통계포털) | https://kosis.kr | 통계청 | 국가승인통계 |
| 통합 데이터지도 | https://bigdata-map.kr | NIA | 빅데이터 플랫폼 데이터 |
| 국가공간정보포털 | https://nsdi.go.kr | 국토부 | 공간정보, 지도 |
| 국토정보플랫폼 | https://map.ngii.go.kr | 국토지리정보원 | 지도, 측량 |
지자체 데이터 포털¶
| 지역 | 포털명 | URL |
|---|---|---|
| 서울 | 서울열린데이터광장 | https://data.seoul.go.kr |
| 경기 | 경기데이터드림 | https://data.gg.go.kr |
| 부산 | 부산시 공공데이터 | https://data.busan.go.kr |
| 인천 | 인천광역시 데이터포털 | https://data.incheon.go.kr |
| 대전 | 대전 빅데이터 | https://data.daejeon.go.kr |
| 세종 | 세종시 데이터포털 | https://data.sejong.go.kr |
분야별 전문 데이터¶
교통¶
| 데이터 | 소스 | URL |
|---|---|---|
| 국가교통DB | 한국교통연구원 | https://www.ktdb.go.kr |
| 교통카드 빅데이터 | 한국교통안전공단 | - |
| 자동차등록현황 | 국토부 | 공공데이터포털 |
| 도로교통량 | 한국도로공사 | https://www.roadplus.co.kr |
| 철도통계 | 한국철도공사 | https://info.korail.com |
부동산¶
| 데이터 | 소스 | URL |
|---|---|---|
| 실거래가 | 국토부 | https://rt.molit.go.kr |
| 공시가격 | 국토부 | https://www.realtyprice.kr |
| 건축인허가 | 건축행정시스템 | https://www.eais.go.kr |
| 토지이용현황 | 토지이음 | https://www.eum.go.kr |
건강/의료¶
| 데이터 | 소스 | URL |
|---|---|---|
| 건강보험 빅데이터 | 국민건강보험공단 | https://nhiss.nhis.or.kr |
| 의약품안전 | 의약품안전나라 | https://nedrug.mfds.go.kr |
| 질병통계 | 질병관리청 | https://www.kdca.go.kr |
| 국민건강영양조사 | 질병관리청 | KOSIS |
환경/기후¶
| 데이터 | 소스 | URL |
|---|---|---|
| 기상데이터 | 기상청 | https://data.kma.go.kr |
| 대기질 | 에어코리아 | https://www.airkorea.or.kr |
| 환경통계 | 환경부 | https://stat.me.go.kr |
| 물환경 | 물환경정보시스템 | https://water.nier.go.kr |
경제/산업¶
| 데이터 | 소스 | URL |
|---|---|---|
| 기업정보 | DART | https://dart.fss.or.kr |
| 무역통계 | 관세청 | https://unipass.customs.go.kr |
| 고용통계 | 고용정보원 | https://www.keis.or.kr |
| 특허정보 | 특허청 | https://www.kipris.or.kr |
인구/사회¶
| 데이터 | 소스 | URL |
|---|---|---|
| 인구통계 | 통계청 | KOSIS |
| 주민등록인구 | 행정안전부 | https://jumin.mois.go.kr |
| 범죄통계 | 경찰청 | https://www.police.go.kr |
| 교육통계 | 한국교육개발원 | https://kess.kedi.re.kr |
데이터 소스별 활용 팁¶
공공데이터포털 (data.go.kr)¶
장점: - 가장 방대한 공공데이터 (5만건 이상) - 파일데이터 + Open API 모두 제공 - 무료 이용, 회원가입 후 API 키 발급
활용 팁: - 키워드 검색보다 카테고리 탐색이 효과적 - API 호출 제한(일 1,000회)에 유의 - 데이터 품질이 상이함, 미리 샘플 확인 필요 - 데이터 갱신 주기 확인 (일부는 연 1회)
데이터 요청: - 원하는 데이터가 없으면 '데이터 개방 신청' 활용 - 처리기한 10일, 승인율 높음
KOSIS (kosis.kr)¶
장점: - 국가승인통계만 수록 (품질 검증됨) - 시계열 데이터 풍부 - 통계표 맞춤 편집 기능
활용 팁: - '100대 지표'로 핵심 통계 빠르게 파악 - MDIS(마이크로데이터서비스)로 원시데이터 이용 가능 - e-지방지표로 시군구 단위 데이터
통합 데이터지도 (bigdata-map.kr)¶
장점: - 10대 빅데이터 플랫폼 데이터 통합 검색 - 민간 데이터 포함 - 분석서비스 지원 사업 연계
활용 팁: - 데이터 결합 가능 여부 확인 - 플랫폼별 이용 절차 상이 - 유료 데이터는 데이터바우처 활용 검토
서울열린데이터광장 (data.seoul.go.kr)¶
장점: - 지자체 중 가장 풍부한 데이터 - 실시간 API 다수 (버스, 지하철, 따릉이 등) - 데이터셋 품질 양호
활용 팁: - '추천 데이터셋' 활용 - 인증키 발급 후 실시간 API 활용 - 서울디지털재단 분석 사례 참고
데이터 결합¶
데이터 결합이란?¶
서로 다른 기관의 데이터를 가명처리 후 결합하여 분석.
예시: - 건강보험 데이터 + 국민연금 데이터 결합 - 통신 데이터 + 카드 소비 데이터 결합
결합 절차¶
- 결합 신청 (결합전문기관)
- 가명처리
- 결합키 생성
- 데이터 결합
- 분석 환경에서 이용 (반출 제한)
결합전문기관¶
| 기관 | 분야 |
|---|---|
| 통계청 | 범용 |
| 금융보안원 | 금융 |
| 국민건강보험공단 | 의료/건강 |
| 한국신용정보원 | 신용정보 |
| 한국데이터산업진흥원 | 민간 데이터 |
데이터 품질 확인¶
품질 체크리스트¶
| 항목 | 확인 내용 |
|---|---|
| 최신성 | 마지막 갱신일, 갱신 주기 |
| 완전성 | 결측치 비율, 필수 항목 누락 |
| 정확성 | 이상치, 범위 벗어난 값 |
| 일관성 | 코드 체계, 표기법 통일 |
| 유용성 | 분석 목적에 적합한 항목 |
공공데이터 품질인증¶
- 행정안전부 공공데이터 품질인증 마크 확인
- 품질진단 결과 공개 데이터셋 우선 활용
이용 시 주의사항¶
라이선스¶
대부분 공공누리 1~4유형 적용: - 1유형: 출처표시 - 2유형: 출처표시 + 상업적 이용금지 - 3유형: 출처표시 + 변경금지 - 4유형: 출처표시 + 상업적이용금지 + 변경금지
개인정보¶
- 개인식별 가능 데이터 이용 시 주의
- 가명정보 이용 시 안전조치 준수
- 재식별 시도 금지