Data Science¶
데이터 과학의 핵심 분야별 심층 가이드. 각 분야의 이론적 배경, 방법론, 알고리즘, 실무 적용 사례와 참고 문헌을 제공합니다.
목차¶
분석 및 예측¶
| 분야 | 설명 |
|---|---|
| 시계열 분석 | 시간 순서 데이터의 패턴 분석 및 예측 |
| 생존 분석 | 이벤트 발생 시간 모델링 |
| 이상 탐지 | 비정상 패턴 식별 |
| 인과 추론 | 원인-결과 관계 규명 |
자연어 처리 및 비전¶
| 분야 | 설명 |
|---|---|
| 자연어 처리(NLP) | 텍스트 이해 및 생성 |
| 컴퓨터 비전 | 이미지/비디오 이해 |
의사결정 및 최적화¶
| 분야 | 설명 |
|---|---|
| 추천 시스템 | 개인화된 아이템 추천 |
| 강화학습 | 순차적 의사결정 최적화 |
| 최적화 | 목적함수 최적화 기법 |
모델링 방법론¶
| 분야 | 설명 |
|---|---|
| 베이지안 방법론 | 확률적 추론 및 불확실성 정량화 |
| Uncertainty Quantification | BNN, MC Dropout, Deep Ensembles, Calibration |
| 그래프 분석 | GNN, 커뮤니티 탐지, 그래프 임베딩 |
| 모델 해석(XAI) | 모델 예측 설명 가능성 |
| Training Data Attribution | 학습 데이터의 예측 기여도 측정 |
LLM Reasoning¶
| 분야 | 설명 |
|---|---|
| Chain-of-Thought Reasoning | 중간 추론 단계를 생성하여 LLM의 복잡한 추론 능력 향상 |
| Direct Preference Optimization | RL 없이 선호도 학습을 통한 LLM 정렬 |
| Weak-to-Strong Generalization | 약한 supervisor로 강한 모델의 능력을 이끌어내는 기법 |
| Mechanistic Interpretability | 신경망 내부 회로 및 알고리즘 역공학 |
| Sparse Autoencoders | Superposition 해소를 통한 해석 가능한 특징 추출 |
학습 패러다임¶
| 분야 | 설명 |
|---|---|
| Parameter-Efficient Fine-Tuning | LoRA, Adapter 등 효율적 모델 적응 기법 |
| Score Matching | 정규화 상수 없이 확률 모델을 추정하는 기법 (Diffusion의 이론적 기반) |
| Neural Scaling Laws | 모델/데이터/연산량과 성능의 멱법칙 관계 |
| 전이학습 | 사전 지식 활용 학습 |
| 메타러닝 | 학습하는 방법을 학습 (MAML, Prototypical Networks 등) |
| 연합학습 | 분산 환경에서의 프라이버시 보존 학습 |
| 액티브 러닝 | 효율적 레이블링 전략 |
| Model Merging | 다중 fine-tuned 모델의 가중치 병합 |
| Knowledge Distillation | Teacher-Student 프레임워크 기반 모델 압축 |
| Continual Learning | 순차 학습에서 Catastrophic Forgetting 방지 기법 |
| Deep RL Scaling | 1000층 네트워크를 통한 Self-Supervised RL |
| 3D Gaussian Splatting | 실시간 3D 장면 렌더링을 위한 명시적 표현 |
| Test-Time Compute Scaling | 추론 시점 연산 확장으로 LLM 성능 향상 |
| Speculative Decoding | Draft-verify 패러다임을 통한 LLM 추론 가속화 |
| MeanFlow | 평균 속도 기반 One-step Generative Modeling |
| Visual Autoregressive Modeling | Next-Scale Prediction 기반 이미지 생성 (NeurIPS 2024 Best Paper) |
| Consistency Models | One-step Diffusion 생성 모델 |
| Masked Diffusion Models | 이산 토큰에 대한 마스크 기반 확산 |
| Test-Time Training | 추론 시 모델 적응으로 시퀀스 예측 개선 |
| World Models | 환경 시뮬레이션 기반 의사결정 |
자동화 및 엔지니어링¶
| 분야 | 설명 |
|---|---|
| 피처 엔지니어링 | 효과적인 특성 설계 |
| AutoML | 자동화된 머신러닝 파이프라인 |
분야별 연관성¶
시계열 분석 ──────┬──── 이상 탐지
│
NLP ──────────────┼──── 추천 시스템
│
컴퓨터 비전 ──────┤
│
┌───────────┴───────────┐
│ │
전이학습 메타러닝
│ │
└───────────┬───────────┘
│
연합학습
참고 컨퍼런스 및 저널¶
| 분류 | 이름 |
|---|---|
| ML/AI 컨퍼런스 | NeurIPS, ICML, ICLR, AAAI |
| 데이터마이닝 | KDD, WWW, WSDM, RecSys |
| NLP | ACL, EMNLP, NAACL |
| 컴퓨터 비전 | CVPR, ICCV, ECCV |
| 저널 | JMLR, IEEE TPAMI, Nature Machine Intelligence |