Data Science¶

데이터 과학의 핵심 분야별 심층 가이드. 각 분야의 이론적 배경, 방법론, 알고리즘, 실무 적용 사례와 참고 문헌을 제공합니다.

목차¶

분석 및 예측¶

분야	설명
시계열 분석	시간 순서 데이터의 패턴 분석 및 예측
생존 분석	이벤트 발생 시간 모델링
이상 탐지	비정상 패턴 식별
인과 추론	원인-결과 관계 규명

자연어 처리 및 비전¶

분야	설명
자연어 처리(NLP)	텍스트 이해 및 생성
컴퓨터 비전	이미지/비디오 이해

의사결정 및 최적화¶

분야	설명
추천 시스템	개인화된 아이템 추천
강화학습	순차적 의사결정 최적화
최적화	목적함수 최적화 기법

모델링 방법론¶

분야	설명
베이지안 방법론	확률적 추론 및 불확실성 정량화
Uncertainty Quantification	BNN, MC Dropout, Deep Ensembles, Calibration
그래프 분석	GNN, 커뮤니티 탐지, 그래프 임베딩
모델 해석(XAI)	모델 예측 설명 가능성
Training Data Attribution	학습 데이터의 예측 기여도 측정

LLM Reasoning¶

분야	설명
Chain-of-Thought Reasoning	중간 추론 단계를 생성하여 LLM의 복잡한 추론 능력 향상
Direct Preference Optimization	RL 없이 선호도 학습을 통한 LLM 정렬
Weak-to-Strong Generalization	약한 supervisor로 강한 모델의 능력을 이끌어내는 기법
Mechanistic Interpretability	신경망 내부 회로 및 알고리즘 역공학
Sparse Autoencoders	Superposition 해소를 통한 해석 가능한 특징 추출

학습 패러다임¶

분야	설명
Parameter-Efficient Fine-Tuning	LoRA, Adapter 등 효율적 모델 적응 기법
Score Matching	정규화 상수 없이 확률 모델을 추정하는 기법 (Diffusion의 이론적 기반)
Neural Scaling Laws	모델/데이터/연산량과 성능의 멱법칙 관계
전이학습	사전 지식 활용 학습
메타러닝	학습하는 방법을 학습 (MAML, Prototypical Networks 등)
연합학습	분산 환경에서의 프라이버시 보존 학습
액티브 러닝	효율적 레이블링 전략
Model Merging	다중 fine-tuned 모델의 가중치 병합
Knowledge Distillation	Teacher-Student 프레임워크 기반 모델 압축
Continual Learning	순차 학습에서 Catastrophic Forgetting 방지 기법
Deep RL Scaling	1000층 네트워크를 통한 Self-Supervised RL
3D Gaussian Splatting	실시간 3D 장면 렌더링을 위한 명시적 표현
Test-Time Compute Scaling	추론 시점 연산 확장으로 LLM 성능 향상
Speculative Decoding	Draft-verify 패러다임을 통한 LLM 추론 가속화
MeanFlow	평균 속도 기반 One-step Generative Modeling
Visual Autoregressive Modeling	Next-Scale Prediction 기반 이미지 생성 (NeurIPS 2024 Best Paper)
Consistency Models	One-step Diffusion 생성 모델
Masked Diffusion Models	이산 토큰에 대한 마스크 기반 확산
Test-Time Training	추론 시 모델 적응으로 시퀀스 예측 개선
World Models	환경 시뮬레이션 기반 의사결정

자동화 및 엔지니어링¶

분야	설명
피처 엔지니어링	효과적인 특성 설계
AutoML	자동화된 머신러닝 파이프라인

분야별 연관성¶

시계열 분석 ──────┬──── 이상 탐지
                  │
NLP ──────────────┼──── 추천 시스템
                  │
컴퓨터 비전 ──────┤
                  │
      ┌───────────┴───────────┐
      │                       │
  전이학습              메타러닝
      │                       │
      └───────────┬───────────┘
                  │
             연합학습

참고 컨퍼런스 및 저널¶

분류	이름
ML/AI 컨퍼런스	NeurIPS, ICML, ICLR, AAAI
데이터마이닝	KDD, WWW, WSDM, RecSys
NLP	ACL, EMNLP, NAACL
컴퓨터 비전	CVPR, ICCV, ECCV
저널	JMLR, IEEE TPAMI, Nature Machine Intelligence