콘텐츠로 이동
Data Prep
상세

Data Science

데이터 과학의 핵심 분야별 심층 가이드. 각 분야의 이론적 배경, 방법론, 알고리즘, 실무 적용 사례와 참고 문헌을 제공합니다.

목차

분석 및 예측

분야 설명
시계열 분석 시간 순서 데이터의 패턴 분석 및 예측
생존 분석 이벤트 발생 시간 모델링
이상 탐지 비정상 패턴 식별
인과 추론 원인-결과 관계 규명

자연어 처리 및 비전

분야 설명
자연어 처리(NLP) 텍스트 이해 및 생성
컴퓨터 비전 이미지/비디오 이해

의사결정 및 최적화

분야 설명
추천 시스템 개인화된 아이템 추천
강화학습 순차적 의사결정 최적화
최적화 목적함수 최적화 기법

모델링 방법론

분야 설명
베이지안 방법론 확률적 추론 및 불확실성 정량화
Uncertainty Quantification BNN, MC Dropout, Deep Ensembles, Calibration
그래프 분석 GNN, 커뮤니티 탐지, 그래프 임베딩
모델 해석(XAI) 모델 예측 설명 가능성
Training Data Attribution 학습 데이터의 예측 기여도 측정

LLM Reasoning

분야 설명
Chain-of-Thought Reasoning 중간 추론 단계를 생성하여 LLM의 복잡한 추론 능력 향상
Direct Preference Optimization RL 없이 선호도 학습을 통한 LLM 정렬
Weak-to-Strong Generalization 약한 supervisor로 강한 모델의 능력을 이끌어내는 기법
Mechanistic Interpretability 신경망 내부 회로 및 알고리즘 역공학
Sparse Autoencoders Superposition 해소를 통한 해석 가능한 특징 추출

학습 패러다임

분야 설명
Parameter-Efficient Fine-Tuning LoRA, Adapter 등 효율적 모델 적응 기법
Score Matching 정규화 상수 없이 확률 모델을 추정하는 기법 (Diffusion의 이론적 기반)
Neural Scaling Laws 모델/데이터/연산량과 성능의 멱법칙 관계
전이학습 사전 지식 활용 학습
메타러닝 학습하는 방법을 학습 (MAML, Prototypical Networks 등)
연합학습 분산 환경에서의 프라이버시 보존 학습
액티브 러닝 효율적 레이블링 전략
Model Merging 다중 fine-tuned 모델의 가중치 병합
Knowledge Distillation Teacher-Student 프레임워크 기반 모델 압축
Continual Learning 순차 학습에서 Catastrophic Forgetting 방지 기법
Deep RL Scaling 1000층 네트워크를 통한 Self-Supervised RL
3D Gaussian Splatting 실시간 3D 장면 렌더링을 위한 명시적 표현
Test-Time Compute Scaling 추론 시점 연산 확장으로 LLM 성능 향상
Speculative Decoding Draft-verify 패러다임을 통한 LLM 추론 가속화
MeanFlow 평균 속도 기반 One-step Generative Modeling
Visual Autoregressive Modeling Next-Scale Prediction 기반 이미지 생성 (NeurIPS 2024 Best Paper)
Consistency Models One-step Diffusion 생성 모델
Masked Diffusion Models 이산 토큰에 대한 마스크 기반 확산
Test-Time Training 추론 시 모델 적응으로 시퀀스 예측 개선
World Models 환경 시뮬레이션 기반 의사결정

자동화 및 엔지니어링

분야 설명
피처 엔지니어링 효과적인 특성 설계
AutoML 자동화된 머신러닝 파이프라인

분야별 연관성

시계열 분석 ──────┬──── 이상 탐지
NLP ──────────────┼──── 추천 시스템
컴퓨터 비전 ──────┤
      ┌───────────┴───────────┐
      │                       │
  전이학습              메타러닝
      │                       │
      └───────────┬───────────┘
             연합학습

참고 컨퍼런스 및 저널

분류 이름
ML/AI 컨퍼런스 NeurIPS, ICML, ICLR, AAAI
데이터마이닝 KDD, WWW, WSDM, RecSys
NLP ACL, EMNLP, NAACL
컴퓨터 비전 CVPR, ICCV, ECCV
저널 JMLR, IEEE TPAMI, Nature Machine Intelligence