콘텐츠로 이동
Data Prep
상세

Neuro-Symbolic AI

신경망의 학습 능력과 기호 추론(Symbolic Reasoning)의 논리적 엄밀성을 결합하는 하이브리드 AI 패러다임


개요

Neuro-Symbolic AI(NeSy)는 딥러닝의 패턴 인식 능력과 기호 AI의 논리적 추론 능력을 결합하여 각각의 약점을 보완하는 접근법이다. LLM이 사실 기반 추론에서 환각을 일으키는 문제, 딥러닝이 소량 데이터에서 일반화하지 못하는 문제를 구조적으로 해결하려는 시도다.


배경: 두 패러다임의 한계

신경망 (Neural) 의 한계

한계 설명 예시
해석 불가능 블랙박스 의사결정 왜 이 환자를 고위험으로 분류했는가?
논리적 일관성 부족 모순된 출력 가능 "A > B"와 "B > A"를 동시에 주장
데이터 의존성 대량 데이터 필요 희귀 질환 진단 (사례 10건)
환각 (LLM) 사실이 아닌 내용 생성 존재하지 않는 논문 인용
조합적 일반화 실패 새로운 조합에 취약 학습하지 않은 규칙 조합

기호 AI (Symbolic) 의 한계

한계 설명 예시
지식 획득 병목 규칙을 수동 정의 전문가 지식 코드화 비용
불확실성 처리 어려움 이진적 참/거짓 확률적 상황 처리 불가
비정형 데이터 처리 불가 이미지, 음성 처리 한계 자연어 이해
확장성 한계 탐색 공간 폭발 대규모 지식 베이스 추론

NeSy 통합 유형

Kautz의 분류 (2022)

유형 설명 예시
**Type 1: Neural Symbolic** 각각 독립 사용, 결과 통합
Type 2: Neural; Symbolic 순차 파이프라인 신경망 인식 → 기호 추론
Type 3: Neural[Symbolic] 기호 지식이 신경망 학습을 안내 물리 법칙 내장 PINN
Type 4: Symbolic[Neural] 기호 시스템이 신경망을 구성요소로 활용 DeepProbLog
Type 5: Neural-Symbolic 완전 통합 Differentiable Logic
Type 6: Neural = Symbolic 신경망 자체가 기호 연산 수행 Neural Turing Machine

핵심 접근법

1. Neural + Knowledge Graph

지식 그래프를 신경망과 결합:

[비정형 입력 (텍스트, 이미지)]
    |
    v
[신경망 인코더] ---> 엔티티/관계 임베딩
    |
    v
[지식 그래프 추론] ---> 규칙 기반 추론
    |                     관계 추론
    |                     일관성 검증
    v
[최종 출력] (설명 가능, 논리적으로 일관)
모델 방식 장점
KGAT KG 임베딩 + Attention 추천에서 설명 가능성
GreaseLM LM + KG 교차 인코딩 QA에서 사실 기반 추론
QA-GNN 질문 + KG 부분그래프 추론 상식 추론

2. Differentiable Logic Programming

논리 프로그래밍을 미분 가능하게 만들어 end-to-end 학습:

시스템 방식 특징
DeepProbLog 확률적 논리 + 신경망 Prolog 기반, 확률 추론
NeurASP Answer Set Programming + DL 제약 만족 + 학습
Logic Tensor Networks 퍼지 논리 + 텐서 실수값 논리 연산
Scallop 미분가능 Datalog 효율적, 대규모 적용 가능

예시 - DeepProbLog:

% 신경망 예측을 확률적 사실로 통합
nn(digit_net, [X], Y, [0,1,2,3,4,5,6,7,8,9]) :: digit(X, Y).

% 논리 규칙
addition(X, Y, Z) :- digit(X, N1), digit(Y, N2), Z is N1 + N2.

이미지에서 숫자를 인식(신경망)하고, 덧셈 규칙(기호)을 적용. 전체가 end-to-end 미분 가능.

3. LLM + Symbolic Solver

LLM의 자연어 이해와 기호 솔버의 정확한 추론 결합:

[자연어 문제]
    |
    v
[LLM: 문제 해석 + 형식화]
    |--- 자연어 → 논리식/수식/코드 변환
    v
[기호 솔버]
    |--- SAT Solver (논리)
    |--- SMT Solver (산술+논리)
    |--- Python 인터프리터 (코드)
    |--- 최적화 솔버 (LP/MIP)
    v
[LLM: 결과 해석 + 자연어 응답]
시스템 LLM 역할 Solver 응용
PAL 문제 → Python 코드 Python 수학 문제
LINC 문제 → FOL Prover9 논리 추론
SatLM 문제 → SAT 인코딩 Z3 제약 만족
Faithful CoT 문제 → 다단계 코드 Python 복잡한 추론

4. Physics-Informed Neural Networks (PINN)

물리 법칙(미분방정식)을 신경망 학습에 내장:

Loss = L_data + lambda * L_physics

L_data = MSE(y_pred, y_true)           -- 데이터 적합
L_physics = MSE(PDE(y_pred), 0)        -- 물리 법칙 만족
응용 물리 법칙 효과
유체 역학 Navier-Stokes 적은 데이터로 정확한 시뮬레이션
열 전도 열 방정식 물리적으로 타당한 예측
구조 역학 탄성 방정식 안전한 외삽

평가 차원

차원 순수 Neural 순수 Symbolic NeSy
비정형 데이터 처리 우수 불가 우수
논리적 일관성 취약 완벽 강함
설명 가능성 낮음 높음 중-높음
데이터 효율성 낮음 해당없음 높음
확장성 높음 낮음 중간
불확실성 처리 중간 낮음 높음
개발 비용 중간 높음 높음

실무 적용 가이드

적합한 상황

상황 이유 NeSy 접근법
규제 산업 (금융, 의료) 설명 가능성 + 정확성 필수 Neural 인식 + Symbolic 규칙 검증
소량 데이터 도메인 지식으로 보완 PINN, 지식 그래프 강화
복잡한 추론 다단계 논리 필요 LLM + Symbolic Solver
안전 중요 시스템 보장된 행동 필요 형식 검증 + Neural 제어

적합하지 않은 상황

상황 이유
순수 패턴 인식 (이미지 분류) 기호 추론 불필요
대규모 데이터 + 명확한 메트릭 순수 DL이 더 효율적
빠른 프로토타이핑 NeSy 구현 복잡성

열린 문제

과제 현재 상태
확장성 대규모 지식 베이스에서 추론 속도
통합 학습 Neural과 Symbolic의 seamless 학습
메타인지 모델이 "모르는 것을 아는" 능력
도구 생태계 범용 NeSy 프레임워크 부족
벤치마크 NeSy 특화 평가 기준 미확립

참고

  • Garcez, A. & Lamb, L. (2023). "Neurosymbolic AI: The 3rd Wave"
  • Kautz, H. (2022). "The Third AI Summer" (AAAI Presidential Address)
  • Marcus, G. (2020). "The Next Decade in AI: Four Steps Towards Robust AI"
  • Survey: "A Comprehensive Review of Neuro-symbolic AI" (Arabian J. Sci. Eng., 2025)
  • Survey: "AI Reasoning in Deep Learning Era" (Mathematics, 2025)

최종 업데이트: 2026-03-18