그래프 RAG (Graph RAG)

1. LLM의 맥락 파악, 그래프 RAG의 개념 및 특징

개념특징
생성형 AI 모델의 복잡한 관계 추론을 위해 지식 그래프의 노드-엣지 기반 데이터의 맥락 관계를 이해하는 대규모 언어 모델(LLM) 최적화 기술– 복잡한 관계 추론
– 전체 맥락 파악
– 명시적 지식 구조화
– 설명 가능성 지원
  • 기존 벡터 RAG는 데이터를 청크 단위로 처리하면서 전체 연결 관계(맥락)를 놓치고 지식 구조화가 어려운 한계점이 존재하여 맥락 관계 이해를 위해 그래프 RAG가 부각

 

2. 그래프 RAG의 동작 절차 및 원리

(1) 그래프 RAG의 동작 절차

그래프 RAG 동작 절차

(2) 그래프 RAG의 동작 원리

단계동작 원리세부 기술
[1단계]
그래프 구축
및 인덱싱
① 지식 그래프 구축– 문서, DB, 웹페이지 소스에서 정보 추출
– 노드/에지 관계 표현, few-shot learning
② 그래프 저장 및 인덱싱– 노드/엣지 정보를 그래프 DB에 보관
– 그래프 구조 인덱싱, 그래프 임베딩
③ 정보 그룹화/요약– 대규모 연관 정보에 탐색 알고리즘 적용
– Louvain, Leiden 알고리즘
[2단계]
검색 및 생성
④ 질의 분석 및 쿼리 변환– 질문의 의도 파악 및 관계 식별
그래프QL, Cypher, SPARQL
⑤ 그래프 탐색– 변환된 쿼리 기반 관련 정보 탐색
– Multi-hop 추론, 설명 가능성
⑥ 컨텍스트 구성– 탐색 결과인 구조화된 정보 가공
LLM 활용 가능 컨텍스트 형태로 변환
⑦ 답변 생성– 컨텍스트와 원본 질문을 LLM에 전달
– 사실 관계 정보 기반 최종 답변 생성
  • 그래프 RAG는 지식을 재구성하여 노드와 에지를 통해 의미있는 네트워크를 형성하며 질문의 의도를 파악하고 관련 정보를 깊이 있게 탐색 및 생성 가능

 

3. 벡터 RAG와 그래프 RAG 비교

비교 항목벡터 RAG그래프 RAG
검색 방식의미 유사성, 임베딩 벡터 거리 계산관계 정보, 지식 그래프 노드-엣지 탐색
처리 데이터비정형 데이터 (문서, 텍스트, 오디오)정형+비정형 데이터 (RDB, 테이블, CSV)
매칭 원리키워드/의미 유사도 수준데이터간 맥락 관계 이해
장점빠른 의미 검색, 확장성 높음깊이 있는 문맥 이해, 관계 추론
단점문맥 손실 가능, 관계 표현 불가높은 초기 비용, 확장성/성능 문제
활용 사례의미/문서 검색, 간단한 Q&A복잡한 관계 분석, 설명 가능한 AI
  • 광범위한 의미 기반 검색 또는 대규모 비정형 데이터 처리 시 벡터 RAG가 적합하며, 데이터간 관계가 핵심이거나 높은 정확성 및 설명 가능성 필요 시 그래프 RAG가 적합
  • 최근 벡터 RAG와 그래프 RAG의 장점을 결함한 하이브리드 RAG와 저수준/고수준 검색을 결합한 Light RAG, 이종 그래프 기반 다양한 유형의 정보를 지원하는 Node RAG 등 지속 연구/개발중

 
[참고]

  • Microsoft Research Blog, GraphRAG: Unlocking LLM discovery on narrative private data, 2024.2
  • Neo4j, Michael Hunger, What Is GraphRAG, 2024.12

콘텐츠 사용 시 출처 표기 부탁 드리고, 댓글은 큰 힘이 됩니다^^