2026년 1월 31일
그래프 RAG (Graph RAG)
1. LLM의 맥락 파악, 그래프 RAG의 개념 및 특징
| 개념 | 특징 |
|---|---|
| 생성형 AI 모델의 복잡한 관계 추론을 위해 지식 그래프의 노드-엣지 기반 데이터의 맥락 관계를 이해하는 대규모 언어 모델(LLM) 최적화 기술 | – 복잡한 관계 추론 – 전체 맥락 파악 – 명시적 지식 구조화 – 설명 가능성 지원 |
- 기존 벡터 RAG는 데이터를 청크 단위로 처리하면서 전체 연결 관계(맥락)를 놓치고 지식 구조화가 어려운 한계점이 존재하여 맥락 관계 이해를 위해 그래프 RAG가 부각
2. 그래프 RAG의 동작 절차 및 원리
(1) 그래프 RAG의 동작 절차
![]() |
(2) 그래프 RAG의 동작 원리
| 단계 | 동작 원리 | 세부 기술 |
|---|---|---|
| [1단계] 그래프 구축 및 인덱싱 | ① 지식 그래프 구축 | – 문서, DB, 웹페이지 소스에서 정보 추출 – 노드/에지 관계 표현, few-shot learning |
| ② 그래프 저장 및 인덱싱 | – 노드/엣지 정보를 그래프 DB에 보관 – 그래프 구조 인덱싱, 그래프 임베딩 | |
| ③ 정보 그룹화/요약 | – 대규모 연관 정보에 탐색 알고리즘 적용 – Louvain, Leiden 알고리즘 | |
| [2단계] 검색 및 생성 | ④ 질의 분석 및 쿼리 변환 | – 질문의 의도 파악 및 관계 식별 – 그래프QL, Cypher, SPARQL |
| ⑤ 그래프 탐색 | – 변환된 쿼리 기반 관련 정보 탐색 – Multi-hop 추론, 설명 가능성 | |
| ⑥ 컨텍스트 구성 | – 탐색 결과인 구조화된 정보 가공 – LLM 활용 가능 컨텍스트 형태로 변환 | |
| ⑦ 답변 생성 | – 컨텍스트와 원본 질문을 LLM에 전달 – 사실 관계 정보 기반 최종 답변 생성 |
- 그래프 RAG는 지식을 재구성하여 노드와 에지를 통해 의미있는 네트워크를 형성하며 질문의 의도를 파악하고 관련 정보를 깊이 있게 탐색 및 생성 가능
3. 벡터 RAG와 그래프 RAG 비교
| 비교 항목 | 벡터 RAG | 그래프 RAG |
|---|---|---|
| 검색 방식 | 의미 유사성, 임베딩 벡터 거리 계산 | 관계 정보, 지식 그래프 노드-엣지 탐색 |
| 처리 데이터 | 비정형 데이터 (문서, 텍스트, 오디오) | 정형+비정형 데이터 (RDB, 테이블, CSV) |
| 매칭 원리 | 키워드/의미 유사도 수준 | 데이터간 맥락 관계 이해 |
| 장점 | 빠른 의미 검색, 확장성 높음 | 깊이 있는 문맥 이해, 관계 추론 |
| 단점 | 문맥 손실 가능, 관계 표현 불가 | 높은 초기 비용, 확장성/성능 문제 |
| 활용 사례 | 의미/문서 검색, 간단한 Q&A | 복잡한 관계 분석, 설명 가능한 AI |
- 광범위한 의미 기반 검색 또는 대규모 비정형 데이터 처리 시 벡터 RAG가 적합하며, 데이터간 관계가 핵심이거나 높은 정확성 및 설명 가능성 필요 시 그래프 RAG가 적합
- 최근 벡터 RAG와 그래프 RAG의 장점을 결함한 하이브리드 RAG와 저수준/고수준 검색을 결합한 Light RAG, 이종 그래프 기반 다양한 유형의 정보를 지원하는 Node RAG 등 지속 연구/개발중
[참고]
- Microsoft Research Blog, GraphRAG: Unlocking LLM discovery on narrative private data, 2024.2
- Neo4j, Michael Hunger, What Is GraphRAG, 2024.12
