X

그래프 RAG (Graph RAG)

1. LLM의 맥락 파악, 그래프 RAG의 개념 및 특징

개념 특징
생성형 AI 모델의 복잡한 관계 추론을 위해 지식 그래프의 노드-엣지 기반 데이터의 맥락 관계를 이해하는 대규모 언어 모델(LLM) 최적화 기술 – 복잡한 관계 추론
– 전체 맥락 파악
– 명시적 지식 구조화
– 설명 가능성 지원
  • 기존 벡터 RAG는 데이터를 청크 단위로 처리하면서 전체 연결 관계(맥락)를 놓치고 지식 구조화가 어려운 한계점이 존재하여 맥락 관계 이해를 위해 그래프 RAG가 부각

 

2. 그래프 RAG의 동작 절차 및 원리

(1) 그래프 RAG의 동작 절차

(2) 그래프 RAG의 동작 원리

단계 동작 원리 세부 기술
[1단계]
그래프 구축
및 인덱싱
① 지식 그래프 구축 – 문서, DB, 웹페이지 소스에서 정보 추출
– 노드/에지 관계 표현, few-shot learning
② 그래프 저장 및 인덱싱 – 노드/엣지 정보를 그래프 DB에 보관
– 그래프 구조 인덱싱, 그래프 임베딩
③ 정보 그룹화/요약 – 대규모 연관 정보에 탐색 알고리즘 적용
– Louvain, Leiden 알고리즘
[2단계]
검색 및 생성
④ 질의 분석 및 쿼리 변환 – 질문의 의도 파악 및 관계 식별
그래프QL, Cypher, SPARQL
⑤ 그래프 탐색 – 변환된 쿼리 기반 관련 정보 탐색
– Multi-hop 추론, 설명 가능성
⑥ 컨텍스트 구성 – 탐색 결과인 구조화된 정보 가공
LLM 활용 가능 컨텍스트 형태로 변환
⑦ 답변 생성 – 컨텍스트와 원본 질문을 LLM에 전달
– 사실 관계 정보 기반 최종 답변 생성
  • 그래프 RAG는 지식을 재구성하여 노드와 에지를 통해 의미있는 네트워크를 형성하며 질문의 의도를 파악하고 관련 정보를 깊이 있게 탐색 및 생성 가능

 

3. 벡터 RAG와 그래프 RAG 비교

비교 항목 벡터 RAG 그래프 RAG
검색 방식 의미 유사성, 임베딩 벡터 거리 계산 관계 정보, 지식 그래프 노드-엣지 탐색
처리 데이터 비정형 데이터 (문서, 텍스트, 오디오) 정형+비정형 데이터 (RDB, 테이블, CSV)
매칭 원리 키워드/의미 유사도 수준 데이터간 맥락 관계 이해
장점 빠른 의미 검색, 확장성 높음 깊이 있는 문맥 이해, 관계 추론
단점 문맥 손실 가능, 관계 표현 불가 높은 초기 비용, 확장성/성능 문제
활용 사례 의미/문서 검색, 간단한 Q&A 복잡한 관계 분석, 설명 가능한 AI
  • 광범위한 의미 기반 검색 또는 대규모 비정형 데이터 처리 시 벡터 RAG가 적합하며, 데이터간 관계가 핵심이거나 높은 정확성 및 설명 가능성 필요 시 그래프 RAG가 적합
  • 최근 벡터 RAG와 그래프 RAG의 장점을 결함한 하이브리드 RAG와 저수준/고수준 검색을 결합한 Light RAG, 이종 그래프 기반 다양한 유형의 정보를 지원하는 Node RAG 등 지속 연구/개발중

 
[참고]

  • Microsoft Research Blog, GraphRAG: Unlocking LLM discovery on narrative private data, 2024.2
  • Neo4j, Michael Hunger, What Is GraphRAG, 2024.12
Categories: 알고리즘/AI
도리: