검색 증강 생성 (RAG, Retrieval Augmented Generation)

1. AI 환각 해소, 검색 증강 생성 (RAG, Retrieval Augmented Generation)의 개념 및 필요성

개념생성형 AI 모델의 정확성과 신뢰성 향상을 위해 응답 생성 전 외부의 신뢰할 수 있는 지식 베이스를 참조하는 대규모 언어 모델(LLM) 최적화 기술
필요성
  • 검색 증강 생성은 사실에 근거한 최신 정보를 통해 AI 환각 현상 등 거대 언어 모델의 문제점을 해소하고 사용자 질의에 대한 응답을 최적화

 

2. 검색 증강 생성의 동작 절차 및 구현 기술

(1) 검색 증강 생성의 동작 절차

  • 문서 등 수집 데이터에 대해 임베딩 모델을 활용하여 문서 임베딩을 벡터DB에 저장 후 사용자 질의 발생 시 연관된 정보를 시맨틱 검색하여 획득된 정보를 바탕으로 질의 컨텍스트 개선 및 최적화

(2) 검색 증강 생성의 구현 기술

1) 검색기 (Retriever)의 구현 기술

구분구현 기술핵심 기능
시맨틱 표현청크 최적화입력된 문서를 적당한 크기의 조각(chunk)으로 분할하고 적절한 크기로 조절
임베딩 모델 미세조정청크와 질의를 의미론적 공간에 임베딩하는 단계에서 미세 조정을 통해 더 정확한 의미론적 표현 도출
질의와 문서 일치화질의 재작성원래 질의와 문서 간 의미론적 일치를 향상시키기 위해 질의를 변형
임베딩 변환질의와 문서를 동일한 의미론적 공간에 매핑하여 관련성 향상
검색기와 LLM 일치화LLM 감독 학습대규모 언어 모델(LLM)로부터 피드백 신호를 받아 임베딩 모델을 파인튜닝
어댑터 플러그인외부의 어댑터를 추가적으로 부착(plug-in)하는 방식으로 정렬

2) 생성기 (Generator)의 구현 기술

구분구현 기술핵심 기능
검색 결과
후처리
정보 압축방대한 입력 정보를 압축하여 크기를 감소
순위 재설정결과 문서 재배열하여 관련성 높은 항목을 상위 배치
생성기 최적화최적화 프로세스일반적인 파인튜닝 방법과 유사하게 모델 학습
대조 학습 활용다양한 유형의 데이터를 사용하여 일반화 능력 향상

3) 증강 방법 (Augmentation Methods)의 구현 기술

구분구현 기술핵심 기능
증강 단계사전 학습텍스트 생성 품질을 향상시키고, 세부 작업에 더 잘 동작하는 기본 모델을 제공
파인튜닝정보 검색을 개선하기 위해 REPLUG, UPRISE 등의 방법 사용
추론정보 검색 및 생성을 개선하기 위해 DSP, DREA-ICL 등의 방법을 사용
데이터 소스 증강비정형 데이터 증강프롬프트 데이터나 언어 데이터 등 텍스트 데이터 소스를 포함하여 언어 모델 예측 개선
정형 데이터 증강검증된 고품질 데이터 컨텍스트와 정확하고 신뢰할 수 있는 정보를 제공
증강 프로세스반복적 검색사용자의 질의(query)와 모델이 생성한 텍스트를 기반으로 추가 문서를 수집
적응형 검색검색 타이밍과 내용을 능동적으로 판단하고 최적화하여 검색 대상에 접근
  • 검색 증강 생성의 주요 지표로 답변의 충실성, 답변 관련성, 문맥 관련성이 있으며, 기능을 평가하기 위해 노이즈 견고성, 부정적 거부, 정보 통합, 사실적 견고성의 4가지 능력에 기반하여 벤치마크 기준 제안
  • LLM에 검색 증강 생성을 적용하여 기술, 정책, 매뉴얼, 동영상, 로그 등을 지식 베이스로 전환하여 LLM의 신뢰성을 향상시키고 현장 지원, 직원 교육, 개발자 생산성 등 다양한 분야에서 활용 가능하나 외부 지식이나 검색 정보 의존 등 한계점 존재

 

3. 검색 증강 생성의 한계점 및 개선 방안

한계점개선 방안
– 외부 지식 및 검색 정보에 의존
– 창의적인 콘텐츠 생성이 제한
– 민감 데이터 접근으로 개인정보보호 문제
– 콘텐츠 추천 및 가상 비서 등 개인 맞춤화로 사용
강화 학습 등 타 AI 기술과 통합 하이브리드 모델
합성 데이터 기반 개인정보 접근 최소화
  • 검색 증강 생성은 창의적 콘텐츠 생성이 어렵고 개인정보보호 문제 등을 가지고 있지만 신뢰성을 확보한 LLM 사용이 가능하므로 챗봇, 개인 맞춤형 가상 비서 등에 사용될 것으로 예상

 
[참고]

  • 엔비디아, RAG 위한 레퍼런스 아키텍처로 생성형 AI 구축 지원
  • AWS, RAG란 무엇인가요
  • elastic, 검색 증강 생성(RAG)이란
  • 파이토치 사용자그룹, 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황

댓글을 남겨주시면 감사드려요~*^^*