2024년 2월 2일

검색 증강 생성 (RAG, Retrieval Augmented Generation)

1. AI 환각 해소, 검색 증강 생성 (RAG, Retrieval Augmented Generation)의 개념 및 필요성

개념	생성형 AI 모델의 정확성과 신뢰성 향상을 위해 응답 생성 전 외부의 신뢰할 수 있는 지식 베이스를 참조하는 대규모 언어 모델(LLM) 최적화 기술
필요성

검색 증강 생성은 사실에 근거한 최신 정보를 통해 AI 환각 현상 등 거대 언어 모델의 문제점을 해소하고 사용자 질의에 대한 응답을 최적화

2. 검색 증강 생성의 동작 절차 및 구현 기술

(1) 검색 증강 생성의 동작 절차

문서 등 수집 데이터에 대해 임베딩 모델을 활용하여 문서 임베딩을 벡터DB에 저장 후 사용자 질의 발생 시 연관된 정보를 시맨틱 검색하여 획득된 정보를 바탕으로 질의 컨텍스트 개선 및 최적화

(2) 검색 증강 생성의 구현 기술

1) 검색기 (Retriever)의 구현 기술

구분	구현 기술	핵심 기능
시맨틱 표현	청크 최적화	입력된 문서를 적당한 크기의 조각(chunk)으로 분할하고 적절한 크기로 조절
시맨틱 표현	임베딩 모델 미세조정	청크와 질의를 의미론적 공간에 임베딩하는 단계에서 미세 조정을 통해 더 정확한 의미론적 표현 도출
질의와 문서 일치화	질의 재작성	원래 질의와 문서 간 의미론적 일치를 향상시키기 위해 질의를 변형
질의와 문서 일치화	임베딩 변환	질의와 문서를 동일한 의미론적 공간에 매핑하여 관련성 향상
검색기와 LLM 일치화	LLM 감독 학습	대규모 언어 모델(LLM)로부터 피드백 신호를 받아 임베딩 모델을 파인튜닝
검색기와 LLM 일치화	어댑터 플러그인	외부의 어댑터를 추가적으로 부착(plug-in)하는 방식으로 정렬

2) 생성기 (Generator)의 구현 기술

구분	구현 기술	핵심 기능
검색 결과 후처리	정보 압축	방대한 입력 정보를 압축하여 크기를 감소
검색 결과 후처리	순위 재설정	결과 문서 재배열하여 관련성 높은 항목을 상위 배치
생성기 최적화	최적화 프로세스	일반적인 파인튜닝 방법과 유사하게 모델 학습
생성기 최적화	대조 학습 활용	다양한 유형의 데이터를 사용하여 일반화 능력 향상

3) 증강 방법 (Augmentation Methods)의 구현 기술

구분	구현 기술	핵심 기능
증강 단계	사전 학습	텍스트 생성 품질을 향상시키고, 세부 작업에 더 잘 동작하는 기본 모델을 제공
	파인 튜닝	정보 검색을 개선하기 위해 REPLUG, UPRISE 등의 방법 사용
	추론	정보 검색 및 생성을 개선하기 위해 DSP, DREA-ICL 등의 방법을 사용
데이터 소스 증강	비정형 데이터 증강	프롬프트 데이터나 언어 데이터 등 텍스트 데이터 소스를 포함하여 언어 모델 예측 개선
데이터 소스 증강	정형 데이터 증강	검증된 고품질 데이터 컨텍스트와 정확하고 신뢰할 수 있는 정보를 제공
증강 프로세스	반복적 검색	사용자의 질의(query)와 모델이 생성한 텍스트를 기반으로 추가 문서를 수집
증강 프로세스	적응형 검색	검색 타이밍과 내용을 능동적으로 판단하고 최적화하여 검색 대상에 접근

검색 증강 생성의 주요 지표로 답변의 충실성, 답변 관련성, 문맥 관련성이 있으며, 기능을 평가하기 위해 노이즈 견고성, 부정적 거부, 정보 통합, 사실적 견고성의 4가지 능력에 기반하여 벤치마크 기준 제안
LLM에 검색 증강 생성을 적용하여 기술, 정책, 매뉴얼, 동영상, 로그 등을 지식 베이스로 전환하여 LLM의 신뢰성을 향상시키고 현장 지원, 직원 교육, 개발자 생산성 등 다양한 분야에서 활용 가능하나 외부 지식이나 검색 정보 의존 등 한계점 존재

3. 검색 증강 생성의 한계점 및 개선 방안

한계점	개선 방안
– 외부 지식 및 검색 정보에 의존 – 창의적인 콘텐츠 생성이 제한 – 민감 데이터 접근으로 개인정보보호 문제	– 콘텐츠 추천 및 가상 비서 등 개인 맞춤화로 사용 – 강화 학습 등 타 AI 기술과 통합 하이브리드 모델 – 합성 데이터 기반 개인정보 접근 최소화

검색 증강 생성은 창의적 콘텐츠 생성이 어렵고 개인정보보호 문제 등을 가지고 있지만 신뢰성을 확보한 LLM 사용이 가능하므로 챗봇, 개인 맞춤형 가상 비서 등에 사용될 것으로 예상

[참고]

엔비디아, RAG 위한 레퍼런스 아키텍처로 생성형 AI 구축 지원
AWS, RAG란 무엇인가요
elastic, 검색 증강 생성(RAG)이란
파이토치 사용자그룹, 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황

Tags:컨텐스트 개선, 프롬프트 엔지니어링, LLM, 생성형 AI, 거대언어모델 문제 해결, RAG, Retrieval Augmented Generation, 검색 증강 생성, LLM 최적화

About The Author

도리

콘텐츠 사용 시 출처 표기 부탁 드리고, 궁금한 점이나 의견은 댓글 남겨주세요^^응답 취소