1. AI 환각 해소, 검색 증강 생성 (RAG, Retrieval Augmented Generation)의 개념 및 필요성
개념 | 생성형 AI 모델의 정확성과 신뢰성 향상을 위해 응답 생성 전 외부의 신뢰할 수 있는 지식 베이스를 참조하는 대규모 언어 모델(LLM) 최적화 기술 |
---|---|
필요성 |
- 검색 증강 생성은 사실에 근거한 최신 정보를 통해 AI 환각 현상 등 거대 언어 모델의 문제점을 해소하고 사용자 질의에 대한 응답을 최적화
2. 검색 증강 생성의 동작 절차 및 구현 기술
(1) 검색 증강 생성의 동작 절차
- 문서 등 수집 데이터에 대해 임베딩 모델을 활용하여 문서 임베딩을 벡터DB에 저장 후 사용자 질의 발생 시 연관된 정보를 시맨틱 검색하여 획득된 정보를 바탕으로 질의 컨텍스트 개선 및 최적화
(2) 검색 증강 생성의 구현 기술
1) 검색기 (Retriever)의 구현 기술
구분 | 구현 기술 | 핵심 기능 |
---|---|---|
시맨틱 표현 | 청크 최적화 | 입력된 문서를 적당한 크기의 조각(chunk)으로 분할하고 적절한 크기로 조절 |
임베딩 모델 미세조정 | 청크와 질의를 의미론적 공간에 임베딩하는 단계에서 미세 조정을 통해 더 정확한 의미론적 표현 도출 | |
질의와 문서 일치화 | 질의 재작성 | 원래 질의와 문서 간 의미론적 일치를 향상시키기 위해 질의를 변형 |
임베딩 변환 | 질의와 문서를 동일한 의미론적 공간에 매핑하여 관련성 향상 | |
검색기와 LLM 일치화 | LLM 감독 학습 | 대규모 언어 모델(LLM)로부터 피드백 신호를 받아 임베딩 모델을 파인튜닝 |
어댑터 플러그인 | 외부의 어댑터를 추가적으로 부착(plug-in)하는 방식으로 정렬 |
2) 생성기 (Generator)의 구현 기술
구분 | 구현 기술 | 핵심 기능 |
---|---|---|
검색 결과 후처리 | 정보 압축 | 방대한 입력 정보를 압축하여 크기를 감소 |
순위 재설정 | 결과 문서 재배열하여 관련성 높은 항목을 상위 배치 | |
생성기 최적화 | 최적화 프로세스 | 일반적인 파인튜닝 방법과 유사하게 모델 학습 |
대조 학습 활용 | 다양한 유형의 데이터를 사용하여 일반화 능력 향상 |
3) 증강 방법 (Augmentation Methods)의 구현 기술
구분 | 구현 기술 | 핵심 기능 |
---|---|---|
증강 단계 | 사전 학습 | 텍스트 생성 품질을 향상시키고, 세부 작업에 더 잘 동작하는 기본 모델을 제공 |
파인 튜닝 | 정보 검색을 개선하기 위해 REPLUG, UPRISE 등의 방법 사용 | |
추론 | 정보 검색 및 생성을 개선하기 위해 DSP, DREA-ICL 등의 방법을 사용 | |
데이터 소스 증강 | 비정형 데이터 증강 | 프롬프트 데이터나 언어 데이터 등 텍스트 데이터 소스를 포함하여 언어 모델 예측 개선 |
정형 데이터 증강 | 검증된 고품질 데이터 컨텍스트와 정확하고 신뢰할 수 있는 정보를 제공 | |
증강 프로세스 | 반복적 검색 | 사용자의 질의(query)와 모델이 생성한 텍스트를 기반으로 추가 문서를 수집 |
적응형 검색 | 검색 타이밍과 내용을 능동적으로 판단하고 최적화하여 검색 대상에 접근 |
- 검색 증강 생성의 주요 지표로 답변의 충실성, 답변 관련성, 문맥 관련성이 있으며, 기능을 평가하기 위해 노이즈 견고성, 부정적 거부, 정보 통합, 사실적 견고성의 4가지 능력에 기반하여 벤치마크 기준 제안
- LLM에 검색 증강 생성을 적용하여 기술, 정책, 매뉴얼, 동영상, 로그 등을 지식 베이스로 전환하여 LLM의 신뢰성을 향상시키고 현장 지원, 직원 교육, 개발자 생산성 등 다양한 분야에서 활용 가능하나 외부 지식이나 검색 정보 의존 등 한계점 존재
3. 검색 증강 생성의 한계점 및 개선 방안
한계점 | 개선 방안 |
---|---|
– 외부 지식 및 검색 정보에 의존 – 창의적인 콘텐츠 생성이 제한 – 민감 데이터 접근으로 개인정보보호 문제 | – 콘텐츠 추천 및 가상 비서 등 개인 맞춤화로 사용 – 강화 학습 등 타 AI 기술과 통합 하이브리드 모델 – 합성 데이터 기반 개인정보 접근 최소화 |
- 검색 증강 생성은 창의적 콘텐츠 생성이 어렵고 개인정보보호 문제 등을 가지고 있지만 신뢰성을 확보한 LLM 사용이 가능하므로 챗봇, 개인 맞춤형 가상 비서 등에 사용될 것으로 예상
[참고]
- 엔비디아, RAG 위한 레퍼런스 아키텍처로 생성형 AI 구축 지원
- AWS, RAG란 무엇인가요
- elastic, 검색 증강 생성(RAG)이란
- 파이토치 사용자그룹, 대규모 언어 모델을 위한 검색-증강 생성(RAG) 기술 현황