[AWS교육]비즈니스 관점에서 RAG의 이해

입력 받기: 사용자가 질문이나 문장을 입력합니다.
정보 검색: 입력된 내용을 기반으로 검색 컴포넌트가 관련 문서를 데이터베이스에서 검색합니다.
정보 통합: 검색된 문서의 정보를 바탕으로 생성 컴포넌트가 자연스러운 텍스트를 생성합니다.
응답 제공: 최종적으로 생성된 텍스트가 사용자에게 제공됩니다.

광드 2024. 5. 28. 10:51

728x90

(참고) RAG의 기본개념

RAG는 "Retrieval-Augmented Generation"의 약자로, 텍스트 생성 모델의 성능을 향상시키기 위해 검색(retrieval) 기술을 결합한 접근 방식입니다. RAG는 크게 두 가지 주요 컴포넌트로 구성됩니다:

검색 컴포넌트 (Retrieval Component):
- 이 컴포넌트는 대규모 데이터베이스나 문서 집합에서 관련 정보를 검색하는 역할을 합니다.
- 주어진 입력 문장이나 질문에 대해 관련성이 높은 문서를 찾아냅니다.
- 이 과정은 보통 검색 엔진이나 특정 문서 임베딩 기법을 사용하여 이루어집니다.
생성 컴포넌트 (Generation Component):
- 이 컴포넌트는 검색된 정보를 바탕으로 자연스러운 텍스트를 생성합니다.
- 주로 트랜스포머(Transformer) 기반의 언어 모델을 사용합니다.
- 검색된 문서의 내용을 참고하여 질문에 대한 답변을 생성하거나 특정 주제에 대한 설명을 제공합니다.