[AWS교육]비즈니스 관점에서 RAG의 이해

[AWS교육]비즈니스 관점에서 RAG의 이해

2024. 5. 28. 10:51ㆍAI

728x90

(참고) RAG의 기본개념

RAG는 "Retrieval-Augmented Generation"의 약자로, 텍스트 생성 모델의 성능을 향상시키기 위해 검색(retrieval) 기술을 결합한 접근 방식입니다. RAG는 크게 두 가지 주요 컴포넌트로 구성됩니다:

검색 컴포넌트 (Retrieval Component):
- 이 컴포넌트는 대규모 데이터베이스나 문서 집합에서 관련 정보를 검색하는 역할을 합니다.
- 주어진 입력 문장이나 질문에 대해 관련성이 높은 문서를 찾아냅니다.
- 이 과정은 보통 검색 엔진이나 특정 문서 임베딩 기법을 사용하여 이루어집니다.
생성 컴포넌트 (Generation Component):
- 이 컴포넌트는 검색된 정보를 바탕으로 자연스러운 텍스트를 생성합니다.
- 주로 트랜스포머(Transformer) 기반의 언어 모델을 사용합니다.
- 검색된 문서의 내용을 참고하여 질문에 대한 답변을 생성하거나 특정 주제에 대한 설명을 제공합니다.

RAG는 이러한 검색과 생성의 결합을 통해 보다 풍부하고 신뢰성 높은 텍스트 생성 시스템을 구축하는 데 중요한 역할을 합니다.

ㆍRAG

- 질의응답 X

- 정답이 포함된 문서를 찾는 기술 O

embeding : semantic의미 있는 array의 형태로 저장되는

embeding값과의 유사성이 있는 대상을 추출.

* semantic은 물론이고 lexical도 포함되어야함.

*Cross-Encoder 단점 : 모든 대상을 계산해야해서 오래걸린다

* Bi-Encoder 장점 : 빠르다

ㆍwrap up

728x90

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`