본문 바로가기
AI ( Artificial Intelligence )

RAG ( Retrieval-Augmented Genration )

by 크라00 2024. 10. 11.

 

  • Retrieval-Augmented Generation (RAG): 검색 기반 정보와 텍스트 생성을 결합한 AI 모델.
  • Retrieval (검색): 외부 데이터베이스에서 관련 정보를 실시간으로 검색하여 필요한 데이터를 가져옴.
  • Augmented Generation (증강 생성): 검색된 정보를 바탕으로 더 풍부하고 정확한 텍스트를 생성.
  • 정보 검색과 생성의 결합: RAG는 검색된 정보를 기반으로 답변을 생성하므로 단순히 훈련된 데이터에만 의존하지 않음.
  • 실시간 정보 활용: 외부에서 검색된 최신 정보나 특정 데이터를 활용해 보다 적절한 응답을 생성함.
  • 다양한 응용 분야: 질문 답변, 문서 요약, 정보 검색 챗봇 등에서 사용됨.
  • 정확도 향상: 기존 생성 모델보다 검색을 통해 정보의 정확도와 신뢰성을 높임.
  • 대규모 데이터베이스 활용: 사전에 훈련된 데이터 외에, 실시간으로 대규모 문서나 데이터베이스를 활용할 수 있음.
  • 한계점: 검색된 정보가 잘못되었거나 불완전한 경우, 생성된 텍스트도 부정확할 수 있음.

 

LLM 의 비즈니스 커스터마이징 및 할루시네이션을 피하기 위해서 도입하는 기술이다.

 

  • 기존 LLM의 한계: LLM은 학습된 데이터에 의존하기 때문에, 때때로 최신 정보나 매우 구체적인 지식이 필요할 때 할루시네이션을 일으킬 수 있어요. 즉, 자신이 알지 못하는 사실을 만들어 내는 경우가 발생할 수 있습니다.
  • RAG의 역할: RAG는 이러한 문제를 해결하기 위해 실시간 정보 검색을 활용합니다. 모델이 답변을 생성할 때, 내부적으로 외부 데이터베이스나 지식 그래프에서 관련 정보를 검색하고 이를 바탕으로 답을 생성하는 방식이죠. 이렇게 하면 모델이 최신 정보나 매우 특정한 질문에 대해 더 정확하고 신뢰성 있는 답변을 할 수 있어요.
  • 비즈니스 커스터마이징: RAG는 비즈니스 환경에서 특정 도메인에 맞춘 답변을 제공할 수 있도록 검색 소스를 사용자 정의할 수 있습니다. 예를 들어, 기업의 내부 데이터베이스나 제품 정보에 기반한 응답을 제공하도록 커스터마이징하여, 일반적인 LLM보다 더 정확하고 일관된 응답을 생성할 수 있어요.
  • 할루시네이션 방지: RAG는 LLM이 훈련된 데이터 외에도 실시간으로 검색된 정보를 활용하기 때문에, 생성된 답변이 잘못된 정보로 가득 차는 할루시네이션 현상을 크게 줄일 수 있습니다. 검색된 외부 데이터를 기반으로 생성된 응답은 신뢰성이 더 높기 때문입니다.

 

 

 

'AI ( Artificial Intelligence )' 카테고리의 다른 글

Vector ( 벡터 ) ( AI :: Embeding :: Vector )  (5) 2024.10.18
임베딩(Embedding)  (4) 2024.10.17
Few Shot Learning  (3) 2024.10.16
Prompt ( 프롬프트 )  (0) 2024.10.14
LLM ( Large Language Model )  (2) 2024.10.10