본문 바로가기
AI ( Artificial Intelligence )

LLM ( Large Language Model )

by 크라00 2024. 10. 10.

 

  • Large Language Model (LLM): 대규모 텍스트 데이터를 학습한 인공지능 모델로, 인간 언어를 이해하고 생성할 수 있음.
  • 자연어 처리(NLP) 모델: 인간의 언어를 다루는 다양한 작업에 사용됨(번역, 요약, 질문 응답 등).
  • 대규모 데이터 학습: 인터넷의 문서, 책, 뉴스 등 방대한 데이터를 학습해 언어의 구조와 의미를 파악함.
  • 수십억 개 이상의 파라미터: 학습한 정보를 저장하는 파라미터 수가 많아질수록 모델의 성능이 향상됨.
  • 문맥 이해: 단어 간의 관계와 문장의 의미를 문맥적으로 파악해 자연스러운 언어 생성 가능.
  • 다양한 작업 수행: 대화 생성, 질문 응답, 글쓰기 지원, 번역 등 다양한 언어 관련 작업을 처리함.
  • 사전 학습 + 미세 조정: 기본적으로 광범위한 데이터를 학습한 후 특정 작업에 맞춰 추가 학습(미세 조정) 가능.
  • 한계점: 모든 답변이 정확하거나 완벽하지 않으며, 창의성이나 감정을 이해하지는 못함.

 

'AI ( Artificial Intelligence )' 카테고리의 다른 글

Vector ( 벡터 ) ( AI :: Embeding :: Vector )  (5) 2024.10.18
임베딩(Embedding)  (4) 2024.10.17
Few Shot Learning  (3) 2024.10.16
Prompt ( 프롬프트 )  (0) 2024.10.14
RAG ( Retrieval-Augmented Genration )  (1) 2024.10.11