- Large Language Model (LLM): 대규모 텍스트 데이터를 학습한 인공지능 모델로, 인간 언어를 이해하고 생성할 수 있음.
- 자연어 처리(NLP) 모델: 인간의 언어를 다루는 다양한 작업에 사용됨(번역, 요약, 질문 응답 등).
- 대규모 데이터 학습: 인터넷의 문서, 책, 뉴스 등 방대한 데이터를 학습해 언어의 구조와 의미를 파악함.
- 수십억 개 이상의 파라미터: 학습한 정보를 저장하는 파라미터 수가 많아질수록 모델의 성능이 향상됨.
- 문맥 이해: 단어 간의 관계와 문장의 의미를 문맥적으로 파악해 자연스러운 언어 생성 가능.
- 다양한 작업 수행: 대화 생성, 질문 응답, 글쓰기 지원, 번역 등 다양한 언어 관련 작업을 처리함.
- 사전 학습 + 미세 조정: 기본적으로 광범위한 데이터를 학습한 후 특정 작업에 맞춰 추가 학습(미세 조정) 가능.
- 한계점: 모든 답변이 정확하거나 완벽하지 않으며, 창의성이나 감정을 이해하지는 못함.
'AI ( Artificial Intelligence )' 카테고리의 다른 글
Vector ( 벡터 ) ( AI :: Embeding :: Vector ) (5) | 2024.10.18 |
---|---|
임베딩(Embedding) (4) | 2024.10.17 |
Few Shot Learning (3) | 2024.10.16 |
Prompt ( 프롬프트 ) (0) | 2024.10.14 |
RAG ( Retrieval-Augmented Genration ) (1) | 2024.10.11 |