Suur keelemudel (Large Language Model, lühend LLM) on tehisintellekti mudel, mis on treenitud tohutul hulgal tekstil — internetil, raamatutel, koodibaasidel — ja suudab kirjutada, vestelda, analüüsida ning teha keerukaid keelelisi ülesandeid.
Põlvkonnad
LLM-id on arenenud läbi mitmete põlvkondade:
- GPT-1, GPT-2 (2018-2019) — esimesed transformatorid, sadu miljonid parameetrid
- GPT-3 (2020) — 175 miljardit parameetrit, esimene kommerts-skaalal kasulik mudel
- ChatGPT (GPT-3.5, 2022) — RLHF (inimese tagasiside) ja vestlusliides
- GPT-4, Claude 3, Gemini (2023-2024) — multimodaalsed, suurem kontekst
- Claude Opus 4, GPT-5, Gemini 2 (2025-2026) — reasoning-mudelid, agendid, pikk kontekst (1M+ tokenit)
Põhilised mõisted
- Parameetrid — mudeli “kaalud”, õpitud treeningu käigus. Tänapäeva tipptasemel mudelid: 70B-1T+ parameetreid
- Tokenid — sisu jagatakse väikesteks tükkideks (umbes 4 tähemärki = 1 token inglise keeles, eesti keeles tihti vähem)
- Kontekstaken — kui palju teksti mudel korraga töödelda saab (Claude Opus 4.7 — 1M tokenit)
- Hallutsinatsioon — kui mudel “väljamõtleb” valeväiteid