Sõnastik

LLM (suur keelemudel)

inglise keeles: Large Language Model

Suur neuroon-võrgule põhinev mudel, mis on treenitud miljarditele tekstinäidistele ja suudab genereerida ning mõista inimkeelt.

Suur keelemudel (Large Language Model, lühend LLM) on tehisintellekti mudel, mis on treenitud tohutul hulgal tekstil — internetil, raamatutel, koodibaasidel — ja suudab kirjutada, vestelda, analüüsida ning teha keerukaid keelelisi ülesandeid.

Põlvkonnad

LLM-id on arenenud läbi mitmete põlvkondade:

GPT-1, GPT-2 (2018-2019) — esimesed transformatorid, sadu miljonid parameetrid
GPT-3 (2020) — 175 miljardit parameetrit, esimene kommerts-skaalal kasulik mudel
ChatGPT (GPT-3.5, 2022) — RLHF (inimese tagasiside) ja vestlusliides
GPT-4, Claude 3, Gemini (2023-2024) — multimodaalsed, suurem kontekst
Claude Opus 4, GPT-5, Gemini 2 (2025-2026) — reasoning-mudelid, agendid, pikk kontekst (1M+ tokenit)

Põhilised mõisted

Parameetrid — mudeli “kaalud”, õpitud treeningu käigus. Tänapäeva tipptasemel mudelid: 70B-1T+ parameetreid
Tokenid — sisu jagatakse väikesteks tükkideks (umbes 4 tähemärki = 1 token inglise keeles, eesti keeles tihti vähem)
Kontekstaken — kui palju teksti mudel korraga töödelda saab (Claude Opus 4.7 — 1M tokenit)
Hallutsinatsioon — kui mudel “väljamõtleb” valeväiteid