RAG (Retrieval-Augmented Generation) on tehnika, kus AI-mudelile antakse vastuse genereerimiseks juurde päringuga seotud välised dokumendid. See vähendab hallutsinatsioone ja võimaldab mudelil töötada värske või konfidentsiaalse infoga.
Kuidas see töötab?
- Kasutaja küsib küsimuse
- Süsteem otsib vektorbaasist (näiteks Pinecone, Weaviate) sarnaseid dokumente
- Top-K dokumendid lisatakse promptile
- LLM vastab nii oma teadmistele kui leitud dokumentidele tuginedes
Eesti kasutusjuht
Eesti riigi KrattAI 2.0 kasutab RAG-i: vastab kodaniku küsimustele riigi teenuste kohta tuginedes ametlikele juhenditele eesti.ee-st ja Maksuameti andmetele.