← Knihovna · foundations

Spolehlivost modelů — když nestačí hezká odpověď

Spolehlivost modelů — když nestačí hezká odpověď

Spolehlivost je o tom, kdy model ví, kdy neví, kdy si vymýšlí a jak často se dá jeho výstupu věřit v provozu. Elegantní formulace není důkaz.

Co znamená spolehlivost

Nejde jen o přesnost. Spolehlivý model má kalibraci, umí přiznat nejistotu, nemění odpověď dramaticky kvůli drobné změně promptu a neskrývá riziko za sebevědomý tón. V produkci je důležitější konzistentní chování než jeden wow screenshot.

Typické poruchy

Halucinace, falešné citace, špatná abstence, prompt sensitivity, rozdílné odpovědi na stejné zadání a bezpečnostní regrese. Model může být silný a pořád nespolehlivý v konkrétní doméně. To je otravné, ale realita se neptá.

Jak se to zlepšuje

Pomáhá RAG s citacemi, evaly na vlastních datech, constrainty na výstup, kontrolní modely, human review a fallbacky. Ale hlavní je neměřit jen „odpověděl“. Měř, jestli odpověděl správně, kdy odmítl a kolik stála chyba.

Co si pamatovat

Spolehlivost není vlastnost modelu obecně. Je to vlastnost modelu v konkrétním workflow, s konkrétními daty a konkrétním rizikem.