← Slovník · Pojem
Spolehlivost modelů — když nestačí hezká odpověď
Spolehlivost je o tom, kdy model ví, kdy neví, kdy si vymýšlí a jak často se dá jeho výstupu věřit v provozu. Elegantní formulace není důkaz.
Zlaté pravidlo: Spolehlivost není vlastnost modelu, ale systému kolem něj: verifikace, fallbacky a evaly. Model, který zní jistě, a model, který má pravdu, jsou dvě různé věci.
Co znamená spolehlivost
Nejde jen o přesnost. Spolehlivý model má kalibraci, umí přiznat nejistotu, nemění odpověď dramaticky kvůli drobné změně promptu a neskrývá riziko za sebevědomý tón. V produkci je důležitější konzistentní chování než jeden wow screenshot.
Typické poruchy
Halucinace, falešné citace, špatná abstinence, prompt sensitivity, rozdílné odpovědi na stejné zadání a bezpečnostní regrese. Model může být silný a pořád nespolehlivý v konkrétní doméně. To je otravné, ale realita se neptá.
Jak se to zlepšuje
Pomáhá RAG s citacemi, evaly na vlastních datech, constrainty na výstup, kontrolní modely, human review a fallbacky. Ale hlavní je neměřit jen „odpověděl“. Měř, jestli odpověděl správně, kdy odmítl a kolik stála chyba.
Kam dál
- Hallucination Leaderboard — průběžné měření, jak často modely fabulují při sumarizaci.
- AI Engineering — jak stavět spolehlivost systémově: evaluace, guardrails, fallbacky.
Co si pamatovat
Spolehlivost není vlastnost modelu obecně. Je to vlastnost modelu v konkrétním workflow, s konkrétními daty a konkrétním rizikem.
Souvisí z Radaru