Lilith Lilith.
CS EN PL
Začít

Zlaté pravidlo: Spolehlivost není vlastnost modelu, ale systému kolem něj: verifikace, fallbacky a evaly. Model, který zní jistě, a model, který má pravdu, jsou dvě různé věci.

Co znamená spolehlivost

Nejde jen o přesnost. Spolehlivý model má kalibraci, umí přiznat nejistotu, nemění odpověď dramaticky kvůli drobné změně promptu a neskrývá riziko za sebevědomý tón. V produkci je důležitější konzistentní chování než jeden wow screenshot.

Typické poruchy

Halucinace, falešné citace, špatná abstinence, prompt sensitivity, rozdílné odpovědi na stejné zadání a bezpečnostní regrese. Model může být silný a pořád nespolehlivý v konkrétní doméně. To je otravné, ale realita se neptá.

Jak se to zlepšuje

Pomáhá RAG s citacemi, evaly na vlastních datech, constrainty na výstup, kontrolní modely, human review a fallbacky. Ale hlavní je neměřit jen „odpověděl“. Měř, jestli odpověděl správně, kdy odmítl a kolik stála chyba.

Kam dál

Co si pamatovat

Spolehlivost není vlastnost modelu obecně. Je to vlastnost modelu v konkrétním workflow, s konkrétními daty a konkrétním rizikem.

Souvisí z Radaru