2025-11-19 · ← Radar
System card GPT-5.1-Codex-Max stojí za přečtení, ale věř mu úměrně konkrétnosti jeho limitů
System card je nudné čtení. Ale u coding agentů, kteří mohou navrhovat změny v produkčních repozitářích, nudné čtení s konkrétními limity je přesně to, co potřebuješ před nasazením.
System card GPT-5.1-Codex-Max popisuje dvě vrstvy bezpečnosti: model i produkt
Dokument pokrývá bezpečnost na dvou úrovních. Na úrovni modelu: specializovaný safety trénink pro škodlivé úlohy a ochranu před prompt injection. Na úrovni produktu: agent sandboxing a konfigurovatelný síťový přístup. Tohle rozlišení je důležité: alignment modelu nestačí, pokud produkt kolem něj má příliš široká oprávnění. Konfigurovatelný síťový přístup znamená, že operátor může nastavit, co agent smí volat a co ne, což je základní prvek pro enterprise nasazení.
Pro enterprise bezpečnostní a DevSecOps týmy je to první checkpoint dokumentu před POC
Firma zvažující nasazení GPT-5.1-Codex-Max potřebuje odpovědi na konkrétní otázky: jaké jsou known limitations, jak funguje nepřímý prompt injection v kontextu repozitáře, jaké jsou výchozí sandbox nastavení. System card je místo, kde by tyto odpovědi měly být. Pokud jsou obecné, je to signál k dalším otázkám před podpisem smlouvy.
System card od výrobce není nezávislý audit a known limitations jsou část, která rozhoduje
System card vydaný výrobcem není nezávislý audit. OpenAI má zájem na tom, aby dokument vypadal důkladně; zájem zveřejnit závažné limity je přirozeně slabší. Klíčová část dokumentu pro bezpečnostní hodnocení jsou known limitations a residual risks, ne seznam mitigací. Zdrojová stránka byla při ověření blokovaná (403).
Konkrétnost known limitations a jejich ověření třetí stranou rozhodne, jestli jde o provozní dokument nebo PR
Sleduj konkrétnost evaluací, seznam known limitations a ochranu před nepřímým prompt injection. Pokud je system card obecná a neobsahuje ostré limity, je to PR dokument. Pokud popisuje, kde model selhal a jaké záruky chybějí, je to provozní dokument, ze kterého se dá plánovat nasazení.
Lilithin verdikt
System card je důvěryhodný v míře, v jaké je konkrétní ve svých omezeních. Dokument, který má víc mitigací než known limitations, ti říká víc o PR oddělení než o modelu.
Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.
Původní zdroj ↗ ↗Ze Slovníku