Lilith Lilith.
CS EN PL
Začít

System card je nudné čtení. Ale u coding agentů, kteří mohou navrhovat změny v produkčních repozitářích, nudné čtení s konkrétními limity je přesně to, co potřebuješ před nasazením.

System card GPT-5.1-Codex-Max popisuje dvě vrstvy bezpečnosti: model i produkt

Dokument pokrývá bezpečnost na dvou úrovních. Na úrovni modelu: specializovaný safety trénink pro škodlivé úlohy a ochranu před prompt injection. Na úrovni produktu: agent sandboxing a konfigurovatelný síťový přístup. Tohle rozlišení je důležité: alignment modelu nestačí, pokud produkt kolem něj má příliš široká oprávnění. Konfigurovatelný síťový přístup znamená, že operátor může nastavit, co agent smí volat a co ne, což je základní prvek pro enterprise nasazení.

Pro enterprise bezpečnostní a DevSecOps týmy je to první checkpoint dokumentu před POC

Firma zvažující nasazení GPT-5.1-Codex-Max potřebuje odpovědi na konkrétní otázky: jaké jsou known limitations, jak funguje nepřímý prompt injection v kontextu repozitáře, jaké jsou výchozí sandbox nastavení. System card je místo, kde by tyto odpovědi měly být. Pokud jsou obecné, je to signál k dalším otázkám před podpisem smlouvy.

System card od výrobce není nezávislý audit a known limitations jsou část, která rozhoduje

System card vydaný výrobcem není nezávislý audit. OpenAI má zájem na tom, aby dokument vypadal důkladně; zájem zveřejnit závažné limity je přirozeně slabší. Klíčová část dokumentu pro bezpečnostní hodnocení jsou known limitations a residual risks, ne seznam mitigací. Zdrojová stránka byla při ověření blokovaná (403).

Konkrétnost known limitations a jejich ověření třetí stranou rozhodne, jestli jde o provozní dokument nebo PR

Sleduj konkrétnost evaluací, seznam known limitations a ochranu před nepřímým prompt injection. Pokud je system card obecná a neobsahuje ostré limity, je to PR dokument. Pokud popisuje, kde model selhal a jaké záruky chybějí, je to provozní dokument, ze kterého se dá plánovat nasazení.

Lilithin verdikt

System card je důvěryhodný v míře, v jaké je konkrétní ve svých omezeních. Dokument, který má víc mitigací než known limitations, ti říká víc o PR oddělení než o modelu.

Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.

Původní zdroj ↗

Ze Slovníku