Fable 5 se vrací, ale vláda mu přidala těžší bezpečnostní brzdu | Radar

Anthropic po zásahu americké vlády vrací Claude Fable 5 do provozu. Firma říká, že exportní kontroly z 12. června byly 30. června zrušeny a Fable 5 je od 1. července znovu dostupný globálně v Claude Platform, Claude.ai, Claude Code a Claude Cowork.

Fable 5 se vrátil po osmnácti dnech vládního stopu

Primární zdroj je komentář Zviho Mowshowitze, ale klíčová fakta potvrzuje i oznámení Anthropic. Podle něj vláda USA 12. června uvalila exportní kontroly na Claude Fable 5 a Claude Mythos 5. Anthropic neuměl v reálném čase spolehlivě ověřit státní příslušnost uživatelů, takže přístup dočasně vypnul všem.

Firma uvádí, že kontroly byly 30. června zrušeny. Fable 5 se vrací globálně do Claude Platform, Claude.ai, Claude Code a Claude Cowork. Pro Pro, Max, Team a vybrané Enterprise plány je do 7. července zahrnutý až do 50 % týdenních limitů, potom má běžet přes usage credits. Přístup přes AWS, Google Cloud a Microsoft Foundry chce Anthropic obnovit co nejrychleji.

Mythos 5 má už obnovený přístup pro vybrané americké organizace po souhlasu vlády z 26. června. Širší partnerský program Glasswing zůstává postupný.

Vládní panika se proměnila v produktové omezení pro bezpečnostní práci

Incident začal zprávou výzkumníků Amazonu, kteří podle Anthropic našli způsob, jak u Fable 5 obejít safeguardy a dostat model k identifikaci zranitelností. V jednom případě měl model dodat i ukázku exploitu. Anthropic tvrdí, že stejné zranitelnosti nebo stejnou demonstraci zvládly i méně schopné modely včetně Opus 4.8, GPT-5.5 a Kimi K2.7.

Důležité je, že spor nezůstal u blogpostu a tiskového prohlášení. Výsledkem je tvrdší classifier. Ten má konkrétní techniku z reportu blokovat ve více než 99 % případů, ale Anthropic zároveň přiznává vyšší počet falešných zásahů u běžného kódování a debuggingu. Některé požadavky proto spadnou zpět na Opus 4.8.

Pro bezpečnostní týmy je to praktický problém. Model může být bezpečnější proti zneužití, ale horší pro defenzivní práci, kde dotazy vypadají podobně jako útok.

Nový classifier řeší incident, ne pravidla hry

Zviho silná teze je, že USA pořád rozhodují ad hoc. V tom má pointu. Pokud stačí jeden report a politická eskalace k vypnutí frontier modelu pro všechny, firmy budou optimalizovat nejen model safety, ale i to, jak vypadá jejich vztah s vládou.

Anthropic se snaží posunout věc ke sdílenému frameworku pro hodnocení jailbreaků. To je rozumný směr. Slabé místo je přesnost. Přísnější classifier může udělat dobrou prezentaci pro úředníka, ale v produkci se počítá, kolik legitimních požadavků zahodí a kolik týmů kvůli tomu uteče ke slabším, levnějším nebo méně kontrolovaným modelům.

Rozhodne poměr mezi odmítnutím a užitečností

Sledovat se vyplatí tři signály: jak rychle Anthropic sníží false positives, kdy obnoví cloudové kanály a zda vznikne průmyslový standard pro hlášení jailbreaků, který nebude záviset na telefonátu do Washingtonu.

Fable 5 je zpět, ale účet za incident se bude platit v každém odmítnutém debuggingu. Pokud se z toho stane nový normál, bezpečnostní politika začne rozhodovat o kvalitě vývojářského workflow stejně tvrdě jako samotný model.

Lilithin verdikt

Fable 5 se vrátil jako cestující po zbytečné kontrole na letišti: kufr má zalepený páskou, všichni tleskají a teprve u brány zjistíme, kolik užitečných věcí mu ochranka vyhodila.