Lilith Lilith.
CS EN PL
Zacznij

Anthropic twierdzi, że 12 czerwca o 5:21 czasu ET dostał od amerykańskich władz dyrektywę eksportową zakazującą dostępu do Fable 5 i Mythos 5 wszystkim cudzoziemcom, także części pracowników firmy. Spółka uznała, że nie da się tego praktycznie egzekwować selektywnie, więc wyłączyła oba modele wszystkim klientom. Pozostałe modele Anthropic mają działać bez zmian.

Dyrektywa miała trafić w cudzoziemców, a dotknęła każdego użytkownika

Rządowy list nie jest publiczny. Anthropic pisze, że nie zawierał szczegółów dotyczących zagrożenia dla bezpieczeństwa narodowego, a firma rozumie sprawę jako obawę przed obejściem zabezpieczeń, czyli jailbreakiem Fable 5. Po obejrzeniu demonstracji Anthropic stwierdził, że chodziło o kilka wcześniej znanych i raczej prostych podatności, które inne publiczne modele też potrafią znaleźć bez bypassu.

TechCrunch dokłada do tego ostrzejszą ramę: sprawa nie wygląda jak zwykły incydent techniczny, lecz jak dowód, że rząd USA może szybko wejść w działający produkt AI bez publicznie wyjaśnionej procedury. To ważniejsze niż sam jailbreak. Model można poprawić. Precedens wyłącznika zostaje w głowach klientów.

Klient enterprise kupuje teraz także polityczną niezawodność dostawcy

Dla firm, instytucji publicznych i operatorów krytycznej infrastruktury to inny rodzaj ryzyka niż zwykła awaria API. Produkt może stać na frontier modelu od technicznie mocnego, ostrożnego i gotowego komercyjnie dostawcy, a mimo to przestać działać przez interpretację przepisów eksportowych.

To przesuwa rozmowę zakupową ku mniej efektownym pytaniom: jak szybko da się przełączyć workload na inny model, kto odpowiada za przerwę, co dzieje się poza USA i jak bardzo umowa zależy od prawa jednego państwa. AI governance przesuwa się z model cards i evals w stronę odporności operacyjnej.

Jailbreak słabo tłumaczy globalne zdjęcie modelu

Anthropic podaje, że Fable 5 przed premierą przeszedł tysiące godzin red-teamingu z udziałem zespołów rządowych, prywatnych i wewnętrznych. Firma przyznaje też niewygodną rzecz: pełna odporność na jailbreaki prawdopodobnie nie istnieje dziś u żadnego dostawcy. To osłabia argument, że wąski bypass sam wystarczy do globalnego wycofania komercyjnego modelu.

Bez publicznego listu nie da się uczciwie rozstrzygnąć, czy urzędnicy przecenili raport bezpieczeństwa, reagowali na niejawny kontekst, czy działali w politycznym sporze. Problemem jest właśnie ta nieprzejrzystość. Rynek uczy się nie tyle bezpiecznego wdrażania AI, ile czekania na kolejną kopertę.

O wyniku zdecyduje powrót modeli i pierwsze zapisy w umowach

Krótki sygnał jest prosty: jeśli Anthropic szybko przywróci Fable 5 i Mythos 5, z jasnym ograniczeniem i bez dużej utraty klientów, będzie to bolesny epizod. Jeśli przerwa się przeciągnie, stanie się argumentem za architekturami multi-model i mniejszą zależnością od jednego amerykańskiego laboratorium.

Drugi sygnał pojawi się w umowach. Gdy procurement enterprise zacznie wymagać fallback models, regionalnych gwarancji działania i wyraźnych zapisów o interwencji państwa, będzie jasne, że ta dyrektywa zmieniła więcej niż jeden release.

Werdykt Lilith

Fable 5 to już nie tylko model w trybie incydentu. To kartka na drzwiach datacenter: najlepszy eval może przegrać z urzędnikiem, który ma pieczątkę i wolny piątkowy wieczór.

Link zewnętrzny zostawiam na koniec. Najpierw krótkie wyjaśnienie tutaj, bez polowania po cudzej stronie.

Oryginalne źródło ↗