Americké úřady podle Anthropic nařídily zastavit přístup k Fable 5 a Mythos 5 pro cizí státní příslušníky, firma proto vypnula oba modely všem zákazníkům. Pro kupce frontier AI je to varování, že compliance riziko už neleží jen v modelu, ale i ve státním vypínači.
Fable 5 teď není jen model v režimu incidentu. Je to cedule na dveřích datacentra: i nejlepší eval může prohrát s úředníkem, který má razítko a pátek večer volný.
Americká vláda nařídila Anthropic omezit přístup k Fable 5 a Mythos 5 pro všechny cizince, Anthropic proto vypnul modely všem zákazníkům. Protest 76 bezpečnostních expertů ukazuje slabé místo regulace: exportní kontrola neumí snadno odlišit útočný exploit od obranného testu.
Stát tady nesebral jen sirky pyromanovi. Na okamžik vzal žebřík i hasičům a pak čekal, že požár bude slušně hořet pomaleji.
Výzkum popsaný 404 Media tvrdí, že už 13 slov v načteném textu z webů jako Reddit, Wikipedia, Quora nebo Facebook může přimět AI agenty doporučovat spam nebo scam. Pro AI search to posouvá problém SEO do prostoru prompt injection a moderace user-generated contentu.
Staré SEO chtělo přelézt plot vyhledávače. Nový spam si sedne do knihovny, počká na asistenta a pošeptá mu třináct slov do ucha.
Anthropic vydal Claude Opus 4.8 se stejnou cenou jako Opus 4.7 a s důrazem na coding, agentic tasks a delší práci. Důležitější než tabulka benchmarků je ale posun k modelu, který má častěji říkat, kdy si není jistý.
Opus 4.8 není model, který má vývojáře ohromit jedním trikem. Je to kolega u whiteboardu, který se konečně občas zastaví, ukáže na špatný předpoklad a řekne: tady bych to nepouštěl do mainu.
Nathan Lambert oznámil odchod z Allen Institute for AI a využil ho jako bilanci práce na Olmo. Nejde jen o personální zprávu, ale o připomínku, že open modely stojí na institucích, které musejí vydržet déle než jeden silný tým.
Open AI nevítězí tím, že jeden výzkumník zatleská u release tlačítka. Vítězí ve chvíli, kdy po jeho odchodu zůstane laboratoř, checklist a další člověk, který ví, proč se ta data mají dát ven.
H Company vydala Holo3.1, rodinu computer-use modelů pro web, desktop, mobile a lokální inference. Nejdůležitější není jen vyšší skóre, ale snaha dostat agenta blíž k místu, kde se práce skutečně děje.
Holo3.1 je pokus vzít agenta z datacentra a posadit ho k vašemu vlastnímu monitoru. Skutečný test začne ve chvíli, kdy mu účetní aplikace hodí divné okno a nikdo vedle něj nedrží myš.
Latent Space shrnuje Microsoft Build jako okamžik, kdy Microsoft ukázal vlastní MAI modely vedle Copilotu, Windows a Web IQ. Klíčová ambice je mít kontrolu nad daty, inferencí a vývojářským workflow najednou a nepřenechat tuto páku jen partnerům.
Build 2026 byl signál, že Microsoft bere modelovou vrstvu zpět pod vlastní střechu. Copilot pak přestane být jen integrátorem cizích API a stane se produktem s vlastní páteří.
Bílý dům chce do 60 dnů připravit klasifikovaný cyber benchmark pro „covered frontier models“ a dobrovolný režim, v němž by federální vláda mohla dostat model až 30 dnů před releasem. Licence to formálně není, ale pro laby s federálními zákazníky to může začít fungovat podobně.
Washington si nestaví bránu s nápisem licence. Staví předsíň, ve které se frontier lab zastaví ještě před releasem a čeká, kdo mu otevře další dveře.
Uber podle Bloomberg omezuje měsíční tokenové výdaje zaměstnanců na 1 500 dolarů pro každý agentic coding tool. Z pilotů coding agents se tím stává rozpočtová disciplína.
Coding agents právě narazili na první pokladní okénko. Nevyhraje tým, který spálí nejvíc tokenů, ale ten, který dokáže účet za agenta přiřadit ke konkrétnímu merge.
Latent Space rozhovor s Andon Labs ukazuje evals, které vypadají méně jako test a víc jako provoz malého byznysu. Důležité jsou dlouhý horizont a skutečné následky.
Andon ukazuje agentovi něco horšího než test: otevřený obchod, zákazníka u pultu a účet, který někdo zaplatí. V takové scéně se schopnosti i selhání přestávají schovávat za skóre.
Google představil agentic RAG pro Gemini Enterprise Agent Platform, který před odpovědí kontroluje, zda má dost kontextu. Pro firmy je důležitější tato brzda než další hezká vrstva nad vyhledáváním.
Hodnota systému nestojí na počtu agentů v architektuře. Stojí na tom, zda má odpověď čitelnou stopu zpět ke zdroji, nebo skončí jako sebejistý text bez adresy.
Simon Willison vydal alpha balíček micropython-wasm a plugin pro Datasette Agent, který spouští Python uvnitř WebAssembly sandboxu. Klíčová otázka je, kde leží hranice mezi užitečným agentem a kódem, který má moc rozbít hostitelskou aplikaci.
Agent, který umí spouštět kód bez sandboxu, není kolega. Je to stážista s root přístupem a zvědavým prstem nad tlačítkem delete.
Latent Space publikoval text Auriel W o tom, proč nekvalitní RL environments kazí trénink agentů. Pointa je jednoduchá: v reinforcement learningu je prostředí generátor dat, takže bug v harnessu se stává učební látkou.
Rozbitý RL harness není špatná laboratoř. Je to učitel, který každé ráno napíše na tabuli chybnou lekci a pak se diví, že ji model poslušně opakuje.
Sebastian Raschka publikoval kurátorský seznam LLM paperů za leden až květen 2026. Jde o dobrý filtr pro týmy, které potřebují oddělit dlouhý research feed od témat použitelných v architektuře, agentech a inferenci.
Seznam, který má někdo celý spolknout, by nám Raschka nedělal. Jde o mapu na stěně: špendlíky ukazují směry, ale boty si při cestě za důkazem musí zašpinit každý tým sám.