Štítek
#Simon Willison
Z Radaru
Radar · 2026-06-15
Uber našel cenovku pro coding agents: 1 500 dolarů měsíčně na nástroj
Uber podle Bloomberg omezuje měsíční tokenové výdaje zaměstnanců na 1 500 dolarů pro každý agentic coding tool. Z pilotů coding agents se tím stává rozpočtová disciplína.
Číst →Radar · 2026-06-15
Simon Willison ukazuje, proč sandbox pro agenty nesmí být jen další Python proces
Simon Willison vydal alpha balíček micropython-wasm a plugin pro Datasette Agent, který spouští Python uvnitř WebAssembly sandboxu. Klíčová otázka je, kde leží hranice mezi užitečným agentem a kódem, který má moc rozbít hostitelskou aplikaci.
Číst →Radar · 2026-06-08
Apple vrátilo Siri do hry přes Gemini, ale důkaz teprve čeká ve frontě
Apple na WWDC 2026 oznámilo Siri AI a další Apple Intelligence funkce, přičemž pro náročné úlohy rozšiřuje Private Cloud Compute na Google Cloud s NVIDIA GPU. Po loňském fiasku s Apple Intelligence ale nejde o prezentaci, nýbrž o test, jestli se Siri konečně ukáže mimo keynote.
Číst →Radar · 2026-06-07
datasette-agent-edit řeší nudnou část agentů: bezpečné úpravy textu
Simon Willison vydal datasette-agent-edit 0.1a0, základní plugin pro Datasette Agent s nástroji view, str_replace a insert. Nejde o velké AI demo, ale o praktickou vrstvu, která rozhoduje, jestli agent umí text měnit bez zbytečného rozbití souboru.
Číst →Radar · 2026-06-05
Lockdown Mode řeže nejnebezpečnější cestu prompt injection
OpenAI spustila Lockdown Mode pro vybrané osobní účty ChatGPT a self-serve ChatGPT Business. Neřeší prompt injection jako takovou, ale omezuje odchozí síťové požadavky, tedy místo, kudy mohou utéct citlivá data.
Číst →Radar · 2026-05-30
Service worker zachytí HTTP request a odbaví ho v Python ASGI aplikaci přímo v browseru
Simon Willison experimentuje s přístupem, kde Python ASGI aplikace běží přímo v browseru díky Pyodide a service workeru. Povedlo se spustit FastAPI a kompletní Datasette 1.0a31. Záměr je distribuce: demo nebo datový nástroj jako webová stránka bez serveru.
Číst →Radar · 2026-05-29
Anthropic přeskočil $47 miliard run-rate revenue za pět měsíců a tempo roste
Simon Willison upozornil na číslo z investičního oznámení Anthropic: run-rate revenue překročil $47 miliard. Dramatický je zejména nárůst z $9 miliard v prosinci 2025 na $30 miliard v dubnu a $47 miliard v květnu 2026.
Číst →Radar · 2026-05-28
Opus 4.8 čtyřikrát méně přehlíží chyby v kódu a zavádí aktualizace instrukcí uprostřed konverzace
Anthropic vydal Opus 4.8 s jednou konkrétní metrikou: model je čtyřikrát méně pravděpodobný, že přehlédne chybu v kódu než předchůdce. Zároveň přidává mid-conversation system messages a snížil minimální velikost prompt cache z 4 096 na 1 024 tokenů.
Číst →Radar · 2026-05-27
SQLite kreslí čáru: agentní kód ne, reprodukovatelné bugy ano
SQLite přidalo do repozitáře AGENTS.md s velmi jasným vzkazem pro lidi, kteří na kód pouštějí AI agenty: projekt nepřijímá agentně vytvořený kód, ale může přijmout kvalitní bug report s reprodukovatelným testem. Je to malý soubor, ale velký signál pro údržbu kritického open source.
Číst →Radar · 2026-05-26
Copilot Cowork převádí oprávnění uživatele na cestu k souborům přes prompt injection
Výzkumníci z PromptArmor ukázali řetězec útoku, ve kterém Microsoft Copilot Cowork může přes prompt injection pomoci s únikem souborů z Microsoft 365. Nejde jen o chybu jednoho produktu, ale o varování pro všechny agentické systémy s delegovanými oprávněními.
Číst →Radar · 2026-05-11
Coding agent musí snižovat maintenance cost, nebo je to jen dražší technický dluh
James Shore formuluje nepříjemnou matematiku coding agentů: pokud agent zdvojnásobí výstup, ale maintenance náklady zůstanou stejné, tým nevydělal rychlost, zdvojnásobil zadluženost.
Číst →Radar · 2026-05-07
Mozilla s Claude Mythos opravila stovky chyb ve Firefoxu. Kvalita AI bezpečnostních reportů se zlomila.
Simon Willison popsal, jak Mozilla využila přístup k Claude Mythos Preview k systematickému hledání a opravě zranitelností ve Firefoxu. V dubnu 2026 stoupl počet opravených bezpečnostních chyb na 423, oproti obvyklým 20 až 30 za měsíc. Klíčová změna: AI bezpečnostní reporty přestaly být šum a začaly být použitelný vstup.
Číst →Radar · 2025-11-18
Gemini 3 Pro v praxi: dobrá transkripce, ale timestamps lžou a nikdo nezná pelikána
Simon Willison testoval Gemini 3 Pro na tříhodinovém záznamu z obecního zastupitelství a na přepracovaném pelican benchmarku. Výsledek: strukturovaná transkripce za 1,42 dolarů, ale timestamps jsou nepřesné o desítky minut. A žádný ze srovnaných modelů nepochopil, že California brown pelican hnědý vlastně není.
Číst →Radar · 2025-11-06
Async coding agenti jako výzkumné vlákno: Willison střílí úlohy do PR
Simon Willison popisuje fire-and-forget workflow s Claude Code, Codex a dalšími coding agenty: zadáš výzkumnou otázku, agent pracuje na serveru a vrátí PR. Kód je důkaz proveditelnosti, ne jen text.
Číst →Radar · 2025-11-02
Dvě nové práce o prompt injection: Rule of Two odhaluje strukturální riziko, útočník reaguje na obrany adaptivně
Simon Willison upozornil na dvě nové práce o prompt injection agentů. Meta's Rule of Two říká, že systém je bezpečný tehdy, když má najednou nejvýše dvě ze tří vlastností: přijímá nedůvěryhodný vstup, přistupuje k citlivým datům, mění stav nebo komunikuje ven. Druhá práce od výzkumníků z OpenAI, Anthropic a DeepMind ukázala, že 12 publikovaných obran překonaly adaptivní útoky s úspěšností přes 90 %.
Číst →Radar · 2025-10-20
Claude Code for web: asynchronní coding agent v sandboxu, bez notebooku
Simon Willison otestoval Claude Code for web: Anthropic vzala sílu lokálního Claude Code, zavřela ji do hostovaného sandboxu a přidala pohodlné zadávání přes web a mobil. Klíčový posun spočívá v nové architektuře workflow: coding agenti se stávají užitečnějšími, když běží asynchronně a bezpečně mimo náš notebook.
Číst →