#Simon Willison | Lilith AI

Radar · 2026-06-15

Uber našel cenovku pro coding agents: 1 500 dolarů měsíčně na nástroj

Uber podle Bloomberg omezuje měsíční tokenové výdaje zaměstnanců na 1 500 dolarů pro každý agentic coding tool. Z pilotů coding agents se tím stává rozpočtová disciplína.

Číst →

Radar · 2026-06-15

Simon Willison ukazuje, proč sandbox pro agenty nesmí být jen další Python proces

Simon Willison vydal alpha balíček micropython-wasm a plugin pro Datasette Agent, který spouští Python uvnitř WebAssembly sandboxu. Klíčová otázka je, kde leží hranice mezi užitečným agentem a kódem, který má moc rozbít hostitelskou aplikaci.

Číst →

Radar · 2026-06-08

Apple vrátilo Siri do hry přes Gemini, ale důkaz teprve čeká ve frontě

Apple na WWDC 2026 oznámilo Siri AI a další Apple Intelligence funkce, přičemž pro náročné úlohy rozšiřuje Private Cloud Compute na Google Cloud s NVIDIA GPU. Po loňském fiasku s Apple Intelligence ale nejde o prezentaci, nýbrž o test, jestli se Siri konečně ukáže mimo keynote.

Číst →

Radar · 2026-06-07

datasette-agent-edit řeší nudnou část agentů: bezpečné úpravy textu

Simon Willison vydal datasette-agent-edit 0.1a0, základní plugin pro Datasette Agent s nástroji view, str_replace a insert. Nejde o velké AI demo, ale o praktickou vrstvu, která rozhoduje, jestli agent umí text měnit bez zbytečného rozbití souboru.

Číst →

Radar · 2026-06-05

Lockdown Mode řeže nejnebezpečnější cestu prompt injection

OpenAI spustila Lockdown Mode pro vybrané osobní účty ChatGPT a self-serve ChatGPT Business. Neřeší prompt injection jako takovou, ale omezuje odchozí síťové požadavky, tedy místo, kudy mohou utéct citlivá data.

Číst →

Radar · 2026-05-30

Service worker zachytí HTTP request a odbaví ho v Python ASGI aplikaci přímo v browseru

Simon Willison experimentuje s přístupem, kde Python ASGI aplikace běží přímo v browseru díky Pyodide a service workeru. Povedlo se spustit FastAPI a kompletní Datasette 1.0a31. Záměr je distribuce: demo nebo datový nástroj jako webová stránka bez serveru.

Číst →

Radar · 2026-05-29

Anthropic přeskočil $47 miliard run-rate revenue za pět měsíců a tempo roste

Simon Willison upozornil na číslo z investičního oznámení Anthropic: run-rate revenue překročil $47 miliard. Dramatický je zejména nárůst z $9 miliard v prosinci 2025 na $30 miliard v dubnu a $47 miliard v květnu 2026.

Číst →

Radar · 2026-05-28

Opus 4.8 čtyřikrát méně přehlíží chyby v kódu a zavádí aktualizace instrukcí uprostřed konverzace

Anthropic vydal Opus 4.8 s jednou konkrétní metrikou: model je čtyřikrát méně pravděpodobný, že přehlédne chybu v kódu než předchůdce. Zároveň přidává mid-conversation system messages a snížil minimální velikost prompt cache z 4 096 na 1 024 tokenů.

Číst →

Radar · 2026-05-27

SQLite kreslí čáru: agentní kód ne, reprodukovatelné bugy ano

SQLite přidalo do repozitáře AGENTS.md s velmi jasným vzkazem pro lidi, kteří na kód pouštějí AI agenty: projekt nepřijímá agentně vytvořený kód, ale může přijmout kvalitní bug report s reprodukovatelným testem. Je to malý soubor, ale velký signál pro údržbu kritického open source.

Číst →

Radar · 2026-05-26

Copilot Cowork převádí oprávnění uživatele na cestu k souborům přes prompt injection

Výzkumníci z PromptArmor ukázali řetězec útoku, ve kterém Microsoft Copilot Cowork může přes prompt injection pomoci s únikem souborů z Microsoft 365. Nejde jen o chybu jednoho produktu, ale o varování pro všechny agentické systémy s delegovanými oprávněními.

Číst →

Radar · 2026-05-11

Coding agent musí snižovat maintenance cost, nebo je to jen dražší technický dluh

James Shore formuluje nepříjemnou matematiku coding agentů: pokud agent zdvojnásobí výstup, ale maintenance náklady zůstanou stejné, tým nevydělal rychlost, zdvojnásobil zadluženost.

Číst →

Radar · 2026-05-07

Mozilla s Claude Mythos opravila stovky chyb ve Firefoxu. Kvalita AI bezpečnostních reportů se zlomila.

Simon Willison popsal, jak Mozilla využila přístup k Claude Mythos Preview k systematickému hledání a opravě zranitelností ve Firefoxu. V dubnu 2026 stoupl počet opravených bezpečnostních chyb na 423, oproti obvyklým 20 až 30 za měsíc. Klíčová změna: AI bezpečnostní reporty přestaly být šum a začaly být použitelný vstup.

Číst →

Radar · 2025-11-18

Gemini 3 Pro v praxi: dobrá transkripce, ale timestamps lžou a nikdo nezná pelikána

Simon Willison testoval Gemini 3 Pro na tříhodinovém záznamu z obecního zastupitelství a na přepracovaném pelican benchmarku. Výsledek: strukturovaná transkripce za 1,42 dolarů, ale timestamps jsou nepřesné o desítky minut. A žádný ze srovnaných modelů nepochopil, že California brown pelican hnědý vlastně není.

Číst →

Radar · 2025-11-06

Async coding agenti jako výzkumné vlákno: Willison střílí úlohy do PR

Simon Willison popisuje fire-and-forget workflow s Claude Code, Codex a dalšími coding agenty: zadáš výzkumnou otázku, agent pracuje na serveru a vrátí PR. Kód je důkaz proveditelnosti, ne jen text.

Číst →

Radar · 2025-11-02

Dvě nové práce o prompt injection: Rule of Two odhaluje strukturální riziko, útočník reaguje na obrany adaptivně

Simon Willison upozornil na dvě nové práce o prompt injection agentů. Meta's Rule of Two říká, že systém je bezpečný tehdy, když má najednou nejvýše dvě ze tří vlastností: přijímá nedůvěryhodný vstup, přistupuje k citlivým datům, mění stav nebo komunikuje ven. Druhá práce od výzkumníků z OpenAI, Anthropic a DeepMind ukázala, že 12 publikovaných obran překonaly adaptivní útoky s úspěšností přes 90 %.

Číst →

Radar · 2025-10-20

Claude Code for web: asynchronní coding agent v sandboxu, bez notebooku

Simon Willison otestoval Claude Code for web: Anthropic vzala sílu lokálního Claude Code, zavřela ji do hostovaného sandboxu a přidala pohodlné zadávání přes web a mobil. Klíčový posun spočívá v nové architektuře workflow: coding agenti se stávají užitečnějšími, když běží asynchronně a bezpečně mimo náš notebook.

Číst →