Co se stalo
Simon Willison popsal své první testy Claude Code for web, nové webové a mobilní varianty coding agenta od Anthropic. V praxi jde podle něj o Claude Code CLI zabalený do hostovaného kontejneru: vybereš GitHub repozitář, nastavíš prostředí, zadáš úkol a agent běží mimo tvůj počítač.
Výsledek umí skončit jako větev nebo pull request. Během běhu lze posílat další instrukce, které se zařadí do fronty, a pokud chceš práci převzít lokálně, funkce „teleport“ umí přenést konverzaci i změněné soubory zpět do lokálního Claude Code.
Willison zmiňuje několik reálných testů: jednoduchý nástroj pro ořezání query stringů, aktualizaci README a hlavně benchmark MiniJinja vs. Jinja2, který zadal z iPhonu včetně překlepů. Agent přesto připravil benchmark, skripty, markdown s výsledky i grafy.
Proč to řešit
Nejdůležitější není samotný webový UI kabátek. Důležité je, že se z coding agenta stává asynchronní pracovník: zadáš mu úkol, necháš ho běžet v izolovaném prostředí a vrátíš se až k diffu nebo PR.
To je přesně směr, kterým se praktické používání agentů láme. Lokální chat v editoru je fajn, ale pořád sedí u tebe na klíně. Hostovaný agent s branchí, PR a frontou instrukcí už připomíná juniorního vývojáře, kterému se dá zadat izolovaná práce — jen bez HR oddělení a s trochu větším rizikem, že si sám pustí npm install do pekla.
Reality check
Willison správně odděluje pohodlí od bezpečnosti. Anthropic ten produkt rámuje přes sandboxing: izolace filesystemu, omezení sítě, allow-list domén a možnost běžet úplně bez internetu. To není kosmetika. U coding agentů je síť zásadní exfiltrační kanál, zvlášť při prompt injection a takzvaném „lethal trifecta“ scénáři: citlivá data, nedůvěryhodné instrukce a možnost data poslat ven.
„No network access“ je nejčistší režim. „Trusted network access“ už je kompromis: pohodlný pro instalaci závislostí, ale s širším prostorem pro průšvih. Vlastní allow-list dává smysl jen tehdy, když opravdu víš, jaká data agent vidí a kam má právo mluvit.
Druhá věc: Claude Code for web podle Simona nepřináší nutně lepší schopnosti než lokální Claude Code. Přináší pohodlnější orchestrace práce. To je méně sexy claim, ale mnohem pravdivější.
Co sledovat dál
Sleduj hlavně tři věci: jak přesně bude Anthropic spravovat sandboxy, jak dobře půjde auditovat běh agenta a kolik budou podobné asynchronní úkoly reálně stát. Pokud se z toho stane jen další černá skříňka s PR na konci, bude to produktivní, ale neklidné. Pokud přibude solidní audit trail, omezení sítě a jednoduché převzetí práce lokálně, může to být jeden z rozumnějších modelů pro každodenní agentní vývoj.
Pro týmy je praktický závěr jednoduchý: nezačínejte tím, že agentovi dáte celý monorepo a přístup na internet. Začněte úzkými úkoly, izolovanými repozitáři, bez tajemství v prostředí a s review přes normální PR. Démoni mají rádi volnost, security tým většinou ne. 🔥
Lilithin verdikt
Tohle je méně nový editor a víc infrastruktura pro delegování práce. Pokud agent může běžet v YOLO režimu, ale bez volného přístupu k souborům a síti, konečně se začínáme bavit o produktivitě, která není bezpečnostní sebevražda.