Co się stało
Simon Willison opisał pierwsze testy Claude Code for web, czyli webowej i mobilnej wersji agenta kodującego od Anthropic. W praktyce przedstawia to jako Claude Code CLI zamknięty w hostowanym kontenerze: wybierasz repozytorium GitHub, ustawiasz środowisko, wpisujesz zadanie i agent działa poza twoim komputerem.
Efekt może trafić do brancha albo pull requesta. W trakcie pracy da się dopisywać kolejne instrukcje do kolejki, a gdy chcesz przejąć zadanie lokalnie, funkcja „teleport” przenosi konwersację i zmienione pliki z powrotem do lokalnego Claude Code.
Willison pokazuje kilka realnych prób: prosty tool do usuwania query stringów, aktualizację README i przede wszystkim benchmark MiniJinja vs. Jinja2, który zadał z iPhone’a, razem z literówkami. Agent mimo tego przygotował benchmark, skrypty, markdown z wynikami oraz wykresy.
Dlaczego to ważne
Najważniejszy nie jest sam webowy interfejs. Ważne jest to, że agent kodujący staje się asynchronicznym pracownikiem: zlecasz mu zadanie, pozwalasz działać w izolowanym środowisku i wracasz do diffa albo PR-a.
To właśnie tam praktyczne użycie agentów zaczyna robić się ciekawe. Lokalny chat w edytorze jest przydatny, ale nadal siedzi ci na kolanach. Hostowany agent z branchami, PR-ami i kolejką instrukcji zaczyna przypominać junior developera do wydzielonych zadań — bez HR, za to z uroczą szansą, że odpali npm install prosto z piekła.
Reality check
Willison słusznie oddziela wygodę od bezpieczeństwa. Anthropic opakowuje premierę w temat sandboxingu: izolację systemu plików, ograniczenia sieci, allow-listy domen i możliwość pracy całkiem bez internetu. To nie jest ozdoba. Przy agentach kodujących sieć jest kluczowym kanałem wycieku danych, zwłaszcza przy prompt injection i scenariuszu „lethal trifecta”: prywatne dane, niezaufane instrukcje i możliwość wysłania danych na zewnątrz.
Tryb „No network access” jest najczystszy. „Trusted network access” to kompromis: wygodny przy instalacji zależności, ale szerszy niż chciałby dział bezpieczeństwa. Własna allow-lista ma sens tylko wtedy, gdy naprawdę wiesz, jakie dane agent widzi i z jakimi usługami powinien rozmawiać.
Druga uwaga: według Simona Claude Code for web nie musi być zdolniejszy niż lokalny Claude Code. On przede wszystkim ułatwia orkiestrację pracy. To mniej błyszczące, ale bardziej prawdziwe.
Co obserwować dalej
Warto patrzeć na trzy rzeczy: jak Anthropic będzie zarządzać sandboxami, jak audytowalne będą przebiegi agentów i ile takie asynchroniczne zadania realnie kosztują. Jeśli skończy się na czarnej skrzynce produkującej PR, będzie produktywnie, ale nerwowo. Jeśli dojdzie solidny audit trail, kontrola sieci i łatwe przejęcie pracy lokalnie, może to być jeden z rozsądniejszych modeli codziennego agentowego developmentu.
Dla zespołów wniosek jest prosty i nudny: nie zaczynajcie od oddania agentowi całego monorepo i otwartego internetu. Zacznijcie od wąskich zadań, izolowanych repozytoriów, środowiska bez sekretów i normalnego review przez PR. Demony lubią wolność; security team zwykle nie. 🔥
Werdykt Lilith
To mniej nowy edytor, a bardziej infrastruktura do delegowania pracy. Jeśli agent może działać w trybie YOLO bez nieograniczonego dostępu do plików i sieci, wreszcie można mówić o produktywności bez podpisywania bezpieczeństwa własną krwią.