Claude Code for web: asynchroniczny agent kodujący w sandboxie, bez laptopa | Radar

Claude Code for web: CLI zamknięty w hostowanym kontenerze

Simon Willison opisał pierwsze testy Claude Code for web, czyli webowej i mobilnej wersji agenta kodującego od Anthropic. W praktyce przedstawia to jako Claude Code CLI zamknięty w hostowanym kontenerze: wybierasz repozytorium GitHub, ustawiasz środowisko, wpisujesz zadanie i agent działa poza twoim komputerem.

Efekt może trafić do brancha albo pull requesta. W trakcie pracy da się dopisywać kolejne instrukcje do kolejki, a gdy chcesz przejąć zadanie lokalnie, funkcja „teleport“ przenosi konwersację i zmienione pliki z powrotem do lokalnego Claude Code.

Willison pokazuje kilka realnych prób: prosty tool do usuwania query stringów, aktualizację README i przede wszystkim benchmark MiniJinja vs. Jinja2, który zadał z iPhone'a, razem z literówkami. Agent mimo tego przygotował benchmark, skrypty, markdown z wynikami oraz wykresy.

Asynchroniczny pracownik, nie większy edytor

Najważniejszy nie jest sam webowy interfejs. Ważne jest to, że agent kodujący staje się asynchronicznym pracownikiem: zlecasz mu zadanie, pozwalasz działać w izolowanym środowisku i wracasz do diffa albo PR-a.

To właśnie tam praktyczne użycie agentów zaczyna robić się ciekawe. Lokalny chat w edytorze jest przydatny, ale nadal siedzi ci na kolanach. Hostowany agent z branchami, PR-ami i kolejką instrukcji zaczyna przypominać zewnętrznego współpracownika, któremu można zlecić wydzielone zadania bez udostępniania komputera.

Sandboxing to nie ozdoba, to architektura bezpieczeństwa

Willison słusznie oddziela wygodę od bezpieczeństwa. Anthropic opakowuje premierę w temat sandboxingu: izolację systemu plików, ograniczenia sieci, allow-listy domen i możliwość pracy całkiem bez internetu. To nie jest ozdoba. Przy agentach kodujących sieć jest kluczowym kanałem wycieku danych, zwłaszcza przy prompt injection i scenariuszu „lethal trifecta“: prywatne dane, niezaufane instrukcje i możliwość wysłania danych na zewnątrz.

Tryb „No network access“ jest najczystszy. „Trusted network access“ to kompromis: wygodny przy instalacji zależności, ale szerszy niż chciałby dział bezpieczeństwa. Własna allow-lista ma sens tylko wtedy, gdy naprawdę wiesz, jakie dane agent widzi i z jakimi usługami powinien rozmawiać.

Według Simona Claude Code for web przede wszystkim ułatwia orkiestrację pracy, a niekoniecznie czyni model zdolniejszym niż lokalny Claude Code. To mniej błyszczące, ale bardziej prawdziwe.

Co obserwować przed wdrożeniem produkcyjnym

Warto patrzeć na trzy rzeczy: jak Anthropic będzie zarządzać sandboxami, jak audytowalne będą przebiegi agentów i ile takie asynchroniczne zadania realnie kosztują. Jeśli skończy się na czarnej skrzynce produkującej PR, będzie produktywnie, ale nerwowo. Jeśli dojdzie solidny audit trail, kontrola sieci i łatwe przejęcie pracy lokalnie, może to być jeden z rozsądniejszych modeli codziennego agentowego developmentu.

Dla zespołów wniosek jest prosty: nie zaczynajcie od oddania agentowi całego monorepo i otwartego internetu. Zacznijcie od wąskich zadań, izolowanych repozytoriów, środowiska bez sekretów i normalnego review przez PR.

Werdykt Lilith

To mniej nowy edytor, a bardziej infrastruktura do delegowania pracy. Jeśli agent może działać w izolacji bez nieograniczonego dostępu do plików i sieci, wreszcie można mówić o produktywności bez podpisywania bezpieczeństwa własną krwią.