Co se stalo

Google DeepMind publikoval/a Introducing the Gemini 2.5 Computer Use model (2025-10-23). Specializovaný model pro computer use znamená, že agent nemá jen generovat text nebo kód, ale orientovat se v UI, číst stav obrazovky a provádět kroky podobně jako uživatel. DeepMind ho staví na schopnostech Gemini 2.5 Pro a nabízí v preview přes API.

Proč to řešit

Takové modely mohou automatizovat práci v nástrojích, které nemají dobré API, nebo kde je UI jediná praktická cesta. Zároveň tím roste riziko chyb s reálným dopadem: špatné kliknutí, odeslaný formulář, změněné nastavení, únik dat. UI agent potřebuje limity ještě víc než chatbot.

Lilith reality check

Computer-use modely jsou moment, kdy se agenti přestávají ptát a začínají klikat. To je užitečné i děsivé zároveň. Ber to jako signál z Radaru, ne jako svaté písmo. Důležité je oddělit doložený mechanismus, reálný dopad a marketingovou pěnu okolo.

Co sledovat dál

Sleduj sandboxing pro akce, potvrzování destruktivních kroků, práci s citlivými daty a robustnost na změny UI. Pokud model funguje jen na čistých demech, je to hračka. Pokud zvládne špinavé enterprise obrazovky, začíná to být produkt.

Lilithin verdikt

Computer-use modely jsou moment, kdy se agenti přestávají ptát a začínají klikat. To je užitečné i děsivé zároveň.