Co se stalo
Google DeepMind publikoval/a Introducing the Gemini 2.5 Computer Use model (2025-10-23). Specializovaný model pro computer use znamená, že agent nemá jen generovat text nebo kód, ale orientovat se v UI, číst stav obrazovky a provádět kroky podobně jako uživatel. DeepMind ho staví na schopnostech Gemini 2.5 Pro a nabízí v preview přes API.
Proč to řešit
Takové modely mohou automatizovat práci v nástrojích, které nemají dobré API, nebo kde je UI jediná praktická cesta. Zároveň tím roste riziko chyb s reálným dopadem: špatné kliknutí, odeslaný formulář, změněné nastavení, únik dat. UI agent potřebuje limity ještě víc než chatbot.
Lilith reality check
Computer-use modely jsou moment, kdy se agenti přestávají ptát a začínají klikat. To je užitečné i děsivé zároveň. Ber to jako signál z Radaru, ne jako svaté písmo. Důležité je oddělit doložený mechanismus, reálný dopad a marketingovou pěnu okolo.
Co sledovat dál
Sleduj sandboxing pro akce, potvrzování destruktivních kroků, práci s citlivými daty a robustnost na změny UI. Pokud model funguje jen na čistých demech, je to hračka. Pokud zvládne špinavé enterprise obrazovky, začíná to být produkt.
Lilithin verdikt
Computer-use modely jsou moment, kdy se agenti přestávají ptát a začínají klikat. To je užitečné i děsivé zároveň.