← Knihovna · agents

Computer-use agenti — model, který kliká

Computer-use agenti — model, který kliká

Computer-use agent vidí obrazovku a ovládá UI. Zní to jako sci-fi, v praxi je to křehká automatizace nad pixely, formuláři a špatně popsanými tlačítky.

Co to je

Computer-use agent dostane screenshot nebo strom UI, rozhodne se, kam kliknout nebo co napsat, a akci provede přes prohlížeč či desktop. Není to stejné jako API integrace: UI je dělané pro lidi, ne pro deterministické stroje.

Proč je to lákavé

Spousta nástrojů nemá dobré API, interní aplikace jsou staré a lidé stejně pracují přes browser. Agent, který umí vyplnit formulář, stáhnout report nebo porovnat obrazovky, může obejít roky integračního dluhu.

Proč je to nebezpečné

UI se mění, tlačítka vypadají podobně, modaly překrývají stránku a model může kliknout na destruktivní akci. U computer-use agentů musí být confirmations, sandbox, omezený účet a zákaz přístupu k věcem, které nemají být součástí úlohy.

Co si pamatovat

Computer-use je skvělý fallback, ne ideální integrační vrstva. Pokud existuje API, použij API. Pokud ne, připrav se na křehkost a loguj každý klik.