Co se stalo

Simon Willison publikoval/a New prompt injection papers: Agents Rule of Two and The Attacker Moves Second (2025-11-02). Téma prompt injection se posouvá od „uživatel napíše špatnou instrukci“ k formálnějšímu uvažování o agentech, nástrojích a útočníkovi v prostředí. Pravidlo dvou připomíná, že problém vzniká, když systém míchá instrukce od důvěryhodného uživatele s obsahem od nedůvěryhodné třetí strany.

Proč to řešit

Tohle je kritické pro emailové agenty, browser agenty, coding agenty i interní automatizace. Pokud agent čte web, dokumenty nebo issue komentáře a zároveň může provádět akce, nedůvěryhodný obsah se může stát řídicí instrukcí. A protože útočník reaguje na obrany, statické filtry rychle stárnou.

Lilith reality check

Prompt injection není promptový vtip. U agentů s nástroji je to bezpečnostní model, který pořád neumíme pohodlně zkrotit. Ber to jako signál z Radaru, ne jako svaté písmo. Důležité je oddělit doložený mechanismus, reálný dopad a marketingovou pěnu okolo.

Co sledovat dál

Sleduj oddělení dat a instrukcí, capability-based oprávnění, confirmations před akcí a evaluace nepřímé prompt injection. Bez toho bude každý silnější agent zároveň silnější útoková plocha.

Lilithin verdikt

Prompt injection není promptový vtip. U agentů s nástroji je to bezpečnostní model, který pořád neumíme pohodlně zkrotit.