← Knihovna · agents

Agenti — když LLM dostane ruce a paměť

Agenti — když LLM dostane ruce a paměť

LLM s tool use, smyčkou a pamětí. Spousta marketingu, málo definic. Tady je rovná pravda.

Co to je

Agent = LLM v loopu, který má přístup k nástrojům (search, shell, API)
a nějakou formu paměti. Cyklus je tupý:

while not done:
    rozhodni(co dělat) → zavolej tool → přečti výsledek → updatuj plán

To je celé. Všechno ostatní jsou variace.

Co to není

  • Není to vědomí. Není to "AGI". Není to "AI co tě nahradí".
  • Není to chatbot, kterému jsi řekl "udělej mi cokoliv". To je
    jen chatbot s frustrovaným uživatelem.
  • Není to jeden velký prompt. Stav, plán a paměť žijí mimo LLM,
    v aplikaci. LLM jen vybírá další akci.

Kde je hranice "agent vs. workflow"

  • Workflow: kroky jsou předem dané, LLM jen vyplňuje díry.
    (Klasická "summarize → translate → email".)
  • Agent: LLM si vybírá další krok podle stavu. Smyčka může trvat
    dlouho a může dělat věci, které jsi nečekal.

Workflow je bezpečnější, levnější, snáz se debuguje. Agent má smysl,
když úloha vyžaduje exploraci — neznámá data, neznámé prostředí.

MCP, ReAct, tool use

  • Tool use = formát, jak LLM signalizuje "zavolej X s argumenty Y".
    Anthropic to umí natively, OpenAI taky, je to vyřešený problém.
  • ReAct = původní paper, který říká "alternuj Reasoning a Action".
    Dneska už je to jen historický termín pro "agent loop".
  • MCP (Model Context Protocol) = standardizovaný způsob, jak modelu
    zpřístupnit nástroje a zdroje (souborový systém, DB, API) jako
    pluginy. Lokální server, deklarativní schéma. Anthropic to tlačí,
    ekosystém roste.

Paměť

Tři vrstvy, které mají smysl rozlišovat:

  1. Working memory — token window aktuální konverzace.
  2. Episodic — co se stalo v předchozích sezeních.
    Typicky log + sumarizace + RAG.
  3. Semantic — naučená fakta o doméně.
    Typicky structured store + lookup nástroj.

Memory jako jedna "magická" vrstva neexistuje. To je marketing.

Časté chyby

  • Žádné limity smyčky → agent zacyklí a vyžaluje token rozpočet.
  • Žádný human-in-the-loop pro nevratné akce (delete, payment, deploy).
  • Příliš mnoho nástrojů → model si vybírá špatně.
    Pravidlo palce: pod 10, ideálně 3–5.
  • Žádné evals. Když nevíš, kolik akcí v průměru trvá úloha
    a jaká je success rate, jen doufáš.

Co si pamatovat

Agent je tupá smyčka okolo chytrého modelu. Většina problémů, které
mu lidi přisuzují (halucinace, ztracený kontext, blbé rozhodnutí),
jsou ve skutečnosti chyby v té smyčce — ne v modelu.