Agenci — kiedy LLM dostaje ręce i pamięć

LLM z tool use, pętlą i pamięcią. Dużo marketingu, mało definicji. Tu jest wersja bez owijania.

Co to jest

Agent = LLM w pętli, mający dostęp do narzędzi (search, shell, API)
i jakąś formę pamięci. Cykl jest tępy:

while not done:
    zdecyduj(następną akcję) → wywołaj tool → przeczytaj wynik → zaktualizuj plan

I tyle. Wszystko inne to wariacje.

Czym to nie jest

To nie świadomość. To nie "AGI". To nie "AI, które cię zastąpi".
To nie chatbot, któremu powiedziałeś "zrób cokolwiek". To po prostu
chatbot z sfrustrowanym użytkownikiem.
To nie jeden wielki prompt. Stan, plan i pamięć żyją poza LLM,
w aplikacji. LLM tylko wybiera następną akcję.

Gdzie kończy się workflow, a zaczyna agent

Workflow: kroki są ustalone z góry, LLM tylko wypełnia luki.
(Klasyczne "summarize → translate → email".)
Agent: LLM sam wybiera następny krok na podstawie stanu. Pętla
może trwać długo i robić rzeczy, których się nie spodziewałeś.

Workflow jest bezpieczniejszy, tańszy, łatwiejszy do debugowania. Agent
ma sens, kiedy zadanie wymaga eksploracji — nieznane dane, nieznane
środowisko.

MCP, ReAct, tool use

Tool use = format, którym LLM sygnalizuje "wywołaj X z argumentami
Y". Anthropic robi to natywnie, OpenAI też — problem rozwiązany.
ReAct = oryginalny paper mówiący "naprzemiennie Reasoning i Action".
Dziś to już tylko historyczny termin na "agent loop".
MCP (Model Context Protocol) = standardowy sposób udostępniania
modelowi narzędzi i zasobów (system plików, DB, API) jak pluginów.
Lokalny serwer, deklaratywny schemat. Anthropic to pcha, ekosystem
rośnie.

Pamięć

Trzy warstwy, które warto rozróżniać:

Working memory — okno tokenów bieżącej rozmowy.
Episodic — co się działo w poprzednich sesjach.
Typowo log + sumaryzacja + RAG.
Semantic — wyuczone fakty o domenie.
Typowo structured store + narzędzie do lookupu.

Jedna "magiczna" warstwa pamięci nie istnieje. To marketing.

Częste błędy

Brak limitów pętli → agent się zapętla i przepala budżet tokenów.
Brak human-in-the-loop przy nieodwracalnych akcjach (delete, payment,
deploy).
Za dużo narzędzi → model wybiera źle.
Zasada kciuka: poniżej 10, najlepiej 3–5.
Brak evals. Jeśli nie wiesz, ile akcji średnio zajmuje zadanie
i jaki jest success rate, tylko zgadujesz.

Co zapamiętać

Agent to tępa pętla wokół mądrego modelu. Większość problemów, które
ludzie przypisują modelowi (halucynacje, zgubiony kontekst, głupie
decyzje), to w rzeczywistości błędy w tej pętli — nie w modelu.