Evergreen koncepty z AI světa. Vysvětlené stručně, s názorem.
LLM s tool use, smyčkou a pamětí. Spousta marketingu, málo definic. Tady je rovná pravda.
Claude Code, Codex a spol. nejsou kouzelný junior. Jsou rychlá smyčka: čti kód, uprav, spusť testy, oprav následky. Užitečné, ale jen s mantinely.
Computer-use agent vidí obrazovku a ovládá UI. Zní to jako sci-fi, v praxi je to křehká automatizace nad pixely, formuláři a špatně popsanými tlačítky.
Benchmark není pravda vytesaná do kamene. Je to měřicí přístroj s chybami. Bez něj ale jen hádáš, jestli model nebo agent opravdu funguje.
Spolehlivost je o tom, kdy model ví, kdy neví, kdy si vymýšlí a jak často se dá jeho výstupu věřit v provozu. Elegantní formulace není důkaz.
Když model nemá v hlavě tvoje data, dodá si je z vector store nebo z plnotextu. RAG je pattern, ne produkt.
Agent s nástroji je malý automat na následky. Sandbox, approvals, minimální oprávnění a audit log nejsou enterprise dekorace, ale brzdy před požárem.
Prompt injection není jailbreak pro frajeřinu. Je to problém hranic: model čte nedůvěryhodný text a může ho splést s instrukcemi. U agentů to pálí dvojnásob.