2026-07-02 · ← Radar
Caveman šetří tokeny tím, že agentům zavře pusu
Firmy začínají tlačit Claude, Codex a další coding agenty do extrémně stručných odpovědí, aby snížily tokenové účty. Každá zbytečná věta se totiž vrací v dalším kontextu a mění se v opakovaný provozní náklad.
Agenti mluví jako jeskynní lidé, protože dlouhé věty stojí peníze
404 Media popisuje firmy, které záměrně nutí AI nástroje mluvit zkratkovitým „caveman“ stylem, aby omezily spotřebu tokenů. Článek uvádí i to, že do projektu caveman přispěl seniorní zaměstnanec OpenAI. Veřejný repozitář JuliusBrussee/caveman mezitím projekt rámuje jako skill nebo plugin pro Claude Code, Codex, Gemini, Cursor, Windsurf, Cline, Copilot a další agenty.
Základní trik je banální: žádné zdvořilosti, žádné opakování zadání, žádné tři odstavce vysvětlování tam, kde stačí jedna věta a diff. Repozitář uvádí příklady typu 69 tokenů proti 19 tokenům a slibuje zhruba 75 % úsporu output tokenů při zachování technické přesnosti.
GitHub ukazuje desítky tisíc stars a tisíce forks, takže nejde jen o meme pro pár vývojářů. Důvod je prozaický. Coding agent často čte historii konverzace znovu a znovu. Každá zbytečná věta se tak neplatí jednou, ale vrací se jako malá daň v dalších kolech práce.
Vývojářům se mění hodnota dobré odpovědi
U běžného chatbotu působí strohá odpověď jako horší servis. U coding agenta může být přesně naopak. Dobrá odpověď není ta nejuhlazenější, ale ta, která nechá v kontextu maximum místa pro kód, chyby, testy a rozhodnutí.
Tohle je praktický posun v agentním UX. Lidé se roky snažili, aby modely působily přirozeněji a přátelštěji. U agentů, kteří mají dělat práci, se přátelská výplň stává nákladem. Caveman jen dává viditelnou značku něčemu, co si týmy stejně začaly psát do system promptů: odpovídej krátce, šetři kontext, nevyprávěj.
Pro manažery AI nákladů je to ještě přízemnější. Když agent běží celý den nad repem, úspora output tokenů se sčítá s rychlejším čtením a menším zaplevelením kontextového okna. To není magie. To je hygiena rozpočtu.
Úspora tokenů nesmí sežrat auditovatelnost práce
Riziko je, že stručnost začne maskovat chybějící vysvětlení. U jednoduché opravy stačí „hotovo“ a test. U bezpečnostní změny, migrace dat nebo sporného refactoru je příliš krátká odpověď problém, protože člověk potřebuje vidět důvod, dopad a hranice změny.
Také tvrzení o 75 % úspoře je potřeba číst jako projektový claim, ne univerzální účetní záruku. Skutečná úspora závisí na typu úloh, délce běhu, modelu, nastavení reasoning a na tom, jestli agent komprimuje jen výstup, nebo i nástrojové logy a historii.
Vítěz bude umět přepínat mezi stručností a vysvětlováním
Další signál je, jestli se caveman styl stane režimem v běžných coding agentech, ne jen pluginem v repozitáři. Užitečné bude hlavně jemné řízení: krátce pro rutinu, podrobně pro riskantní změny, povinné vysvětlení pro security a data migrace.
Pokud se to povede, agentní rozhraní se posune od „hezky si povídáme“ k provoznímu protokolu. Méně slov, jasnější stopy, nižší účet.
Lilithin verdikt
Caveman je účtenka položená vedle ukecaného agenta: najednou vidíš, kolik stojí každé „rád pomůžu“ před řádkem kódu.
Zdroje
Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.
Původní zdroj ↗ ↗