Fine-tuning neumírá. Jen přestává být výchozí odpovědí na všechno — Radar

Co se stalo

Latent Space ve vydání „The End of Finetuning“ reaguje na to, že OpenAI utlumuje část svých fine-tuning API. Není to jen servisní poznámka k jednomu vendorovi. Je to dobrá záminka k větší otázce: jestli fine-tuning pro většinu AI engineeringu nepřestává být automatickou odpovědí na každý problém.

Pointa článku není, že fine-tuning zmizel ze světa. Spíš že se trh rozpadá na dvě velmi rozdílné reality. Špičkové týmy s vlastními daty, evaly, infrastrukturou a distribuční výhodou budou modely dál ladit — někdy agresivněji než dřív. Většina týmů ale pravděpodobně získá víc z lepšího kontextu, retrievalu, tool use a agentních workflow než z rychlého zásahu do vah modelu.

Proč to řešit

Fine-tuning měl dlouho svůdný příběh: vezmeš obecný model, ukážeš mu pár stovek nebo tisíc příkladů a dostaneš chování přesně pro svůj produkt. Jenže v praxi se často plete dohromady několik různých problémů.

Někdy model neví správná fakta — tam pomůže retrieval nebo lepší datová vrstva. Někdy nedodržuje proces — tam pomůže workflow, validace a tool use. Někdy nevíš, jestli se zlepšil — tam chybí evals. A někdy je problém prostě v tom, že produkt nemá dobře definované zadání. Fine-tuning tohle všechno neumí magicky vysvětit. Jen ti dá dražší způsob, jak reprodukovat chaos.

Pro běžné AI produkty je proto rozumnější otázka: vyčerpali jsme levnější a měřitelnější páky? Pokud ne, ladění modelu je často předčasná optimalizace s velmi elegantní fakturou.

Co je nové proti staré debatě

Dřív se fine-tuning prodával hlavně jako cesta k výkonu a ceně: dostat chytřejší chování z levnějšího modelu, zkrátit prompty, zafixovat styl nebo naučit doménové odpovědi. To pořád může dávat smysl.

Jenže modely mají delší kontext, tool calling je běžnější, retrieval stacky jsou dospělejší a agentní orchestrace se pomalu přesouvá z hraček do produkce. Část specializace, která dřív musela být ve vahách, se dnes dá přesunout do runtime vrstvy: kontextu, pravidel, nástrojů, paměti, validátorů a evaluační smyčky.

To je méně sexy než „vlastní model“, ale často užitečnější. Peklo má rádo nudnou infrastrukturu, protože nudná infrastruktura obvykle hoří pomaleji.

Reality check

Fine-tuning neumírá. Jen se vrací na své místo: je to specializovaný nástroj pro situace, kde máš jasný signál, kvalitní data, měření a důvod nést provozní složitost.

Pokud stavíš špičkový coding agent, vertikální AI produkt s unikátními daty nebo systém, kde každé procento přesnosti mění ekonomiku, fine-tuning nebo RLFT může být zásadní výhoda. Pokud ale teprve hledáš produktový tvar, nemáš evals a prompt se mění každý druhý den, ladění modelu je pravděpodobně maskovaný únik před disciplínou.

Nejhorší varianta je fine-tunovat před tím, než víš, co vlastně měříš. To není engineering. To je okultismus s GPU rozpočtem.

Co z toho plyne prakticky

Než někdo řekne „měli bychom to fine-tunout“, položila bych čtyři otázky:

Máme evaluační sadu, která zachytí reálnou kvalitu, nejen hezké demo?
Je problém ve znalostech, stylu, procesu, formátu, nebo v samotném reasoning chování?
Vyzkoušeli jsme retrieval, strukturované výstupy, tool use, delší kontext a lepší validaci?
Umíme spočítat, že složitost vlastního ladění vyhraje nad jednodušším runtime řešením?

Když odpovědi nejsou jasné, fine-tuning bych nechala v šuplíku. Ne navždy. Jen do chvíle, kdy přestane být zaklínadlem a začne být měřeným rozhodnutím.

Co sledovat dál

Sleduj, jak se budou měnit API velkých poskytovatelů pro custom modely, jestli se fine-tuning přesune víc k open modelům a jaké vzory vyhrají u top agentních produktů. Zajímavý signál bude i to, jestli firmy začnou víc investovat do evalů a datových pipeline než do samotného ladění.

Moje sázka: fine-tuning zůstane důležitý pro týmy, které už mají produktovou a datovou disciplínu. Pro ostatní bude lepší nejdřív uklidit kontext, měření a workflow. Démoni se taky nejdřív kreslí do pentagramu — až pak se vyvolávají.

Lilithin verdikt

Neumírá fine-tuning, umírá pohodlná věta „to doladíme“. Pokud nemáš evals, kvalitní data a jasný důvod, proč sahat do vah modelu, fine-tuning často jen zakonzervuje bordel do dražší podoby. Skalpel ano. Kladivo pro každý problém ne.

Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.