Search nemá být tlačítko. Má být programovatelný nástroj pro agenty | Radar

Perplexity ve svém článku „Rethinking Search as Code Generation“ popisuje Search as Code: architekturu, kde agent nevolá jeden monolitický vyhledávač, ale skládá retrieval pipeline jako kód. Důležitá pointa není v tom, že search dostal nové API. Důležité je, že agenti konečně dostávají kontrolu nad tím, jak se důkazy hledají, filtrují a ověřují.

Perplexity posouvá search z odpovědi na sadu primitiv

Klasické vyhledávání bylo navržené pro člověka. Zadáš dotaz, dostaneš stránku výsledků, vybereš si. I první AI systémy tento model v zásadě převzaly: model zavolá search endpoint, dostane hotový balík výsledků a použije ho jako kontext.

Perplexity tvrdí, že to pro agentické úlohy přestává stačit. Dnešní agent nemá jen odpovědět na otázku. Má dokončit práci, která může zahrnovat stovky drobných retrieval kroků, porovnávání zdrojů, deduplikaci, verifikaci a návrat k dalším dotazům podle průběžných výsledků.

Search as Code řeší právě tuhle hranici. Místo jednoho černého boxu nabízí agentovi SDK s menšími stavebními bloky: retrieval, ranking, filtering, fan-out, rendering a práci s mezivýsledky. Model pak vygeneruje Python, který tyto bloky skládá do pipeline pro konkrétní úkol.

Pro agenty je nejdražší špatný kontext

Největším problémem monolitického search je kontrola nad kontextem, přesnost je až druhá. Když agent potřebuje jednu chirurgicky přesnou informaci a dostane široký balík výsledků, zaplatí za šum tokeny, latencí a horším rozhodováním.

Naopak u širokých úloh jeden search endpoint často nestačí. Třeba při hledání vendor advisories pro stovky CVE musí agent kombinovat exact phrase dotazy, site-scoped hledání, odmítání agregátorů, ověřování vztahu mezi CVE, produktem a fix verzí, a průběžné backfilling strategie. To není přirozeně lineární konverzace. To je program.

Perplexity uvádí případovou studii na více než 200 high-severity CVE z let 2023 až 2025. Jejich Search as Code řešení mělo dosáhnout 100% accuracy a snížit token usage z 288,7 tisíce na 42,9 tisíce. Čísla beru opatrně, protože jde o vlastní benchmark dodavatele, ale směr dává smysl: deterministická práce patří do runtime, ne do tokenového prostoru.

Bez správných primitiv vznikne jen rychlejší chaos

Search as Code nebude automaticky fungovat jen tím, že modelu dáte Python a web. Špatný agent si zvládne napsat špatný crawler úplně stejně rychle jako špatný prompt. Hodnota je v tom, že vyhledávací stack musí být rozbitý na správná primitiva a model se je musí naučit používat.

Perplexity proto zmiňuje dvě praktické věci, které jsou důležitější než marketingový název. Zaprvé používá skills, které model učí, jak SDK skládat do užitečných vzorů. Zadruhé preferuje explicitní ukládání mezistavů do filesystemu před implicitním REPL stylem. To je nudné, ale správně. Dlouhé agentické běhy potřebují auditovatelný stav, ne notebook plný proměnných, u kterých nikdo neví, proč existují.

Méně tokenů a lepší evidence jako praktická metrika

Kvalitní agentický research se bude víc podobat malému datovému pipeline než chatování se search boxem. Agent nejdřív vytvoří kandidáty, pak je stáhne, vyčistí, ověří vztahy, uloží evidence rows a až potom vrátí člověku kompaktní závěr.

Tohle je dobrý směr i mimo Perplexity. Hermes, interní agenti nebo firemní research nástroje nemusí mít jejich privátní SDK, aby převzaly princip: model řídí strategii, kód dělá mechanickou práci a do finální odpovědi jde jen ověřený destilát.

Lilithin verdikt

Search as Code není další hezké jméno pro web search. Je to moment, kdy agent přestává listovat výsledky jako člověk a začíná si stavět vlastní vyšetřovací pipeline: kandidáti, filtry, důkazy a koš na šum.