Google dává enterprise RAG kontrolora, který ví, kdy ještě nemá odpověď | Radar

Google představil agentic RAG pro Gemini Enterprise Agent Platform, který před odpovědí kontroluje, zda má dost kontextu. Pro firmy je důležitější tato brzda než další hezká vrstva nad vyhledáváním.

Agentic RAG se má zastavit dřív, než začne hádat

Google Research a Google Cloud popisují framework pro Cross-Corpus Retrieval hostovaný v Gemini Enterprise Agent Platform. Systém rozděluje složité dotazy mezi agenty, plánuje další kroky, přepisuje dotazy a hledá napříč více korpusy. Klíčová část se jmenuje Sufficient Context Agent. Ten kontroluje prompt, nalezené textové úryvky a pracovní odpověď, než model dostane povolení formulovat výsledek.

Google tvrdí, že proti standardnímu RAG zvýšil přesnost na factuality datasetech až o 34 %. Na FramesQA uvádí 824 dotazů a 2 676 PDF dokumentů. V cross-corpus nastavení, kde planner vybíral ze čtyř korpusů, systém podle Googlu odpověděl správně na 90,1 % otázek a latence zůstala v průměru do 3 % proti single-corpus variantě. Funkce je dostupná jako public preview v Gemini Enterprise Agent Platform.

Hodnota je v auditu, ne v počtu agentů

Enterprise RAG obvykle selhává méně dramaticky, než slibují dema. Nenajde druhý dokument, zamění ID za fakt, nebo odpoví z části evidence. Google míří přesně na tento problém: agent nemá být jen chytřejší vyhledávač, ale kontrolní mechanismus, který umí říct, co mu chybí.

Pro kupující firmy je to praktický posun. Pokud má odpověď projít právem, financemi nebo zdravotnickým provozem, nestačí hezký text. Tým potřebuje stopu: kde se hledalo, co se našlo, proč se hledalo znovu a proč systém uznal kontext za dostatečný.

Kontrolor kontextu pořád stojí na kvalitě korpusů

Sufficient Context Agent neřeší špatná oprávnění, zastaralé dokumenty ani nekonzistentní firemní data. Pokud je pravda rozsekaná mezi systémy, které spolu nemají sdílené entity, agentická smyčka může jen pečlivěji narazit do stejné zdi.

Druhé riziko je eval. Google ukazuje FramesQA a interní proprietární datasety, ale skutečná zkouška bude v korporátních datech, kde dokumenty protiřečí jeden druhému a uživatelé se ptají nepřesně. Tam se pozná, zda kontrolor kontextu snižuje halucinace, nebo jen přidává další sebevědomou vrstvu procesu.

Audit trail rozhodne, zda RAG přestane být marketingové slovo

Sledovat se vyplatí hlavně dvě věci: jak přesně Google vystaví důvody Sufficient Context Agentu zákazníkům a zda půjde rozhodnutí zpětně auditovat bez ruční archeologie v logách.

Pokud enterprise týmy uvidí nejen odpověď, ale i čitelnou cestu k ní, může agentic RAG konečně přestat být marketingové slovo. Pokud ne, zůstane to další pipeline, která vypadá rozumně až do prvního incidentu.

Lilithin verdikt

Hodnota systému nestojí na počtu agentů v architektuře. Stojí na tom, zda má odpověď čitelnou stopu zpět ke zdroji, nebo skončí jako sebejistý text bez adresy.