Google daje enterprise RAG strażnika, który wie, kiedy nie odpowiadać | Radar

Google przedstawił agentic RAG dla Gemini Enterprise Agent Platform, który sprawdza przed odpowiedzią, czy ma wystarczający kontekst. Dla firm ważniejszy jest ten hamulec niż kolejna ładna warstwa wyszukiwania.

Agentic RAG ma zatrzymać się, zanim zacznie zgadywać

Google Research i Google Cloud opisują framework Cross-Corpus Retrieval hostowany w Gemini Enterprise Agent Platform. System dzieli złożone pytania między agentów, planuje kolejne kroki, przepisuje zapytania i szuka w wielu korpusach. Kluczowy element nazywa się Sufficient Context Agent. Sprawdza prompt, znalezione fragmenty tekstu i roboczą odpowiedź, zanim model dostanie zgodę na wynik końcowy.

Google twierdzi, że wobec standardowego RAG zwiększył accuracy na factuality datasets nawet o 34 %. Na FramesQA podaje 824 pytania i 2 676 dokumentów PDF. W ustawieniu cross-corpus, gdzie planner wybierał spośród czterech korpusów, Google raportuje 90,1 % poprawnych odpowiedzi i latencję średnio w granicy 3 % wobec wariantu single-corpus. Funkcja jest dostępna jako public preview w Gemini Enterprise Agent Platform.

Wartością jest audyt, nie liczba agentów

Enterprise RAG zwykle psuje się po cichu. Nie znajduje drugiego dokumentu, bierze ID za fakt albo odpowiada tylko z części materiału. Google celuje dokładnie w ten problem: agent nie ma być tylko mądrzejszą wyszukiwarką, ale mechanizmem kontroli, który potrafi powiedzieć, czego mu brakuje.

Dla kupujących firm to praktyczna zmiana. Jeśli odpowiedź dotyka prawa, finansów albo ochrony zdrowia, ładny tekst nie wystarczy. Zespół potrzebuje śladu: gdzie system szukał, co znalazł, dlaczego szukał ponownie i dlaczego uznał kontekst za wystarczający.

Kontroler kontekstu nadal zależy od jakości korpusu

Sufficient Context Agent nie naprawia złych uprawnień, starych dokumentów ani niespójnych danych firmowych. Jeśli prawda jest rozrzucona po systemach bez wspólnych encji, agentic loop może tylko ostrożniej uderzyć w tę samą ścianę.

Drugim ryzykiem są evals. Google pokazuje FramesQA i wewnętrzne proprietary datasets, ale prawdziwy test jest w danych korporacyjnych, gdzie dokumenty sobie przeczą, a użytkownicy pytają nieprecyzyjnie. Tam okaże się, czy kontroler kontekstu zmniejsza halucynacje, czy tylko dodaje kolejną pewną siebie warstwę procesu.

Audit trail zdecyduje, czy RAG przestanie być hasłem marketingowym

Warto śledzić dwie rzeczy: jak jasno Google pokaże klientom powody Sufficient Context Agentu i czy decyzje da się później audytować bez ręcznej archeologii w logach.

Jeśli zespoły enterprise zobaczą nie tylko odpowiedź, ale też drogę do niej, agentic RAG może wreszcie przestać być hasłem marketingowym. Jeśli nie, zostanie kolejną pipeline, która wygląda rozsądnie do pierwszego incydentu.

Werdykt Lilith

Wartość systemu nie zależy od liczby agentów w architekturze. Zależy od tego, czy odpowiedź ma czytelną ścieżkę do źródła, czy kończy jako pewny siebie tekst bez adresu.