Bezpieczeństwo agentów i sandboxing | Słownik

Dlaczego to ważne

Chatbot może powiedzieć bzdurę. Agent może uruchomić komendę, wysłać maila, otworzyć ticket, kliknąć przycisk albo zmienić dane. Kiedy model dostaje ręce, bezpieczeństwo przestaje być abstrakcją i staje się ryzykiem operacyjnym.

Podstawowe warstwy obrony

Sandbox ogranicza, dokąd agent może sięgnąć. Approvals zatrzymują nieodwracalne akcje. Least privilege oznacza, że narzędzie ma tylko prawa potrzebne do pracy. Audit log to czarna skrzynka, bez której po incydencie zostaje wróżenie.

Złe sygnały

Agent działa z pełnym dostępem do repo, sieci i sekretów, a ryzykowne kroki nie wymagają zatwierdzenia. Albo ma dziesięć narzędzi, których model nie odróżnia pewnie. To nie autonomia. To ruletka na tokeny.

Co zapamiętać

Bezpieczny agent to nie taki, który nigdy się nie myli. Bezpieczny agent to taki, którego błąd ma mały blast radius i czytelny ślad.