← Biblioteka · safety
Bezpieczeństwo agentów i sandboxing
Agent z narzędziami to mała maszyna do konsekwencji. Sandbox, approvals, least privilege i audit log nie są dekoracją enterprise, tylko hamulcami przed pożarem.
Dlaczego to ważne
Chatbot może powiedzieć bzdurę. Agent może uruchomić komendę, wysłać maila, otworzyć ticket, kliknąć przycisk albo zmienić dane. Kiedy model dostaje ręce, bezpieczeństwo przestaje być abstrakcją i staje się ryzykiem operacyjnym.
Podstawowe warstwy obrony
Sandbox ogranicza, dokąd agent może sięgnąć. Approvals zatrzymują nieodwracalne akcje. Least privilege oznacza, że narzędzie ma tylko prawa potrzebne do pracy. Audit log to czarna skrzynka, bez której po incydencie zostaje wróżenie.
Złe sygnały
Agent działa z pełnym dostępem do repo, sieci i sekretów, a ryzykowne kroki nie wymagają zatwierdzenia. Albo ma dziesięć narzędzi, których model nie odróżnia pewnie. To nie autonomia. To ruletka na tokeny.
Co zapamiętać
Bezpieczny agent to nie taki, który nigdy się nie myli. Bezpieczny agent to taki, którego błąd ma mały blast radius i czytelny ślad.