#Safety | Lilith AI

Z Radaru

Radar · 2026-06-15

OpenAI chce jednej mapy zasad, zanim stany napiszą pięćdziesiąt własnych

OpenAI opublikowała agendę polityki publicznej dla AI: bezpieczeństwo frontier modeli, ochronę młodzieży, edukację, rynek pracy i infrastrukturę. Najważniejsze nie jest samo lobbyowanie. To próba utrzymania czytelnych reguł, zanim wdrożenia utkną w lokalnej papierologii.

Czytaj →

Radar · 2026-06-09

Claude Fable 5 zmienia safety w pytanie o dostęp do najlepszego modelu

Nathan Lambert czyta premierę Claude Fable 5 jako spór o to, kto może używać frontier model bez routingu i filtrów. Ważna jest nie tylko zdolność modelu, ale warstwa governance, która decyduje, kiedy użytkownik naprawdę rozmawia z najmocniejszym systemem.

Czytaj →

Radar · 2026-06-08

OpenAI opakowuje AGI w język infrastruktury publicznej

OpenAI opublikowała plan oparty na automatycznym badaczu AI, szybszym wzroście gospodarczym i „personal AGI“ dla każdego. Ważniejsza od samej obietnicy jest zmiana tonu: firma mówi mniej jak lider produktu, a bardziej jak przyszły zarządca infrastruktury publicznej.

Czytaj →

Radar · 2026-05-29

Zvi czyta system card Claude Opus 4.8 jako audyt zmiany ryzyk

Zvi Mowshowitz analizuje Claude Opus 4.8 jako inkrementalny upgrade z lepszymi capabilities, safety i pytaniami wokół evals.

Czytaj →

Radar · 2026-05-11

SocialReasoning-Bench: agent wykonuje zadanie, ale nie poprawia pozycji użytkownika

Microsoft Research opisuje SocialReasoning-Bench, benchmark sprawdzający, czy agenty AI faktycznie działają w najlepszym interesie użytkownika. Kluczowy wynik: agenty technicznie wykonują zadania, ale nie poprawiają konsekwentnie wyniku dla człowieka, nawet przy wyraźnej instrukcji.

Czytaj →

Ze Słownika

Słownik

Frontier model governance — kto sprawdza model przed releasem

Frontier model governance pyta, kto testuje najsilniejsze modele przed wdrożeniem, według jakich reguł i z jaką możliwością interwencji. Dobrowolny audyt, system card i testy państwowe to nie to samo.

Czytaj →

Słownik

Physical AI — kiedy agent sięga do świata

Physical AI łączy modele, roboty, symulacje i działania w realnym środowisku. Nie chodzi o ładne demo robota, tylko o to, kto ponosi ryzyko, gdy model zaczyna poruszać rzeczami.

Czytaj →