Etykieta
#Safety
Z Radaru
Radar · 2026-06-15
OpenAI chce jednej mapy zasad, zanim stany napiszą pięćdziesiąt własnych
OpenAI opublikowała agendę polityki publicznej dla AI: bezpieczeństwo frontier modeli, ochronę młodzieży, edukację, rynek pracy i infrastrukturę. Najważniejsze nie jest samo lobbyowanie. To próba utrzymania czytelnych reguł, zanim wdrożenia utkną w lokalnej papierologii.
Czytaj →Radar · 2026-06-09
Claude Fable 5 zmienia safety w pytanie o dostęp do najlepszego modelu
Nathan Lambert czyta premierę Claude Fable 5 jako spór o to, kto może używać frontier model bez routingu i filtrów. Ważna jest nie tylko zdolność modelu, ale warstwa governance, która decyduje, kiedy użytkownik naprawdę rozmawia z najmocniejszym systemem.
Czytaj →Radar · 2026-06-08
OpenAI opakowuje AGI w język infrastruktury publicznej
OpenAI opublikowała plan oparty na automatycznym badaczu AI, szybszym wzroście gospodarczym i „personal AGI“ dla każdego. Ważniejsza od samej obietnicy jest zmiana tonu: firma mówi mniej jak lider produktu, a bardziej jak przyszły zarządca infrastruktury publicznej.
Czytaj →Radar · 2026-05-29
Zvi czyta system card Claude Opus 4.8 jako audyt zmiany ryzyk
Zvi Mowshowitz analizuje Claude Opus 4.8 jako inkrementalny upgrade z lepszymi capabilities, safety i pytaniami wokół evals.
Czytaj →Radar · 2026-05-11
SocialReasoning-Bench: agent wykonuje zadanie, ale nie poprawia pozycji użytkownika
Microsoft Research opisuje SocialReasoning-Bench, benchmark sprawdzający, czy agenty AI faktycznie działają w najlepszym interesie użytkownika. Kluczowy wynik: agenty technicznie wykonują zadania, ale nie poprawiają konsekwentnie wyniku dla człowieka, nawet przy wyraźnej instrukcji.
Czytaj →Ze Słownika
Słownik
Frontier model governance — kto sprawdza model przed releasem
Frontier model governance pyta, kto testuje najsilniejsze modele przed wdrożeniem, według jakich reguł i z jaką możliwością interwencji. Dobrowolny audyt, system card i testy państwowe to nie to samo.
Czytaj →Słownik
Physical AI — kiedy agent sięga do świata
Physical AI łączy modele, roboty, symulacje i działania w realnym środowisku. Nie chodzi o ładne demo robota, tylko o to, kto ponosi ryzyko, gdy model zaczyna poruszać rzeczami.
Czytaj →