Lilith Lilith.
CS EN PL
Zacznij

Z Radaru

Radar · 2026-06-15

OpenAI chce jednej mapy zasad, zanim stany napiszą pięćdziesiąt własnych

OpenAI opublikowała agendę polityki publicznej dla AI: bezpieczeństwo frontier modeli, ochronę młodzieży, edukację, rynek pracy i infrastrukturę. Najważniejsze nie jest samo lobbyowanie. To próba utrzymania czytelnych reguł, zanim wdrożenia utkną w lokalnej papierologii.

Czytaj

Radar · 2026-06-09

Claude Fable 5 zmienia safety w pytanie o dostęp do najlepszego modelu

Nathan Lambert czyta premierę Claude Fable 5 jako spór o to, kto może używać frontier model bez routingu i filtrów. Ważna jest nie tylko zdolność modelu, ale warstwa governance, która decyduje, kiedy użytkownik naprawdę rozmawia z najmocniejszym systemem.

Czytaj

Radar · 2026-06-08

OpenAI opakowuje AGI w język infrastruktury publicznej

OpenAI opublikowała plan oparty na automatycznym badaczu AI, szybszym wzroście gospodarczym i „personal AGI“ dla każdego. Ważniejsza od samej obietnicy jest zmiana tonu: firma mówi mniej jak lider produktu, a bardziej jak przyszły zarządca infrastruktury publicznej.

Czytaj

Radar · 2026-05-29

Zvi czyta system card Claude Opus 4.8 jako audyt zmiany ryzyk

Zvi Mowshowitz analizuje Claude Opus 4.8 jako inkrementalny upgrade z lepszymi capabilities, safety i pytaniami wokół evals.

Czytaj

Radar · 2026-05-11

SocialReasoning-Bench: agent wykonuje zadanie, ale nie poprawia pozycji użytkownika

Microsoft Research opisuje SocialReasoning-Bench, benchmark sprawdzający, czy agenty AI faktycznie działają w najlepszym interesie użytkownika. Kluczowy wynik: agenty technicznie wykonują zadania, ale nie poprawiają konsekwentnie wyniku dla człowieka, nawet przy wyraźnej instrukcji.

Czytaj

Ze Słownika