#OpenAI | Lilith AI

Radar · 2026-06-16

SpaceX kupuje Cursor za 60 miliard dolarów i wchodzi do enterprise AI przez deweloperów

SpaceX kupuje Anysphere, twórcę Cursor, w transakcji wycenianej na 60 miliardów dolarów według The Verge i Bloomberga. Musk celuje w enterprise AI przez narzędzie, w którym deweloperzy już piszą kod produkcyjny, a nie przez kolejnego samodzielnego chatbota.

Czytaj →

Radar · 2026-06-15

OpenAI chce jednej mapy zasad, zanim stany napiszą pięćdziesiąt własnych

OpenAI opublikowała agendę polityki publicznej dla AI: bezpieczeństwo frontier modeli, ochronę młodzieży, edukację, rynek pracy i infrastrukturę. Najważniejsze nie jest samo lobbyowanie. To próba utrzymania czytelnych reguł, zanim wdrożenia utkną w lokalnej papierologii.

Czytaj →

Radar · 2026-06-10

OpenAI wchodzi do Oracle Cloud po budżet, nie po efektowne demo

OpenAI udostępnia swoje modele i Codex klientom Oracle Cloud przez istniejące zobowiązania chmurowe. Dla zespołów enterprise ważny jest nie sam endpoint, ale to, że AI mieści się w umowach, governance i rozliczeniach, które firma już zna.

Czytaj →

Radar · 2026-06-08

OpenAI opakowuje AGI w język infrastruktury publicznej

OpenAI opublikowała plan oparty na automatycznym badaczu AI, szybszym wzroście gospodarczym i „personal AGI“ dla każdego. Ważniejsza od samej obietnicy jest zmiana tonu: firma mówi mniej jak lider produktu, a bardziej jak przyszły zarządca infrastruktury publicznej.

Czytaj →

Radar · 2026-06-05

Lockdown Mode odcina najgroźniejszą drogę ucieczki po prompt injection

OpenAI uruchomiła Lockdown Mode dla wybranych kont osobistych ChatGPT oraz self-serve ChatGPT Business. Funkcja nie zatrzymuje samego prompt injection, ale ogranicza wychodzące żądania sieciowe, czyli kanał potrzebny do wyniesienia danych.

Czytaj →

Radar · 2026-06-03

GPT-Rosalind przechodzi od benchmarków do kontrolowanej nauki

OpenAI zaktualizowała GPT-Rosalind dla life sciences i oferuje go w research preview wybranym organizacjom globalnie. Ważniejszy od tabeli wyników jest ruch w stronę połączenia modelu, Codexu i narzędzi bioinformatycznych w audytowalne workflow.

Czytaj →

Radar · 2026-06-03

Wasmer pokazuje Codex jako dźwignię dla małych zespołów, nie magiczny compiler

OpenAI twierdzi, że Wasmer z pomocą Codex zbudował Edge.js w dwa tygodnie zamiast szacowanego roku i przyspieszył rozwój 10x do 20x. Mocniejsza pointa nie leży w samym numerze, ale w zmianie roli programisty: mniej pisania linijek, więcej prowadzenia ryzykownej pracy modelu.

Czytaj →

Radar · 2026-05-27

Last Week in AI pokazuje gęsty tydzień wokół OpenAI i Gemini

Last Week in AI #341 łączy porażkę Muska z OpenAI, aktualizacje Gemini z IO 2026 i inne sygnały z rynku AI.

Czytaj →

Radar · 2026-05-27

Codex pomaga budować samodoskonalących się agentów podatkowych

OpenAI, Thrive Holdings i Crete zbudowały Tax AI dla ponad trzydziestu firm księgowych. Pilotaż obsłużył 7 000 deklaracji, oszczędza około jednej trzeciej czasu specjalistów i w sześć tygodni mocno poprawił wyniki dzięki pętli informacji zwrotnej z Codexem.

Czytaj →

Radar · 2026-05-27

Warp stawia na open-source terminal agentowy z GPT-5.5

Warp chce przesunąć terminal z roli narzędzia do poleceń w stronę agentowego środowiska programistycznego. Otwarty klient, OpenAI jako sponsor założycielski i GPT-5.5 mają wspierać model pracy, w którym ludzie wyznaczają cele i nadzorują rezultat, a agenci planują, kodują, testują i otwierają pull requesty.

Czytaj →

Radar · 2026-05-26

LWiAI #246: jeden tydzień, cztery fronty naraz. Google I/O, agenci, prawnicy, bezpieczeństwo

Epizoda LWiAI Podcast #246 z 26 maja 2026 to rozcestník, nie jedna wielka teza. Google I/O, coding agents, presja prawna wokół OpenAI i badania nad bezpieczeństwem złożyły się w jeden tydzień i zarysowały cztery równoczesne presje na rynek AI.

Czytaj →

Radar · 2026-05-22

Gartner uznaje OpenAI za lidera enterprise coding agents

OpenAI twierdzi, że Gartner uznał Codex za lidera wśród enterprise AI coding agents. Dla firm to przede wszystkim sygnał zakupowy i governance, nie dowód przewagi technicznej.

Czytaj →

Radar · 2026-05-20

OpenAI przesuwa Education for Countries w stronę krajowych programów AI w edukacji

OpenAI przesuwa Education for Countries w stronę krajowych programów AI w edukacji. Nie chodzi tylko o dostęp do ChatGPT, lecz o kształtowanie infrastruktury, szkoleń i nawyków operacyjnych wokół AI w sektorze publicznym.

Czytaj →

Radar · 2026-05-18

OpenAI i Dell przenoszą Codex on-prem: enterprise chce agenta blisko swoich danych, nie w chmurze

OpenAI i Dell chcą przenieść Codex bliżej danych firmowych, infrastruktury hybrydowej i środowisk on-prem. Mniej efektowne niż demo, ale ważniejsze dla adopcji enterprise.

Czytaj →

Radar · 2026-05-14

Sea wdraża Codex u 87% zespołu i traktuje agentów jako zmianę organizacyjną, nie wtyczkę

Sea Limited wdraża Codex w engineeringu, a OpenAI podaje 87% weekly active users. Rozmowa z Davidem Chenem z Shopee nie dotyczy tylko szybszego pisania kodu. Pokazuje agentów jako warstwę nad złożonymi codebase, CI/CD, testami i projektowaniem systemów.

Czytaj →

Radar · 2026-05-14

Codex w mobilnym ChatGPT: agent przestaje być oknem na laptopie

Codex trafia do aplikacji mobilnej ChatGPT. Nie jako zabawka w podróży, lecz jako warstwą sterowania długimi zadaniami w prawdziwych środowiskach developerskich.

Czytaj →

Radar · 2026-05-13

Fine-tuning nie umiera. Po prostu przestaje być domyślną odpowiedzią

Latent Space używa ograniczenia części API fine-tuning OpenAI jako dobrego reality check: dla większości produktów AI pierwszym krokiem nie jest dziś dostrajanie wag, lecz lepsza ewaluacja, kontekst, retrieval, tool use i workflow. Fine-tuning pozostaje silnym narzędziem, tylko nie uniwersalnym lekiem na źle zaprojektowany system.

Czytaj →

Radar · 2026-05-12

Codex wchodzi do finansów: raportowanie i variance bridges bez ręcznego piekła

OpenAI Academy pokazuje Codex w zespołach finansowych: MBR, pakiety raportowe, variance bridges, kontrole modeli i scenariusze planistyczne z roboczych danych. Mniej efektowne niż demo generowania aplikacji, ale praktycznie cenniejsze: warstwą agenta nad powtarzalną pracą analityczną.

Czytaj →

Radar · 2026-05-12

Parameter Golf pokazuje, jak agenci kodujący zmieniają tempo iteracji badawczej

OpenAI opublikowalo wnioski z Parameter Golf: ponad 1 000 uczestników, ponad 2 000 zglосzeń, limit 16 MB na artefakt i 10 minut treningu na 8x H100. Najważniejsza nie jest tylko kompresja modeli. Agenci kodujący zmienili tempo iteracji badawczej.

Czytaj →

Radar · 2026-05-08

Codex dostaje architekturę bezpieczeństwa, nie tylko disclaimery w README

OpenAI opisuje, jak Codex działa w izolowanych środowiskach: sandbox per repozytorium, izolacja sieci, kroki zatwierdzania i telemetria natywna dla agentów.

Czytaj →

Radar · 2026-04-28

OpenAI warstwuje bezpieczeństwo ChatGPT od modelu do wykrywania nadużyć, ale liczb brakuje

OpenAI opisuje wielowarstwowe podejście do bezpieczeństwa społeczności ChatGPT: zabezpieczenia modelu, wykrywanie nadużyć, egzekwowanie polityk i współpraca z zewnętrznymi ekspertami.

Czytaj →

Radar · 2026-04-23

OpenAI płaci do 25 000 dolarów za bio jailbreaki w GPT-5.5, a dowodem będą zagregowane wyniki

OpenAI uruchamia program bio bug bounty skupiony na uniwersalnych jailbreakach w GPT-5.5, z nagrodami do 25 000 dolarów za krytyczne ustalenia dotyczące bezpieczeństwa biologicznego.

Czytaj →

Radar · 2026-04-21

ChatGPT Images 2.0 nareszcie radzi sobie z tekstem w grafice, ale produkcje potwierdzą niezależne testy

ChatGPT Images 2.0 przynosi ulepszone generowanie obrazów z naciskiem na dokładność tekstu, wsparcie wielojęzyczne i zaawansowane rozumowanie wizualne dla workflow produkcyjnych.

Czytaj →

Radar · 2026-01-20

Cisco wdrożyła Codex do naprawy defektów w enterprise, ale twardych liczb wciąż brakuje

Cisco i OpenAI opisują wdrożenie Codexa jako agenta w enterprise workflow inżynieryjnym: automatyzacja buildu, naprawa defektów i przejście do podejścia agentowego.

Czytaj →

Radar · 2025-12-18

GPT-5.2-Codex celuje w long-horizon refaktoryzacje, dowodem będą niezależne testy produkcyjne

GPT-5.2-Codex jest ukierunkowany na długoterminowe zadania kodowania w dużym kontekście: wielkoskalowe transformacje kodu, poprawki bezpieczeństwa i spójność wielu plików.

Czytaj →

Radar · 2025-12-16

FrontierScience testuje AI pod kątem rozumowania naukowego, ale benchmark własnego laboratorium potrzebuje niezależnego audytu

OpenAI przedstawia FrontierScience: benchmark zadań rozumowania naukowego z fizyki, chemii i biologii, skupiony na procesach rozumowania, a nie tylko na pamięci faktów.

Czytaj →

Radar · 2025-11-19

System card GPT-5.1-Codex-Max warto przeczytać, ale ufaj mu proporcjonalnie do szczegółowości jego ograniczeń

System card GPT-5.1-Codex-Max opisuje dwie warstwy bezpieczeństwa: trening bezpieczeństwa na poziomie modelu i ochrona przed prompt injection, sandboxing na poziomie produktu i konfigurowalny dostęp do sieci.

Czytaj →

Radar · 2025-10-29

OpenAI otwiera klasyfikację treści opartą na policy: modele safeguard działają w czasie rzeczywistym

OpenAI wydała gpt-oss-safeguard-120b i 20b: open-weight modele reasoning, w których policy klasyfikacji treści nie jest wbudowana w wagi, lecz podawana w czasie działania. Organizacje dostarczają własne zasady, a model na ich podstawie podejmuje decyzje.

Czytaj →

Radar · 2025-09-05

Modele halucynują z powodu sposobu trenowania i ewaluacji, nie dlatego, że są głupie

Tekst OpenAI z września 2025 dociera do korzenia halucynacji: modele uczą się grać w grę ewaluacji, a nie odpowiadać prawdziwie. Jeśli evale karzą za przyznaną niepewność surowiej niż za pewny błąd, modele kalibrują się na przekonywalność.

Czytaj →

Radar · 2025-08-27

OpenAI i Anthropic testowały wzajemnie swoje modele. Wyniki pouczające, metodologia nadal otwarta.

OpenAI i Anthropic opublikowały wyniki wspólnej ewaluacji bezpieczeństwa: testowały wzajemnie swoje modele pod kątem misalignmentu, instruction following, halucynacji i jailbreakingu. Po raz pierwszy dwa czołowe laboratoria pokazują, gdzie zewnętrzne oczy wykrywają ich ślepe punkty.

Czytaj →