#coding | Lilith AI

Radar · 2026-06-15

Uber wycenia coding agents: 1 500 dolarów miesięcznie na narzędzie

Uber według Bloomberg ogranicza miesięczne wydatki tokenowe pracowników do 1 500 dolarów na każde agentic coding tool. Coding agents stają się pozycją w budżecie.

Czytaj →

Radar · 2026-06-10

OpenAI wchodzi do Oracle Cloud po budżet, nie po efektowne demo

OpenAI udostępnia swoje modele i Codex klientom Oracle Cloud przez istniejące zobowiązania chmurowe. Dla zespołów enterprise ważny jest nie sam endpoint, ale to, że AI mieści się w umowach, governance i rozliczeniach, które firma już zna.

Czytaj →

Radar · 2026-06-03

Wasmer pokazuje Codex jako dźwignię dla małych zespołów, nie magiczny compiler

OpenAI twierdzi, że Wasmer z pomocą Codex zbudował Edge.js w dwa tygodnie zamiast szacowanego roku i przyspieszył rozwój 10x do 20x. Mocniejsza pointa nie leży w samym numerze, ale w zmianie roli programisty: mniej pisania linijek, więcej prowadzenia ryzykownej pracy modelu.

Czytaj →

Radar · 2026-05-28

Async agents dostają spec, pracują w izolowanym VM i rano zostawiają pull request w repozytorium

Rozmowa Latent Space z Cognition i OpenInspect pokazuje coding agents jako asynchronicznych pracowników: spec-to-PR workflows, full VMs, agent memory i sytuacje, gdy PM wysyła zmianę w kodzie bez dewelopera. Przejście od synchronicznego chatu do delegowania całego cyklu pracy.

Czytaj →

Radar · 2026-05-27

Codex pomaga budować samodoskonalących się agentów podatkowych

OpenAI, Thrive Holdings i Crete zbudowały Tax AI dla ponad trzydziestu firm księgowych. Pilotaż obsłużył 7 000 deklaracji, oszczędza około jednej trzeciej czasu specjalistów i w sześć tygodni mocno poprawił wyniki dzięki pętli informacji zwrotnej z Codexem.

Czytaj →

Radar · 2026-05-22

Gartner uznaje OpenAI za lidera enterprise coding agents

OpenAI twierdzi, że Gartner uznał Codex za lidera wśród enterprise AI coding agents. Dla firm to przede wszystkim sygnał zakupowy i governance, nie dowód przewagi technicznej.

Czytaj →

Radar · 2026-05-18

OpenAI i Dell przenoszą Codex on-prem: enterprise chce agenta blisko swoich danych, nie w chmurze

OpenAI i Dell chcą przenieść Codex bliżej danych firmowych, infrastruktury hybrydowej i środowisk on-prem. Mniej efektowne niż demo, ale ważniejsze dla adopcji enterprise.

Czytaj →

Radar · 2026-05-14

Sea wdraża Codex u 87% zespołu i traktuje agentów jako zmianę organizacyjną, nie wtyczkę

Sea Limited wdraża Codex w engineeringu, a OpenAI podaje 87% weekly active users. Rozmowa z Davidem Chenem z Shopee nie dotyczy tylko szybszego pisania kodu. Pokazuje agentów jako warstwę nad złożonymi codebase, CI/CD, testami i projektowaniem systemów.

Czytaj →

Radar · 2026-05-14

Codex w mobilnym ChatGPT: agent przestaje być oknem na laptopie

Codex trafia do aplikacji mobilnej ChatGPT. Nie jako zabawka w podróży, lecz jako warstwą sterowania długimi zadaniami w prawdziwych środowiskach developerskich.

Czytaj →

Radar · 2026-05-12

Codex wchodzi do finansów: raportowanie i variance bridges bez ręcznego piekła

OpenAI Academy pokazuje Codex w zespołach finansowych: MBR, pakiety raportowe, variance bridges, kontrole modeli i scenariusze planistyczne z roboczych danych. Mniej efektowne niż demo generowania aplikacji, ale praktycznie cenniejsze: warstwą agenta nad powtarzalną pracą analityczną.

Czytaj →

Radar · 2026-05-11

CodexBar łączy śledzenie limitów 29 narzędzi AI coding w jednej ikonie

CodexBar to open-source owa aplikacja do paska menu macOS, która łączy śledzenie limitów, kredytów, okien resetów i statusu awarii dla 29 providerów AI coding, m.in. Codex, Claude, Cursor, Gemini, Copilot i OpenRouter.

Czytaj →

Radar · 2026-05-11

Agent do kodowania, który nie obniża kosztów utrzymania, to tylko drogi dług techniczny

James Shore podaje niewygodną matematykę coding agents: jeśli agent podwaja output, ale koszty utrzymania pozostają stałe, zespół nie zyskał szybkości, lecz podwoił swój dług techniczny.

Czytaj →

Radar · 2026-05-08

Codex dostaje architekturę bezpieczeństwa, nie tylko disclaimery w README

OpenAI opisuje, jak Codex działa w izolowanych środowiskach: sandbox per repozytorium, izolacja sieci, kroki zatwierdzania i telemetria natywna dla agentów.

Czytaj →

Radar · 2026-05-07

Mozilla naprawiła setki błędów Firefoksa z Claude Mythos. Jakość raportów bezpieczeństwa AI właśnie się zmieniła.

Simon Willison opisał, jak Mozilla wykorzystała wczesny dostęp do Claude Mythos Preview do systematycznego wykrywania i naprawiania luk w Firefoksie. W kwietniu 2026 liczba naprawionych błędów bezpieczeństwa wzrosła do 423, wobec zwykłych 20 do 30 miesięcznie. Kluczowa zmiana: raporty bezpieczeństwa AI przestały być szumem i stały się przydatnym wejściem.

Czytaj →

Radar · 2026-05-06

AlphaEvolve znajduje algorytmy w dni, na które zespoły poświęcały miesiące, z wynikami produkcyjnymi

DeepMind przedstawił AlphaEvolve jako ewolucyjną pętlę opartą na Gemini, która automatycznie odkrywa lepsze algorytmy. Konkretne wyniki produkcyjne: 30 % mniej błędów w genomice, 20 % niższe write amplification dla Spanner, Klarna podwoiła szybkość trenowania transformerów.

Czytaj →

Radar · 2026-05-06

SubQ review: świetne liczby, ale na razie test wiary w benchmarki

Fello AI recenzuje twierdzenia SubQ: okno kontekstu 12M tokenów, 52x szybszy prefill niż FlashAttention na 1M tokenach i pozycjonowanie benchmarków blisko klasy frontier. Liczby są wystarczająco uderzające, by wymagały niezależnej weryfikacji przed zmianą decyzji architektonicznych.

Czytaj →

Radar · 2026-05-01

Agenci kodujący opuszczają IDE: Codex i Claude pokazują, co przychodzi po programowaniu

Latent Space AINews obserwuje zmianę, którą nazywają „breaking containment“: agenci kodujący jak Codex i Claude przestają być narzędziami do pisania kodu i zaczynają być narzędziami do pracy wiedzy i kreatywnej w ogóle.

Czytaj →

Radar · 2026-01-20

Cisco wdrożyła Codex do naprawy defektów w enterprise, ale twardych liczb wciąż brakuje

Cisco i OpenAI opisują wdrożenie Codexa jako agenta w enterprise workflow inżynieryjnym: automatyzacja buildu, naprawa defektów i przejście do podejścia agentowego.

Czytaj →

Radar · 2025-12-18

GPT-5.2-Codex celuje w long-horizon refaktoryzacje, dowodem będą niezależne testy produkcyjne

GPT-5.2-Codex jest ukierunkowany na długoterminowe zadania kodowania w dużym kontekście: wielkoskalowe transformacje kodu, poprawki bezpieczeństwa i spójność wielu plików.

Czytaj →

Radar · 2025-11-19

System card GPT-5.1-Codex-Max warto przeczytać, ale ufaj mu proporcjonalnie do szczegółowości jego ograniczeń

System card GPT-5.1-Codex-Max opisuje dwie warstwy bezpieczeństwa: trening bezpieczeństwa na poziomie modelu i ochrona przed prompt injection, sandboxing na poziomie produktu i konfigurowalny dostęp do sieci.

Czytaj →

Radar · 2025-11-06

Asynchroniczni agenci jako wątek badawczy: zadaj pytanie, dostań pull request

Simon Willison opisuje workflow fire-and-forget z Claude Code, Codex i innymi agentami: zadajesz pytanie badawcze, agent pracuje na serwerze i zgłasza pull request. Kod jest dowodem wykonalności, nie tylko tekstem.

Czytaj →

Radar · 2025-10-20

Claude Code for web: asynchroniczny agent kodujący w sandboxie, bez laptopa

Simon Willison przetestował Claude Code for web: Anthropic opakował doświadczenie lokalnego Claude Code w hostowany sandbox i udostępnił je z webu oraz telefonu. Najważniejsza zmiana to nie mocniejszy model, lecz zmiana workflow: agenci kodujący stają się użyteczniejsi, gdy mogą działać asynchronicznie i bezpiecznie poza laptopem.

Czytaj →

Radar · 2025-09-16

Latent Space: Greg Brockman o GPT-5 i Codexie jako agentowej warstwie programowania

Latent Space opublikował spóźniony odcinek z Gregiem Brockmanem o GPT-5 i Codexie oraz komentarze redakcyjne do kombinacji GPT-5-Codex. To odcinek podcastu i drogowskaz, nie samodzielny esej analityczny.

Czytaj →

Radar · 2025-07-02

Jack Morris płynie pod prąd: teoria informacji zamiast agentów i benchmarków

Latent Space profiluje Jacka Morrisa, doktoranta, który celowo nie pracuje nad agentami, benchmarkami ani forkami VS Code. Bada on informacyjno-teoretyczne podstawy modeli językowych: embeddingi, przestrzeń ukrytą i kompresję. To wywiad podcastowy i drogowskaz.

Czytaj →