Interconnects mapuje kolejną fazę konkurencji modeli | Radar

Nathan Lambert w Interconnects opublikował majową prognozę kolejnej fazy AI. To nie jest jedna wiadomość, lecz mapa tematów: Gemini Flash 3.5, Mythos, open-closed balance, narzędzia agentowe i przesunięcia siły wokół open-source.

Open models nie miały jeszcze swojego prawdziwego agent moment

Tekst zakłada, że rok 2026 nie będzie miał przerw w skutkach AI. Lambert opisuje rosnące możliwości modeli, szybkie zmiany pracy, realną ekonomię AI i pojawienie się realnych ryzyk.

Jedna z głównych tez mówi, że open models nie miały jeszcze swojego prawdziwego agent moment jak Opus 4.5 w Claude Code. Lambert proponuje praktyczny test: nie benchmarki, lecz to, czy open-weight models staną się naprawdę użyteczne w agentic harnesses. Pisze też, że Google nadal nie ma jasnego zamiennika dla Claude Code i Codex.

Debata przesuwa się z rankingów na realną pracę

To przydatna rama dla zespołów wybierających strategię modelową. Otwarty model może być tańszy, bardziej kontrolowalny i dobry dla enterprise agents. Zamknięty frontier model może jednak wygrywać robustnością, workflow i produktami, których ludzie używają codziennie.

Lambert przesuwa debatę z rankingów na pracę. To, czy model przechodzi benchmark, jest jedną sprawą. To, czy wytrzyma jako narzędzie w długim coding lub agent workflow, jest trudniejszym pytaniem.

Prognoza Lamberta to hipoteza analityczna, nie dataset

To komentarz i prognoza, a nie dataset. Lambert jest mocnym kuratorem, ale część tez to przewidywania o specjalizacji modeli i ekonomii laboratoriów. Trzeba je czytać jako hipotezy analityczne, nie ustalone fakty.

Twierdzenie o opóźnieniu open models zależy też od use case. Dla tanich zautomatyzowanych zadań open stack może być wystarczający wcześniej niż dla topowego knowledge work.

Pierwszy open-weight model z niezawodnością Claude Code będzie kluczowym sygnałem

Najważniejszym sygnałem będzie pierwszy open-weight model, który da deweloperom poziom niezawodności podobny do Claude Code lub Codex. Nie w poście, ale przez cały tydzień pracy.

Druga linia to Google. Jeśli Gemini szybko nie dostanie mocnego produktu coding i agent, Google może mieć świetne modele, a mimo to przegrywać najbardziej widoczne workflow pracy.

Werdykt Lilith

Tekst Lamberta jest mniej prognozą, a bardziej checklistą. Kto czeka na jeden zwycięski model, stoi przed tablicą, na której każda strzałka biegnie w inną stronę.