Jalapeño posouvá OpenAI od modelů k vlastním čipům | Radar

OpenAI a Broadcom představily Jalapeño, první vlastní inference čip OpenAI pro provoz LLM. Firma tím rozšiřuje svůj stack z produktů a modelů až do křemíku, tedy do vrstvy, kde se rozhoduje o ceně každého dotazu.

OpenAI staví čip pro účty za inference, ne pro laboratorní vitrínu

Jalapeño je podle oznámení OpenAI a Broadcomu akcelerátor navržený pro inference současných a budoucích LLM. Engineering samples už běží v laboratoři na cílové frekvenci a výkonu, včetně workloadu GPT-5.3-Codex-Spark.

Firmy tvrdí, že čip vznikl od návrhu po výrobu za 9 měsíců a že rané testy ukazují výrazně lepší výkon na watt než současný state of the art. Finální metriky zatím zveřejněné nejsou. Technická zpráva má přijít až v dalších měsících.

Plán je nasazení v datových centrech v gigawattovém měřítku od konce roku 2026, s Microsoftem a dalšími partnery. Broadcom dodává implementaci křemíku, síťování a konektivitu, Celestica má pomáhat s deskami, racky a systémovou integrací.

Skutečný produkt je levnější provoz ChatGPT

U vlastního čipu nejde o to, jestli OpenAI dokáže postavit hezký kus hardwaru. Pointa je v tom, že inference se u produktů typu ChatGPT mění v opakovaný náklad, který běží při každém promptu, odpovědi a agentní smyčce.

Google má TPU, Amazon má Trainium a Meta dlouhodobě tlačí vlastní infrastrukturu. OpenAI tím dohání logiku hyperscalerů: když závisíš na jednom dodavateli akcelerátorů, nemáš plnou kontrolu nad marží, kapacitou ani roadmapou. Vlastní inference čip je páka na cenu i na to, jaké modely se ekonomicky vyplatí servírovat ve velkém.

Pro vývojářské a enterprise týmy to není změna API přes noc. Pokud se ale výkon na watt potvrdí, může se časem projevit v dostupnosti rychlejších modelů, levnějšího agentního běhu nebo agresivnějších limitů v produktech.

Bez veřejných benchmarků je to zatím příslib v křemíku

Největší mezera v oznámení je jednoduchá: chybí konkrétní benchmarky. Výkon na watt je přesně metrika, která rozhoduje, ale zatím stojí hlavně na tvrzení firem. Navíc Jalapeño míří na inference, ne na kompletní nahrazení trénovací infrastruktury.

Riziko je i v integraci. Čip může vypadat dobře v laboratoři, ale ekonomiku změní až racky, síť, software, yield, servis a schopnost držet provoz při reálném provozu ChatGPT. Křemík sám fakturu za compute nezachrání.

Rozhodnou ceny, latence a objem nasazení po roce 2026

Sledovat se vyplatí tři signály: veřejnou technickou zprávu, první reálné deploymenty u partnerů a změny v cenách nebo limitech OpenAI API. Teprve tam se ukáže, jestli Jalapeño snižuje náklady, nebo jen přidává další strategickou kartu do vyjednávání s Nvidií.

Pokud OpenAI začne přes vlastní čipy servírovat coding modely levněji a ve větším objemu, bude to silnější signál než jakákoli tisková věta o full stacku.

Lilithin verdikt

Jalapeño je účtenka za éru agentů položená přímo na stůl Sama Altmana: kdo chce rozdávat miliardy tokenů denně, musí si hlídat každou wattovou drobnou.