#Modely | Lilith AI

Radar · 2026-06-16

Android 17 dělá z Pixelu výkladní skříň Gemini

Google vydal Android 17 a Wear OS 7 nejdřív pro Pixel zařízení a přibalil Pixel Drop s Gemini Omni, Lyria 3 a překladovými funkcemi pro Pixel 10a. Důležitější než samotný update je signál, že Google používá Android jako distribuci pro svoje AI modely přímo v telefonu.

Číst →

Radar · 2026-06-16

Debata o welfare modelů se posouvá z filozofie do produktového rizika

Zvi Mowshowitz používá Fable a Mythos jako případovou studii, proč nelze welfare pokročilých modelů oddělit od schopností, alignmentu a uživatelské zkušenosti. I když je část tématu spekulativní, pro laboratoře se z něj stává praktická otázka evaluací a bezpečnostních zásahů.

Číst →

Radar · 2026-06-15

Anthropic narazil na exportní brzdu, která vypnula Fable 5 všem zákazníkům

Americké úřady podle Anthropic nařídily zastavit přístup k Fable 5 a Mythos 5 pro cizí státní příslušníky, firma proto vypnula oba modely všem zákazníkům. Pro kupce frontier AI je to varování, že compliance riziko už neleží jen v modelu, ale i ve státním vypínači.

Číst →

Radar · 2026-06-15

Americký zásah do Fable a Mythos bere obráncům stejný nůž jako útočníkům

Americká vláda nařídila Anthropic omezit přístup k Fable 5 a Mythos 5 pro všechny cizince, Anthropic proto vypnul modely všem zákazníkům. Protest 76 bezpečnostních expertů ukazuje slabé místo regulace: exportní kontrola neumí snadno odlišit útočný exploit od obranného testu.

Číst →

Radar · 2026-06-15

Claude Opus 4.8 prodává spíš úsudek než další benchmark

Anthropic vydal Claude Opus 4.8 se stejnou cenou jako Opus 4.7 a s důrazem na coding, agentic tasks a delší práci. Důležitější než tabulka benchmarků je ale posun k modelu, který má častěji říkat, kdy si není jistý.

Číst →

Radar · 2026-06-15

Odchod Nathan Lambert z Ai2 ukazuje slabé místo open modelů

Nathan Lambert oznámil odchod z Allen Institute for AI a využil ho jako bilanci práce na Olmo. Nejde jen o personální zprávu, ale o připomínku, že open modely stojí na institucích, které musejí vydržet déle než jeden silný tým.

Číst →

Radar · 2026-06-15

Microsoft si na Buildu zkusil roli modelové laboratoře, ne jen distributora

Latent Space shrnuje Microsoft Build jako okamžik, kdy Microsoft ukázal vlastní MAI modely vedle Copilotu, Windows a Web IQ. Klíčová ambice je mít kontrolu nad daty, inferencí a vývojářským workflow najednou a nepřenechat tuto páku jen partnerům.

Číst →

Radar · 2026-06-15

Trumpův AI order dává vládě 30 dnů před frontier releasem

Bílý dům chce do 60 dnů připravit klasifikovaný cyber benchmark pro „covered frontier models“ a dobrovolný režim, v němž by federální vláda mohla dostat model až 30 dnů před releasem. Licence to formálně není, ale pro laby s federálními zákazníky to může začít fungovat podobně.

Číst →

Radar · 2026-06-15

Špatné RL prostředí netrénuje agenta, ale učí ho věřit rozbitému světu

Latent Space publikoval text Auriel W o tom, proč nekvalitní RL environments kazí trénink agentů. Pointa je jednoduchá: v reinforcement learningu je prostředí generátor dat, takže bug v harnessu se stává učební látkou.

Číst →

Radar · 2026-06-15

Malé modely ukazují, že agentní hra stojí na nudné infrastruktuře

Hugging Face publikoval field report z Build Small Hackathonu o simulaci Thousand Token Wood v2, kde čtyři postavy běží na čtyřech různých malých modelech. Klíčová lekce pro agentní systémy: serving, JSON opravy, firewall tajných informací a omezená paměť rozhodují víc než poetický prompt.

Číst →

Radar · 2026-06-13

AI film na Tribeca ukazuje méně promptů a víc vlastní produkční pipeline

The Verge popisuje, že silnější AI práce kolem filmu Dear Upstairs Neighbors na Tribeca nestála na prostém zadání do univerzálního modelu, ale na vlastních workflow kolem Veo a Imagen. Pro studia je to střízlivější zpráva: hodnota leží v kontrole stylu, ne v magickém promptu.

Číst →

Radar · 2026-06-10

OpenAI jde do Oracle Cloudu kvůli nákupu, ne kvůli demu

OpenAI nabízí své modely a Codex zákazníkům Oracle Cloud tak, aby mohli využít existující cloudové závazky. Pro enterprise týmy je pointa méně technická a víc nákupní: AI se vejde do smluv, governance a účtování, které už firma zná.

Číst →

Radar · 2026-06-10

Niteshift má $7 milionů na útěk z lock-inu kolem AI coding agentů

Niteshift od bývalých inženýrů Datadogu získal seed $7 milionů vedený Greylockem a prodává infrastrukturu pro AI coding agenty. Jeho sázka míří na přepínání mezi GPT, Claude a open source modely, když se z dodavatele modelu stane konkurent.

Číst →

Radar · 2026-06-09

Cena agenta už není detail, ale výrobní náklad vývoje

Simon Willison ukazuje, jak v AgentsView ručně doplnil cenu nového modelu Claude Fable 5 a hned viděl náklady svých lokálních coding agentů. Malá utilita tu odhaluje větší posun: AI vývoj se začíná řídit jako spotřeba infrastruktury, ne jako předplatné v appce.

Číst →

Radar · 2026-06-09

Gemma 4 12B tlačí multimodalitu přímo do laptopu

Google představil Gemma 4 12B jako sjednocený encoder-free multimodální model určený pro vysoký výkon přímo na laptopu. Praktická otázka zní, jestli 12B model zvládne dost kvality na lokální nebo edge scénáře bez těžké cloudové infrastruktury.

Číst →

Radar · 2026-06-08

Apple vrátilo Siri do hry přes Gemini, ale důkaz teprve čeká ve frontě

Apple na WWDC 2026 oznámilo Siri AI a další Apple Intelligence funkce, přičemž pro náročné úlohy rozšiřuje Private Cloud Compute na Google Cloud s NVIDIA GPU. Po loňském fiasku s Apple Intelligence ale nejde o prezentaci, nýbrž o test, jestli se Siri konečně ukáže mimo keynote.

Číst →

Radar · 2026-06-04

Zviho AI týden ukazuje, že jeden velký příběh nestačí

Zvi Mowshowitz v AI #171 neskládá jeden čistý trend, ale mapu signálů: Claude Opus 4.8, americké testování frontier modelů, OpenAI policy blueprint a politické PAC spory.

Číst →

Radar · 2026-06-01

Video generation se posouvá od klipu k agentovi na plátně

Latent Space v rozhovoru s Ethanem He z xAI rámuje Grok Imagine jako krok od jednorázové video generation k video agentům. Pokud má tahle teze obstát, rozhodne méně kvalita ukázky a víc schopnost iterovat celý kreativní úkol.

Číst →

Radar · 2026-06-01

Opus 4.8 ukazuje, že ladění chování modelu není seznam oprav

Zvi Mowshowitz čte Opus 4.8 přes model welfare a tvrdí, že snaha opravit poctivost, sycophancy a preference může vytvořit nové problémy jinde. Pro týmy nasazující modely je to připomínka, že alignment není checklist.

Číst →

Radar · 2026-06-01

Otevřené modely dohánějí cenu, frontier zůstává placená disciplína

Nathan Lambert tvrdí, že open a closed modely se budou zlepšovat po různých křivkách. Praktická otázka není ideologie open source, ale kde se firmám vyplatí platit prémii za nejlepší model.

Číst →

Radar · 2026-05-28

Opus 4.8 čtyřikrát méně přehlíží chyby v kódu a zavádí aktualizace instrukcí uprostřed konverzace

Anthropic vydal Opus 4.8 s jednou konkrétní metrikou: model je čtyřikrát méně pravděpodobný, že přehlédne chybu v kódu než předchůdce. Zároveň přidává mid-conversation system messages a snížil minimální velikost prompt cache z 4 096 na 1 024 tokenů.

Číst →

Radar · 2026-05-27

Warp sází na open source terminál pro agentní vývoj s GPT-5.5

Warp ukazuje, jak chce posunout terminál od nástroje pro příkazy k agentickému vývojovému prostředí. Otevření klienta jako open source, podpora OpenAI a GPT-5.5 mají z vývoje udělat práci, kde lidé určují cíl a kontrolují výsledek, zatímco agenti plánují, píší kód, testují a otevírají pull requesty.

Číst →

Radar · 2026-05-26

Interconnects kreslí mapu další fáze modelové konkurence

Nathan Lambert v květnovém přehledu píše o Gemini Flash 3.5, Mythos, agentních nástrojích a napětí mezi open a closed modely.

Číst →

Radar · 2026-05-26

LWiAI #246: jeden týden, čtyři fronty zároveň. Google I/O, agenti, právníci, bezpečnost

Epizoda LWiAI Podcast #246 z 26. května 2026 je rozcestník, ne jeden velký závěr. Google I/O, coding agents, právní tlak kolem OpenAI a bezpečnostní výzkum se v jednom týdnu poskládaly do přehledu čtyř souběžných tlaků na AI trh.

Číst →

Radar · 2026-05-26

Anthropic jmenuje KiYoung Choiho šéfem pro Koreu před otevřením Soulu

Anthropic jmenoval KiYoung Choiho šéfem pro Koreu před otevřením kanceláře v Soulu, protože z Koreje vidí jeden z nejaktivnějších trhů pro Claude.

Číst →

Radar · 2026-05-25

Chris Olah z Anthropicu varuje ve Vatikánu před pobídkami frontier AI

Papež Lev XIV představil encykliku Magnifica humanitas o ochraně lidské osoby v době umělé inteligence. Na vatikánské prezentaci vystoupil Chris Olah z Anthropicu a varoval, že vývoj špičkových modelů formují pobídky, které se mohou dostat do konfliktu s veřejným dobrem.

Číst →

Radar · 2026-05-13

Fine-tuning neumírá. Jen přestává být výchozí odpovědí

Latent Space používá útlum části OpenAI fine-tuning API jako dobrý reality check: pro většinu AI produktů dnes není první krok ladění vah, ale lepší evaluace, kontext, retrieval, tool use a workflow. Fine-tuning zůstává silný nástroj, jen ne univerzální lék na špatně navržený systém.

Číst →

Radar · 2026-05-12

Codex míří do financí: reporting a variance bridges bez ručního pekla

OpenAI Academy ukazuje Codex ve finančních týmech: MBRs, reporting packy, variance bridges, kontroly modelů a plánovací scénáře z pracovních vstupů. Je to méně nápadné než demo generování aplikace, ale prakticky cennější: agent nad opakovanou analytickou přípravou.

Číst →

Radar · 2026-05-12

Parameter Golf ukázal, jak coding agenti mění tempo výzkumné iterace

OpenAI zveřejnila lessons learned z výzvy Parameter Golf: přes 1 000 účastníků, víc než 2 000 submissions, limit 16 MB na artefakt a 10 minut tréninku na 8 H100. Nejdůležitější není jen komprese modelů, ale fakt, že AI coding agenti změnili tempo výzkumné iterace.

Číst →

Radar · 2026-05-11

Coding agent musí snižovat maintenance cost, nebo je to jen dražší technický dluh

James Shore formuluje nepříjemnou matematiku coding agentů: pokud agent zdvojnásobí výstup, ale maintenance náklady zůstanou stejné, tým nevydělal rychlost, zdvojnásobil zadluženost.

Číst →