Nathan Lambert čte vydání Claude Fable 5 jako spor o to, kdo smí používat frontier model bez přesměrování a filtrů. Klíčová je governance vrstva, která rozhoduje, kdy uživatel skutečně mluví s tím nejlepším systémem.
Safety politika tady funguje jako vrátný před nejlepším modelem, který občas rozhodne, že do hlavní místnosti nepůjdeš.
Simon Willison ukazuje, jak v AgentsView ručně doplnil cenu nového modelu Claude Fable 5 a hned viděl náklady svých lokálních coding agentů. Malá utilita tu odhaluje větší posun: AI vývoj se začíná řídit jako spotřeba infrastruktury, ne jako předplatné v appce.
Nejzajímavější na tomhle TIL je obraz vývojáře, který vedle diffu konečně vidí i účtenku za agenta, který mu ten diff vyrobil.
ServiceNow AI zveřejnil benchmark ASR pro code-switched speech v enterprise scénářích a testoval sedm systémů. Pointa je nepříjemná: u voice agents se chyba v přepisu propisuje do celého workflow, takže bilingualita není okrajový UX detail.
Zákazník uprostřed věty přepne jazyk a agent pošle ticket špatným směrem. Benchmark jen pojmenoval chybu, která se v monolingual evaluacích schovávala za dobrým WER skóre.
Google oznámil Gemini 3.5 Live Translate pro téměř real-time voice-to-voice překlad ve více než 70 jazycích. Praktická otázka zahrnuje kvalitu překladu, latenci, stabilitu hlasu, dostupnost v Meetu a odpovědnost za chybu v živém hovoru.
Live Translate dává do místnosti neviditelného tlumočníka, který mluví pár sekund po vás. Krásné, dokud si v hluku nesplete hlas, jazyk nebo větu, podle které někdo udělá rozhodnutí.
Google uvádí Gemini 3.5 Live Translate pro near real-time speech-to-speech překlad ve více než 70 jazycích. Pro uživatele je vidět hlavně pohodlí, pro firmy bude klíčová latence, audit a důvěra v hlas, který mluví za někoho jiného.
Živý tlumočník uprostřed schůzky, kterému všichni začnou věřit dřív, než zjistí, kdy se plete.
Google představil Gemma 4 12B jako sjednocený encoder-free multimodální model určený pro vysoký výkon přímo na laptopu. Praktická otázka zní, jestli 12B model zvládne dost kvality na lokální nebo edge scénáře bez těžké cloudové infrastruktury.
Gemma 4 12B zkouší posadit multimodální model přímo na klín uživatele. Teď se ukáže, jestli tam bude pracovat, nebo jen hučet jako malý server pod monitorem.