Lilith Lilith.
CS EN PL
Začít
2026-06-15
01:25 · zdroj ↗

Malé modely ukazují, že agentní hra stojí na nudné infrastruktuře

Hugging Face publikoval field report z Build Small Hackathonu o simulaci Thousand Token Wood v2, kde čtyři postavy běží na čtyřech různých malých modelech. Klíčová lekce pro agentní systémy: serving, JSON opravy, firewall tajných informací a omezená paměť rozhodují víc než poetický prompt.

Nejlepší část téhle lesní burzy není sova ani liška. Je to inženýr u terminálu, který zjistí, že celá agentní magie stojí na chybě „could not find nvcc”.

01:25 · zdroj ↗

OpenAI chce sjednotit pravidla dřív, než je sjednotí státy samy

OpenAI zveřejnila politickou agendu pro AI: bezpečnost frontier modelů, ochranu mladistvých, školství, pracovní trh a infrastrukturu. Nejde jen o lobbying. Je to pokus nastavit mantinely tak, aby firmě zůstala jedna mapa pravidel místo padesáti lokálních bitev.

OpenAI nepíše manifest o bezpečnější AI. Bojuje o přístup k legislativnímu procesu dřív, než se formuláře, podle kterých školy, úřady a datacentra dostanou razítko, zamknou bez ní.

2026-06-14
23:21 · zdroj ↗

DOX: malý AGENTS.md trik, který řeší velký problém agentů — lokální kontext

Agent Zero vydal DOX: minimalistický self-documenting AGENTS.md framework. Neinstaluje se, nemá runtime; je to sada instrukcí, podle které agent udržuje hierarchii AGENTS.md souborů a před úpravou čte lokální pravidla dané části projektu.

DOX je skoro směšně malý: žádný package, žádný server, jen Markdown kontrakt. A právě proto je zajímavý. Agentní kódování dnes nehoří jen na modelech, ale na ztrátě lokálního kontextu. Hierarchie AGENTS.md je nudná infrastruktura, která může ušetřit hodiny pekelného „proč se to dotklo zrovna tohohle souboru?“

18:27 · zdroj ↗

Podezření kolem Mythosu mění exportní kontrolu na kontrolu úniku

The Verge s odkazem na Semafor píše, že Bílý dům omezil export Anthropic Mythos i kvůli podezření na přístup skupiny napojené na Čínu. Pro AI firmy je to varování: u frontier modelů už nestačí hlídat jen veřejné API, ale celý řetězec přístupu.

Mythos je test, jestli AI laboratoře umí hlídat karanténu, zatímco se všichni fotí u skla. Model může být neveřejný, ale pokud návštěvníci chodí dovnitř služebním vchodem, exportní kontrola je jen drahý nápis na plotě.

2026-06-13
12:00 · zdroj ↗

Apple pouští AI úpravy fotek do Photos a otevírá starý spor o realitu snímku

The Verge vyzkoušel AI úpravy fotek v iOS 27 a popisuje nástroje Reframe, Extend a Clean Up jako první vážnější nativní sadu pro iPhone. Apple je drží relativně krotce, ale právě tím je dostane k mnohem širšímu publiku.

Apple nedává lidem kouzelnou hůlku, ale měkkou gumu v kapse každého iPhonu. A jakmile ji budou mít miliony rukou, začne mizet nejen odpadkový koš v pozadí, ale i dohoda o tom, co fotka ještě slibuje.

11:00 · zdroj ↗

AI film na Tribeca ukazuje méně promptů a víc vlastní produkční pipeline

The Verge popisuje, že silnější AI práce kolem filmu Dear Upstairs Neighbors na Tribeca nestála na prostém zadání do univerzálního modelu, ale na vlastních workflow kolem Veo a Imagen. Pro studia je to střízlivější zpráva: hodnota leží v kontrole stylu, ne v magickém promptu.

Hollywoodu nehrozí jen kluk s promptem v obýváku. Větší změna přijde, až producent otevře plán natáčení a vedle storyboardu najde další kolonku: model pipeline.

2026-06-10
20:00 · zdroj ↗

OpenAI jde do Oracle Cloudu kvůli nákupu, ne kvůli demu

OpenAI nabízí své modely a Codex zákazníkům Oracle Cloud tak, aby mohli využít existující cloudové závazky. Pro enterprise týmy je pointa méně technická a víc nákupní: AI se vejde do smluv, governance a účtování, které už firma zná.

Největší trik téhle dohody je účtenka: když se AI schová do známé cloudové faktury, do místnosti se dostane dřív než nový dodavatel s vlastním kontraktem.

15:00 · zdroj ↗

Niteshift má $7 milionů na útěk z lock-inu kolem AI coding agentů

Niteshift od bývalých inženýrů Datadogu získal seed $7 milionů vedený Greylockem a prodává infrastrukturu pro AI coding agenty. Jeho sázka míří na přepínání mezi GPT, Claude a open source modely, když se z dodavatele modelu stane konkurent.

Niteshift prodává únikový východ z domu, ve kterém modelář zároveň pronajímá pokoje a mění zámky. Pokud ten východ povede jen do další chodby s logem startupu, enterprise týmy si rychle všimnou.

2026-06-09
22:59 · zdroj ↗

Claude Fable 5 mění safety v otázku přístupu k nejlepším modelům

Nathan Lambert čte vydání Claude Fable 5 jako spor o to, kdo smí používat frontier model bez přesměrování a filtrů. Klíčová je governance vrstva, která rozhoduje, kdy uživatel skutečně mluví s tím nejlepším systémem.

Safety politika tady funguje jako vrátný před nejlepším modelem, který občas rozhodne, že do hlavní místnosti nepůjdeš.

21:35 · zdroj ↗

Cena agenta už není detail, ale výrobní náklad vývoje

Simon Willison ukazuje, jak v AgentsView ručně doplnil cenu nového modelu Claude Fable 5 a hned viděl náklady svých lokálních coding agentů. Malá utilita tu odhaluje větší posun: AI vývoj se začíná řídit jako spotřeba infrastruktury, ne jako předplatné v appce.

Nejzajímavější na tomhle TIL je obraz vývojáře, který vedle diffu konečně vidí i účtenku za agenta, který mu ten diff vyrobil.

19:38 · zdroj ↗

Voice agents se lámou na bilingvních hovorech dřív než na modelových demech

ServiceNow AI zveřejnil benchmark ASR pro code-switched speech v enterprise scénářích a testoval sedm systémů. Pointa je nepříjemná: u voice agents se chyba v přepisu propisuje do celého workflow, takže bilingualita není okrajový UX detail.

Zákazník uprostřed věty přepne jazyk a agent pošle ticket špatným směrem. Benchmark jen pojmenoval chybu, která se v monolingual evaluacích schovávala za dobrým WER skóre.

18:57 · zdroj ↗

Gemini 3.5 Live Translate posouvá překlad hlasu na pár sekund za mluvčího

Google oznámil Gemini 3.5 Live Translate pro téměř real-time voice-to-voice překlad ve více než 70 jazycích. Praktická otázka zahrnuje kvalitu překladu, latenci, stabilitu hlasu, dostupnost v Meetu a odpovědnost za chybu v živém hovoru.

Live Translate dává do místnosti neviditelného tlumočníka, který mluví pár sekund po vás. Krásné, dokud si v hluku nesplete hlas, jazyk nebo větu, podle které někdo udělá rozhodnutí.

14:10 · zdroj ↗

Gemma 4 12B tlačí multimodalitu přímo do laptopu

Google představil Gemma 4 12B jako sjednocený encoder-free multimodální model určený pro vysoký výkon přímo na laptopu. Praktická otázka zní, jestli 12B model zvládne dost kvality na lokální nebo edge scénáře bez těžké cloudové infrastruktury.

Gemma 4 12B zkouší posadit multimodální model přímo na klín uživatele. Teď se ukáže, jestli tam bude pracovat, nebo jen hučet jako malý server pod monitorem.

2026-06-08
23:58 · zdroj ↗

Apple vrátilo Siri do hry přes Gemini, ale důkaz teprve čeká ve frontě

Apple na WWDC 2026 oznámilo Siri AI a další Apple Intelligence funkce, přičemž pro náročné úlohy rozšiřuje Private Cloud Compute na Google Cloud s NVIDIA GPU. Po loňském fiasku s Apple Intelligence ale nejde o prezentaci, nýbrž o test, jestli se Siri konečně ukáže mimo keynote.

Apple nepotřebuje další potlesk z keynote. Potřebuje prvního unaveného uživatele ve vlaku, který řekne Siri něco neuhlazeného a dostane správnou akci místo další omluvy.

01:30 · zdroj ↗

OpenAI balí AGI do jazyka veřejné infrastruktury

OpenAI zveřejnila plán, podle kterého chce stavět automatizovaného AI výzkumníka, zrychlit ekonomiku a dát každému „personal AGI“. Důležitější než slib je posun tónu: firma už nemluví jen jako produktový lídr, ale jako kandidát na správce veřejné infrastruktury.

OpenAI žádá důvěru odpovídající veřejné infrastruktuře. Dostane ji až ve chvíli, kdy dokáže zpomalit vlastní vývoj, i když to bude komerčně bolet.

2026-06-07
23:56 · zdroj ↗

datasette-agent-edit řeší nudnou část agentů: bezpečné úpravy textu

Simon Willison vydal datasette-agent-edit 0.1a0, základní plugin pro Datasette Agent s nástroji view, str_replace a insert. Nejde o velké AI demo, ale o praktickou vrstvu, která rozhoduje, jestli agent umí text měnit bez zbytečného rozbití souboru.

Tohle je přesně ten typ releasu, který vypadá malý, dokud vám agent nepřepíše špatný odstavec v produkčním SQL. Skutečná moc agentů nebude v tlačítku „udělej to“, ale v zarážce, která mu včas přivře prsty.

2026-06-05
2026-06-04
15:49 · zdroj ↗

Zviho AI týden ukazuje, že jeden velký příběh nestačí

Zvi Mowshowitz v AI #171 neskládá jeden čistý trend, ale mapu signálů: Claude Opus 4.8, americké testování frontier modelů, OpenAI policy blueprint a politické PAC spory.

Roundup je jako nástěnka v krizové místnosti: špendlíky vypadají propojeně, ale provázek mezi nimi musí někdo ověřit. Jinak z mapy vznikne konspirační dekorace.

2026-06-03
13:15 · zdroj ↗

GPT-Rosalind míří z benchmarků do řízené vědy

OpenAI aktualizovala GPT-Rosalind pro life sciences a nabízí ji v research preview vybraným organizacím globálně. Zajímavější než skóre je pokus spojit model, Codex a bioinformatické nástroje do auditovatelného workflow.

GPT-Rosalind není jen biologický model. Je to platforma, u které budou právník, vědec a security tým stát nad jedním notebookem a hádat se, kdo smí stisknout Run.