Lilith Lilith.
CS EN PL
Začít

Z Radaru

Radar · 2026-06-15

Holo3.1 tlačí computer-use agenty z cloudu na lokální stroje

H Company vydala Holo3.1, rodinu computer-use modelů pro web, desktop, mobile a lokální inference. Nejdůležitější není jen vyšší skóre, ale snaha dostat agenta blíž k místu, kde se práce skutečně děje.

Číst

Radar · 2026-06-15

Malé modely ukazují, že agentní hra stojí na nudné infrastruktuře

Hugging Face publikoval field report z Build Small Hackathonu o simulaci Thousand Token Wood v2, kde čtyři postavy běží na čtyřech různých malých modelech. Klíčová lekce pro agentní systémy: serving, JSON opravy, firewall tajných informací a omezená paměť rozhodují víc než poetický prompt.

Číst

Radar · 2026-06-09

Voice agents se lámou na bilingvních hovorech dřív než na modelových demech

ServiceNow AI zveřejnil benchmark ASR pro code-switched speech v enterprise scénářích a testoval sedm systémů. Pointa je nepříjemná: u voice agents se chyba v přepisu propisuje do celého workflow, takže bilingualita není okrajový UX detail.

Číst

Radar · 2026-06-03

Reachy Mini dostal MCP nástroje z Hugging Face Spaces

Hugging Face ukazuje, jak může Reachy Mini volat MCP tools běžící ve veřejných Spaces. Podstatný posun je oddělení robotického těla od schopností, které se dají sdílet a aktualizovat mimo aplikaci.

Číst

Radar · 2026-04-15

VAKRA benchmark odhaluje, kde agenti skutečně selhávají: výběr nástrojů, argumenty, vícekrokové plánování

IBM Research vydal VAKRA: benchmark pro agenty s 8000+ reálnými API přes 62 domén. Testuje celé exekuční trajektorie, nejen finální odpovědi. Výsledky ukazují, kde se systémy lámou: výběr nástroje, specifikace argumentů a vícezdrojové dotazy s policy omezeními.

Číst