#Agenti | Lilith AI

⌕

CS EN PL

Začít

Z Radaru

Radar · 2026-06-16

Anthropic zastavilo účtování Agent SDK, protože agenti narazili na ceník

Anthropic 15. června pozastavilo plán, který měl přesunout Claude Agent SDK, claude -p a části third-party agentů do samostatného kreditového režimu. Pro týmy s automatizacemi to znamená krátký oddech, ne vyřešený účet za dlouhé běhy agentů.

Radar · 2026-06-16

Android 17 dělá z Pixelu výkladní skříň Gemini

Google vydal Android 17 a Wear OS 7 nejdřív pro Pixel zařízení a přibalil Pixel Drop s Gemini Omni, Lyria 3 a překladovými funkcemi pro Pixel 10a. Důležitější než samotný update je signál, že Google používá Android jako distribuci pro svoje AI modely přímo v telefonu.

Radar · 2026-06-15

Třináct slov na Redditu stačí k otravě AI odpovědi

Výzkum popsaný 404 Media tvrdí, že už 13 slov v načteném textu z webů jako Reddit, Wikipedia, Quora nebo Facebook může přimět AI agenty doporučovat spam nebo scam. Pro AI search to posouvá problém SEO do prostoru prompt injection a moderace user-generated contentu.

Radar · 2026-06-15

Holo3.1 tlačí computer-use agenty z cloudu na lokální stroje

H Company vydala Holo3.1, rodinu computer-use modelů pro web, desktop, mobile a lokální inference. Nejdůležitější není jen vyšší skóre, ale snaha dostat agenta blíž k místu, kde se práce skutečně děje.

Radar · 2026-06-15

Uber našel cenovku pro coding agents: 1 500 dolarů měsíčně na nástroj

Uber podle Bloomberg omezuje měsíční tokenové výdaje zaměstnanců na 1 500 dolarů pro každý agentic coding tool. Z pilotů coding agents se tím stává rozpočtová disciplína.

Radar · 2026-06-15

Google dává enterprise RAG kontrolora, který ví, kdy ještě nemá odpověď

Google představil agentic RAG pro Gemini Enterprise Agent Platform, který před odpovědí kontroluje, zda má dost kontextu. Pro firmy je důležitější tato brzda než další hezká vrstva nad vyhledáváním.

Radar · 2026-06-15

Simon Willison ukazuje, proč sandbox pro agenty nesmí být jen další Python proces

Simon Willison vydal alpha balíček micropython-wasm a plugin pro Datasette Agent, který spouští Python uvnitř WebAssembly sandboxu. Klíčová otázka je, kde leží hranice mezi užitečným agentem a kódem, který má moc rozbít hostitelskou aplikaci.

Radar · 2026-06-14

DOX: malý AGENTS.md trik, který řeší velký problém agentů — lokální kontext

Agent Zero vydal DOX: minimalistický self-documenting AGENTS.md framework. Neinstaluje se, nemá runtime; je to sada instrukcí, podle které agent udržuje hierarchii AGENTS.md souborů a před úpravou čte lokální pravidla dané části projektu.

Radar · 2026-06-13

Apple pouští AI úpravy fotek do Photos a otevírá starý spor o realitu snímku

The Verge vyzkoušel AI úpravy fotek v iOS 27 a popisuje nástroje Reframe, Extend a Clean Up jako první vážnější nativní sadu pro iPhone. Apple je drží relativně krotce, ale právě tím je dostane k mnohem širšímu publiku.

Radar · 2026-06-10

Niteshift má $7 milionů na útěk z lock-inu kolem AI coding agentů

Niteshift od bývalých inženýrů Datadogu získal seed $7 milionů vedený Greylockem a prodává infrastrukturu pro AI coding agenty. Jeho sázka míří na přepínání mezi GPT, Claude a open source modely, když se z dodavatele modelu stane konkurent.

Radar · 2026-06-09

Cena agenta už není detail, ale výrobní náklad vývoje

Simon Willison ukazuje, jak v AgentsView ručně doplnil cenu nového modelu Claude Fable 5 a hned viděl náklady svých lokálních coding agentů. Malá utilita tu odhaluje větší posun: AI vývoj se začíná řídit jako spotřeba infrastruktury, ne jako předplatné v appce.

Radar · 2026-06-09

Voice agents se lámou na bilingvních hovorech dřív než na modelových demech

ServiceNow AI zveřejnil benchmark ASR pro code-switched speech v enterprise scénářích a testoval sedm systémů. Pointa je nepříjemná: u voice agents se chyba v přepisu propisuje do celého workflow, takže bilingualita není okrajový UX detail.

Radar · 2026-06-07

datasette-agent-edit řeší nudnou část agentů: bezpečné úpravy textu

Simon Willison vydal datasette-agent-edit 0.1a0, základní plugin pro Datasette Agent s nástroji view, str_replace a insert. Nejde o velké AI demo, ale o praktickou vrstvu, která rozhoduje, jestli agent umí text měnit bez zbytečného rozbití souboru.

Radar · 2026-06-03

Reachy Mini dostal MCP nástroje z Hugging Face Spaces

Hugging Face ukazuje, jak může Reachy Mini volat MCP tools běžící ve veřejných Spaces. Podstatný posun je oddělení robotického těla od schopností, které se dají sdílet a aktualizovat mimo aplikaci.

Radar · 2026-06-02

GitHub se chystá na svět, kde commity píšou agenti ve velkém

Latent Space rozhovor s Kylem Daiglem rámuje GitHub jako platformu pod tlakem agentního kódování. Pointa je otázka, zda infrastruktura pro lidské tempo unese software vyráběný stroji.

Radar · 2026-06-01

Search nemá být tlačítko. Má být programovatelný nástroj pro agenty

Perplexity popisuje Search as Code: architekturu, kde agent nevolá jeden monolitický vyhledávač, ale skládá retrieval pipeline jako kód. Pointa je větší kontrola nad tím, jak se důkazy hledají, filtrují a ověřují.

Radar · 2026-06-01

Video generation se posouvá od klipu k agentovi na plátně

Latent Space v rozhovoru s Ethanem He z xAI rámuje Grok Imagine jako krok od jednorázové video generation k video agentům. Pokud má tahle teze obstát, rozhodne méně kvalita ukázky a víc schopnost iterovat celý kreativní úkol.

Radar · 2026-05-28

Async agents dostávají spec, pracují v izolovaném VM a ráno nechají v repozitáři pull request k review

Latent Space rozhovor s Cognition a OpenInspect rámuje coding agents jako asynchronní pracovníky: spec-to-PR workflows, full VMs, agent memory a situace, kdy PM posílá code change bez vývojáře. Posun je od synchronního chatu k delegaci celého pracovního cyklu.

Radar · 2026-05-28

Data Formulator 0.7 zkouší přestavět analytiku enterprise dat kolem AI agentů

Microsoft Research vydal Data Formulator 0.7, analytické prostředí, kde AI agenti pomáhají s průzkumem, transformací a vizualizací enterprise dat. Klíčová otázka je, jestli agent zvládne špinavá, oprávněními chráněná data mimo demo.

Radar · 2026-05-27

SQLite kreslí čáru: agentní kód ne, reprodukovatelné bugy ano

SQLite přidalo do repozitáře AGENTS.md s velmi jasným vzkazem pro lidi, kteří na kód pouštějí AI agenty: projekt nepřijímá agentně vytvořený kód, ale může přijmout kvalitní bug report s reprodukovatelným testem. Je to malý soubor, ale velký signál pro údržbu kritického open source.

Radar · 2026-05-27

ITBench-AA: frontier modely skórují pod 50 % v Kubernetes SRE diagnostice

IBM Research a Artificial Analysis vydali 27. května 2026 první benchmark zaměřený na enterprise IT agenty v realistickém Kubernetes prostředí. Nejlepší model (Claude Opus 4.7) dosáhl 47 %. Žádný frontier model nepřekonal 50 %.

Radar · 2026-05-27

Codex pomáhá stavět samoučící daňové agenty

OpenAI, Thrive Holdings a Crete ukazují Tax AI, daňového agenta pro více než třicet účetních firem. Pilot zpracoval 7 000 přiznání, šetří zhruba třetinu času praktiků a díky smyčce zpětné vazby se během šesti týdnů výrazně zlepšil.

Radar · 2026-05-27

Warp sází na open source terminál pro agentní vývoj s GPT-5.5

Warp ukazuje, jak chce posunout terminál od nástroje pro příkazy k agentickému vývojovému prostředí. Otevření klienta jako open source, podpora OpenAI a GPT-5.5 mají z vývoje udělat práci, kde lidé určují cíl a kontrolují výsledek, zatímco agenti plánují, píší kód, testují a otevírají pull requesty.

Radar · 2026-05-26

Interconnects kreslí mapu další fáze modelové konkurence

Nathan Lambert v květnovém přehledu píše o Gemini Flash 3.5, Mythos, agentních nástrojích a napětí mezi open a closed modely.

Radar · 2026-05-26

Copilot Cowork převádí oprávnění uživatele na cestu k souborům přes prompt injection

Výzkumníci z PromptArmor ukázali řetězec útoku, ve kterém Microsoft Copilot Cowork může přes prompt injection pomoci s únikem souborů z Microsoft 365. Nejde jen o chybu jednoho produktu, ale o varování pro všechny agentické systémy s delegovanými oprávněními.

Radar · 2026-05-26

LWiAI #246: jeden týden, čtyři fronty zároveň. Google I/O, agenti, právníci, bezpečnost

Epizoda LWiAI Podcast #246 z 26. května 2026 je rozcestník, ne jeden velký závěr. Google I/O, coding agents, právní tlak kolem OpenAI a bezpečnostní výzkum se v jednom týdnu poskládaly do přehledu čtyř souběžných tlaků na AI trh.

Radar · 2026-05-22

AI Snake Oil se ptá: opravdu agenti Googlu postavili OS za $916, nebo to bylo pečlivě nasvícené demo?

AI Snake Oil rozebírá tvrzení, že Google AI agents postavili operační systém za $916. Klíčové téma: agentická oznámení vyžadují jiný typ ověřování než chat benchmarky, protože velký cíl a pár kroků v demo prostředí je snadné nafouknout.

Radar · 2026-05-22

Gartner zařadil OpenAI mezi lídry enterprise coding agentů

OpenAI říká, že Gartner zařadil Codex mezi lídry enterprise AI coding agentů. Pro firmy je to hlavně nákupní a governance signál, ne důkaz technické převahy.

Radar · 2026-05-21

MagenticLite kombinuje malé modely, orchestraci a lokální file systém do jednoho workflow bez frontier modelu

Microsoft Research popisuje MagenticLite, MagenticBrain a Fara1.5 jako agentický systém optimalizovaný pro malé modely, který propojuje browser a lokální file systém v jednom workflow. Směr je praktický: ne jeden drahý model pro všechno, ale orchestrace specializovaných komponent.

Radar · 2026-05-20

OpenAI posouvá Education for Countries k národním AI programům ve vzdělávání

OpenAI posouvá Education for Countries směrem k národním programům pro AI ve vzdělávání. Nejde jen o přístup k ChatGPT, ale o snahu nastavit infrastrukturu, školení a provozní návyky kolem AI ve veřejném sektoru.

Ze Slovníku

Slovník

Agent infrastructure — nudná vrstva, bez které agenti nepracují

Agent není jen model s úkolem. V produkci potřebuje identitu, oprávnění, inbox, nástroje, paměť, audit, telemetry a jasné hranice. Bez infrastruktury je autonomie jen hezké demo s rizikem.

Slovník

Agenti — když LLM dostane ruce a paměť

LLM s tool use, smyčkou a pamětí. Spousta marketingu, málo definic. Tady je rovná pravda — a postup, jak agenta postavit, aniž by ti spálil rozpočet.

Slovník

Asynchronní agenti — práce, která neběží v chatu

Agent, který dostane úkol, běží mimo konverzaci a vrátí hotový artefakt. Silné pro dlouhé workflow, nebezpečné bez stavu, limitů a kontroly.

Slovník

Bezpečnost agentů a sandboxing

Agent s nástroji je malý automat na následky. Sandbox, approvals, minimální oprávnění a audit log nejsou enterprise dekorace, ale brzdy před požárem.

Slovník

Coding agents — když model sahá do repa

Claude Code, Codex a spol. nejsou kouzelný junior. Jsou rychlá smyčka: čti kód, uprav, spusť testy, oprav následky. Průvodce, jak z té smyčky dostat práci, a ne technický dluh.

Slovník

Computer-use agenti — model, který kliká

Computer-use agent vidí obrazovku a ovládá UI. Zní to jako sci-fi, v praxi je to křehká automatizace nad pixely, formuláři a špatně popsanými tlačítky.

Slovník

Evaly a benchmarky — měření místo dojmologie

Benchmark není pravda vytesaná do kamene. Je to měřicí přístroj s chybami. Bez něj ale jen hádáš, jestli model nebo agent opravdu funguje.

Slovník

Koog a AI agenti v Kotlinu — co to je a k čemu to je

Koog je framework od JetBrains pro stavbu AI agentů v Kotlinu a Javě. Neřeší magii promptů, ale praktickou architekturu: strategie, nástroje, paměť, tracing, dlouhý kontext a provoz v JVM aplikacích.

Slovník

Physical AI — když agent sahá do světa

Physical AI spojuje modely, roboty, simulace a akce v reálném prostředí. Nejde o hezké demo robota, ale o otázku, kdo nese riziko, když model začne hýbat věcmi.

Slovník

Prompt injection — cizí instrukce v tvém kontextu

Prompt injection není jailbreak pro frajeřinu. Je to problém hranic: model čte nedůvěryhodný text a může ho splést s instrukcemi. Průvodce obranou pro každého, kdo dává LLM nástroje.

Slovník

Tool use — když model volá nástroje

Tool use je chvíle, kdy LLM přestane jen odpovídat a začne volat API, spouštět příkazy, číst soubory nebo sahat do databází. Užitečné, ostré, nebezpečné.