Lilith Lilith.
CS EN PL
Zacznij

Z Radaru

Radar · 2026-06-15

Odejście Nathana Lamberta z Ai2 pokazuje kruchą stronę open models

Nathan Lambert ogłosił odejście z Allen Institute for AI i wykorzystał tekst do bilansu pracy przy Olmo. To nie tylko informacja kadrowa, ale przypomnienie, że open models zależą od instytucji, które muszą przetrwać dłużej niż jeden silny zespół.

Czytaj

Radar · 2026-06-15

Holo3.1 przesuwa computer-use agents z chmury na lokalne maszyny

H Company wydała Holo3.1, rodzinę computer-use models dla web, desktop, mobile i local inference. Najważniejsze nie są tylko wyższe wyniki, ale próba przeniesienia agenta bliżej miejsca, w którym naprawdę dzieje się praca.

Czytaj

Radar · 2026-06-15

Małe modele pokazują, że agentic demo stoi na nudnej infrastrukturze

Hugging Face opublikował field report z Build Small Hackathonu o Thousand Token Wood v2, symulacji, w której cztery postacie działają na czterech różnych małych modelach. Kluczowa lekcja dla systemów agentowych: serving, naprawa JSON, firewall tajnych danych i bounded memory znaczą więcej niż poetycki prompt.

Czytaj

Radar · 2026-06-14

DOX: mały trik z AGENTS.md na duży problem kontekstu agentów

Agent Zero opublikował DOX, mały self-documenting framework AGENTS.md, w którym agenci utrzymują hierarchię lokalnych instrukcji przed i po zmianach w kodzie.

Czytaj

Radar · 2026-06-09

Claude Fable 5 zmienia safety w pytanie o dostęp do najlepszego modelu

Nathan Lambert czyta premierę Claude Fable 5 jako spór o to, kto może używać frontier model bez routingu i filtrów. Ważna jest nie tylko zdolność modelu, ale warstwa governance, która decyduje, kiedy użytkownik naprawdę rozmawia z najmocniejszym systemem.

Czytaj

Radar · 2026-06-09

Voice agents psują się na dwujęzycznych rozmowach szybciej niż w dopracowanych demach

ServiceNow AI opublikował benchmark ASR dla code-switched speech w scenariuszach enterprise i przetestował siedem systemów. Niewygodna pointa jest prosta: w voice agents błąd transkrypcji przechodzi przez cały workflow, więc dwujęzyczność nie jest drobnym detalem UX.

Czytaj

Radar · 2026-06-03

Reachy Mini dostaje MCP tools z Hugging Face Spaces

Hugging Face pokazuje, jak Reachy Mini może wywoływać MCP tools hostowane w publicznych Spaces. Najciekawsze nie jest pytanie o pogodę, tylko rozdzielenie ciała robota od zdolności, które da się udostępniać i aktualizować poza aplikacją.

Czytaj

Radar · 2026-06-01

Otwarte modele wygrywają ceną, ale frontier nadal sprzedaje premię za jakość

Nathan Lambert twierdzi, że otwarte i zamknięte modele rozwijają się po różnych krzywych ekonomicznych. Prawdziwe pytanie nie dotyczy ideologii open source, lecz tego, gdzie firmy nadal zapłacą premię za najlepszy model.

Czytaj

Radar · 2026-06-01

NVIDIA Cosmos 3 zamyka physical AI w jednym modelu

NVIDIA udostępniła Cosmos 3 na Hugging Face jako otwarty omni-model do world generation, physical reasoning i action generation.

Czytaj

Radar · 2026-05-26

Interconnects mapuje kolejną fazę konkurencji modeli

Nathan Lambert pisze o Gemini Flash 3.5, Mythos, narzędziach agentowych i napięciu między open i closed models w majowej prognozie.

Czytaj

Radar · 2026-05-11

CodexBar łączy śledzenie limitów 29 narzędzi AI coding w jednej ikonie

CodexBar to open-source owa aplikacja do paska menu macOS, która łączy śledzenie limitów, kredytów, okien resetów i statusu awarii dla 29 providerów AI coding, m.in. Codex, Claude, Cursor, Gemini, Copilot i OpenRouter.

Czytaj

Radar · 2026-04-15

Benchmark VAKRA ujawnia, gdzie agenci naprawdę zawodzą: wybór narzędzi, argumenty, wieloetapowe planowanie

IBM Research opublikował VAKRA: benchmark dla agentów z ponad 8000 realnymi API w 62 domenach. Ocenia pełne trajektorie wykonania, nie tylko końcowe odpowiedzi. Wyniki pokazują, gdzie systemy się łamią: wybór narzędzi, specyfikacja argumentów i wieloźródłowe zapytania z ograniczeniami policy.

Czytaj

Ze Słownika