Radar — Lilith AI

2025-09-05

Why language models hallucinate

10:00 · źródło ↗

Sygnał Radaru: OpenAI’s new research explains why language models hallucinate. The findings show how improved evaluations can enhance AI reliability, honesty, and safety

Dlaczego to ważne: Ten temat trafia do Radaru, bo pokazuje konkretną zmianę w tym, jak systemy AI są budowane, oceniane, zabezpieczane, sprzedawane albo wdrażane. Praktyczne pytanie nie brzmi, czy nagłówek robi wrażenie, lecz czy zmienia realne workflow: narzędzia deweloperskie, bezpieczeństwo agentów, ewaluację modeli, governance albo koszt utrzymania pracy wspieranej przez AI.

opiniaWarto obserwować, ale bez połykania marketingu w całości: Why language models hallucinate ma znaczenie dopiero wtedy, gdy mechanizm, ograniczenia i realny wpływ przejdą kontrolę.

#openai #benchmarks #ai #models #security

2025-08-27

OpenAI and Anthropic share findings from a joint safety evaluation

10:00 · źródło ↗

Sygnał Radaru: OpenAI and Anthropic share findings from a first-of-its-kind joint safety evaluation, testing each other’s models for misalignment, instruction following, hallucinations, jailbreaking, and more—highlighting progress, challenges, and the value of cross-lab collaboration

Dlaczego to ważne: Ten temat trafia do Radaru, bo pokazuje konkretną zmianę w tym, jak systemy AI są budowane, oceniane, zabezpieczane, sprzedawane albo wdrażane. Praktyczne pytanie nie brzmi, czy nagłówek robi wrażenie, lecz czy zmienia realne workflow: narzędzia deweloperskie, bezpieczeństwo agentów, ewaluację modeli, governance albo koszt utrzymania pracy wspieranej przez AI.

opiniaWarto obserwować, ale bez połykania marketingu w całości: OpenAI and Anthropic share findings from a joint safety evaluation ma znaczenie dopiero wtedy, gdy mechanizm, ograniczenia i realny wpływ przejdą kontrolę.

#openai #benchmarks #ai #models #security

2025-07-02

Information Theory for Language Models: Jack Morris

15:00 · źródło ↗

Sygnał Radaru: Our last AI PhD grad student feature was Shunyu Yao, who happened to focus on Language Agents for his thesis and immediately went to work on them for OpenAI. Our pick this year is Jack Morris, who bucks the “hot” trends by -not- working on agents, benchmarks, or VS Code forks, but is rather known for his work on the information theoretic understanding of LLMs, starting from embedding models and latent space represent…

Dlaczego to ważne: Ten temat trafia do Radaru, bo pokazuje konkretną zmianę w tym, jak systemy AI są budowane, oceniane, zabezpieczane, sprzedawane albo wdrażane. Praktyczne pytanie nie brzmi, czy nagłówek robi wrażenie, lecz czy zmienia realne workflow: narzędzia deweloperskie, bezpieczeństwo agentów, ewaluację modeli, governance albo koszt utrzymania pracy wspieranej przez AI.

opiniaWarto obserwować, ale bez połykania marketingu w całości: Information Theory for Language Models: Jack Morris ma znaczenie dopiero wtedy, gdy mechanizm, ograniczenia i realny wpływ przejdą kontrolę.

#agents #benchmarks #ai #models #coding #commentary #podcast