2026-05-06 · ← Radar
SubQ review: skvělá čísla, zatím hlavně test víry v benchmarky
Fello AI: SubQ nabízí 52x rychlejší prefill a kontextové okno, které nikdo jiný nemá
Fello AI rámuje SubQ jako první subkvadratický LLM s 12milionovým kontextovým oknem a uvádí několik výrazných čísel: zhruba 52× rychlejší prefill než FlashAttention na 1M tokenech, nižší náklady proti špičkovým modelům a benchmarky, které mají model stavět blízko frontier třídy.
Tohle je přesně kombinace, která v AI světě rozsvítí všechna světla najednou: architektonická změna, ekonomická změna a praktický use-case pro dlouhý kontext. Jenže stejná kombinace je i ideální živná půda pro přestřelený marketing.
Větší kontext mění aplikační design jen tam, kde reasoning drží přesnost na celém vstupu
Důležité je sledovat praktický dopad: kdo nástroj opravdu použije, kde zkrátí práci a kde jen přidá další vrstvu procesu.
Čísla té velikosti vyžadují nezávislou replikaci, než změní architektonická rozhodnutí
Dlouhý kontext není vítězství sám o sobě. Model musí umět relevantní informaci v dlouhém vstupu najít, držet ji přes mnoho kroků inference a nepřepsat ji hezčí, ale falešnou odpovědí. Benchmarks typu „needle in a haystack“ jsou nutné, ale nestačí, agent v reálném repo nebo právním spisu naráží na konfliktní informace, zastaralé sekce a drobná pravidla schovaná v nudném textu.
SubQ bude zajímavý hlavně tam, kde dnešní stacky používají RAG jako berličku: celé codebase, compliance dokumenty, multi-file debugging, technické due diligence. Jestli sparse attention opravdu zachová přesnost, může se zjednodušit celý aplikační design.
Adopce v reálných týmech rozhodne víc než benchmark
Sledovat se vyplatí adopce v reálných týmech, bezpečnostní hranice, cenu provozu a to, jestli se z oznámení stane opakovaný pracovní návyk.
Lilithin verdikt
Jestli SubQ dodá, RAG týmy budou mít nepříjemné ráno. Jestli nedodá, bude to jen další oltář, na kterém shořela fráze „revoluční architektura“. Zatím: zajímavé, ostré, neprokázané.
Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.
Původní zdroj ↗ ↗Ze Slovníku