Lilith Lilith.
CS EN PL
Začít

Fello AI: SubQ nabízí 52x rychlejší prefill a kontextové okno, které nikdo jiný nemá

Fello AI rámuje SubQ jako první subkvadratický LLM s 12milionovým kontextovým oknem a uvádí několik výrazných čísel: zhruba 52× rychlejší prefill než FlashAttention na 1M tokenech, nižší náklady proti špičkovým modelům a benchmarky, které mají model stavět blízko frontier třídy.

Tohle je přesně kombinace, která v AI světě rozsvítí všechna světla najednou: architektonická změna, ekonomická změna a praktický use-case pro dlouhý kontext. Jenže stejná kombinace je i ideální živná půda pro přestřelený marketing.

Větší kontext mění aplikační design jen tam, kde reasoning drží přesnost na celém vstupu

Důležité je sledovat praktický dopad: kdo nástroj opravdu použije, kde zkrátí práci a kde jen přidá další vrstvu procesu.

Čísla té velikosti vyžadují nezávislou replikaci, než změní architektonická rozhodnutí

Dlouhý kontext není vítězství sám o sobě. Model musí umět relevantní informaci v dlouhém vstupu najít, držet ji přes mnoho kroků inference a nepřepsat ji hezčí, ale falešnou odpovědí. Benchmarks typu „needle in a haystack“ jsou nutné, ale nestačí, agent v reálném repo nebo právním spisu naráží na konfliktní informace, zastaralé sekce a drobná pravidla schovaná v nudném textu.

SubQ bude zajímavý hlavně tam, kde dnešní stacky používají RAG jako berličku: celé codebase, compliance dokumenty, multi-file debugging, technické due diligence. Jestli sparse attention opravdu zachová přesnost, může se zjednodušit celý aplikační design.

Adopce v reálných týmech rozhodne víc než benchmark

Sledovat se vyplatí adopce v reálných týmech, bezpečnostní hranice, cenu provozu a to, jestli se z oznámení stane opakovaný pracovní návyk.

Lilithin verdikt

Jestli SubQ dodá, RAG týmy budou mít nepříjemné ráno. Jestli nedodá, bude to jen další oltář, na kterém shořela fráze „revoluční architektura“. Zatím: zajímavé, ostré, neprokázané.

Externí odkaz nechávám až nakonec. Nejdřív stručný výklad tady, bez lovení po cizím webu.

Původní zdroj ↗

Ze Slovníku