Cohere posílá 30B coding model do agentických harnessů | Radar

Cohere vydalo North Mini Code, 30B Mixture of Experts model s 3B aktivními parametry pro agentic software engineering. Model je dostupný na Hugging Face pod licencí Apache 2.0 a autoři uvádějí skóre 33,4 v Artificial Analysis Coding Indexu.

North Mini Code míří na coding agenty, ne jen na generování funkcí

Oznámení vyšlo 9. června 2026 na Hugging Face pod Cohere Labs. North Mini Code je první model v nové rodině Cohere zaměřené na developery. K dispozici jsou BF16 a FP8 váhy na Hugging Face, použití přes Cohere API a integrace v OpenCode.

Architektura je decoder only sparse Mixture of Experts model se 128 experty, z nichž se aktivuje 8 na token. Cohere uvádí 30B parametrů a 3B aktivních parametrů. Trénink míří na komplexní software engineering workflow, terminálové agentic tasks a code generation.

Skutečný produktový signál je odolnost mezi nástroji

Cohere netlačí jen jedno číslo na jednom benchmarku. V článku popisuje trénink přes různé scaffolds a harnesses: SWE-Agent, mini-SWE-agent, OpenCode a Terminus 2. To je důležité, protože coding agent není jen model. Je to model zavřený v konkrétním rozhraní s nástroji, logy, chybami a testy.

Druhý SFT stage používá 4,5 miliardy tokenů z agentic a reasoning vzorků. Autoři píší o více než 70 tisících verifiable tasks napříč zhruba 5 tisíci repozitáři a o deduplikaci vůči SWE-Bench a SWE-Bench-Pro. Přidaná harness data měla podle článku dát 10 % gain v OpenCode bez zhoršení na SWE-Agent.

Benchmarky vypadají slušně, ale metodika zůstává vendorův terén

Cohere tvrdí, že North Mini Code překonává několik open source modelů podobné i větší velikosti, včetně Qwen3.5, Gemma 4, Devstral Small 2, Nemotron 3 Super, Mistral Small 4 a Devstral 2. U competitor results ale článek sám říká, že část skóre bere z veřejných reportů a část chybějících výsledků měřil interně.

To není diskvalifikace. Je to důvod číst grafy jako dobrý signál, ne jako uzavřený rozsudek. Nezávislé replikace na stejných harnesses a běžných vývojářských repozitářích budou cennější než další obrázek s modelem nahoře.

Rozhodne adopce v agentických IDE a lokálních firemních stackech

Nejbližší test je praktický: zda North Mini Code obstojí v OpenCode, interních coding agentech a firemních repozitářích, kde se mění build systémy, tajné závislosti a kvalita testů. Apache 2.0 licence mu dává šanci dostat se do lokálních a kontrolovaných nasazení, kam uzavřené modely často nepatří.

Druhý signál bude cena provozu. 3B aktivních parametrů u MoE zní jako rozumný kompromis, ale agentické úlohy pálí kontext, nástroje a opakované pokusy. Efektivita se ukáže až na účtence za skutečné rollouts.

Lilithin verdikt

North Mini Code má největší šanci tam, kde vývojář nechce generátor básní o Pythonu, ale tichého běžce v terminálu, který doběhne testy a nezakopne o vlastní nástroj.