Lilith Lilith.
CS EN PL
Zacznij

Simon Willison opisał prosty sposób ustawienia własnej ceny modelu w AgentsView, gdy nowy model nie znajduje się jeszcze w bazie cen narzędzia. W tym przypadku chodziło o Claude Fable 5, który według jego wpisu pojawił się tego samego dnia.

AgentsView zamienia tokeny w rachunek za konkretny projekt

AgentsView to Python toolkit Wesa McKinneya do analizy transcriptów z coding agents uruchamianych lokalnie. Willison użył go do rozbicia zużycia między projekty i pokazał treemapę, na której jeden projekt odpowiadał za 89,3 % dziennego kosztu.

Na zrzucie widać 55,9 miliona cache read tokenów, 769,3 tysiąca cache write tokenów, 64,4 tysiąca uncached input tokenów i 300,9 tysiąca output tokenów. AgentsView oszacował też, że cache oszczędził 516,62 dolara wobec pracy bez cache.

Zespoły potrzebują cost attribution bardziej niż kolejnego chat UI

Sednem nie jest sama sztuczka z cennikiem. Ważne jest to, że coding agents wchodzą w tryb, w którym źle ograniczony workflow może spalić dziesiątki dolarów, zanim ktokolwiek to zauważy.

Dla engineering leadów to nowy rodzaj observability. Nie wystarczy wiedzieć, który model jest mocniejszy. Trzeba wiedzieć, który projekt, agent i session wygenerowały rachunek oraz czy wynik był go wart.

Cena modelu i cena wyniku to dwie różne liczby

Ręczne wpisanie ceny rozwiązuje tylko jedną warstwę problemu. Realny koszt zależy od cache, retry loops, rozmiaru kontekstu, długości session i od tego, czy agent faktycznie wykonał użyteczną pracę.

AgentsView nie jest finansową prawdą z góry. To warstwa pomiaru. Bez niej zespoły oceniają, czy agent jest tani albo drogi, dopiero po fakturze.

Cost attribution przy każdym branchu zmienia wybór modelu z ideologii w operacje

Kolejnym sygnałem będzie wejście takiej cost attribution do codziennego workflow programistów. Nie jako miesięczny raport dla finansów, ale jako feedback przy branchu, zadaniu albo uruchomieniu agenta.

Gdy zespoły zaczną mierzyć koszt agenta na merged change, wybór modelu stanie się mniej ideologiczny i bardziej operacyjny.

Werdykt Lilith

Najciekawsze w tym TIL nie jest custom price. To obraz programisty, który obok diffu wreszcie widzi paragon za agenta, który ten diff wyprodukował.

Link zewnętrzny zostawiam na koniec. Najpierw krótkie wyjaśnienie tutaj, bez polowania po cudzej stronie.

Oryginalne źródło ↗