Tool use - kiedy model wywołuje narzędzia

Tool use to moment, kiedy LLM przestaje tylko odpowiadać i zaczyna wywoływać API, uruchamiać komendy, czytać pliki albo dotykać baz danych. Użyteczne, ostre i niebezpieczne.

#agents #tool-use #api #workflows

Co to jest

Tool use oznacza, że model nie dostaje tylko promptu i nie zwraca tylko tekstu. Dostaje listę narzędzi, ich schematy i reguły użycia. Potem decyduje, kiedy wywołać wyszukiwarkę, shell, bazę danych, e-mail, kalendarz, wewnętrzne API albo funkcję aplikacji.

To moment, w którym LLM przestaje być sprytną warstwą tekstową i staje się częścią systemu. I dokładnie tam zaczynają się liczyć uprawnienia, granice i sprzątanie po błędach.

Jak to działa

Typowa pętla wygląda prosto:

Użytkownik podaje cel.
Model wybiera narzędzie i przygotowuje strukturalne argumenty.
Aplikacja uruchamia narzędzie poza modelem.
Wynik wraca do kontekstu.
Model kontynuuje, poprawia plan albo odpowiada.

Nowsze modele potrafią przeplatać narzędzia z reasoningiem. Najpierw coś sprawdzają, potem zmieniają plan, potem sięgają do kolejnego źródła. Mocne. I dokładnie tam złe narzędzie, zbyt szerokie uprawnienia albo prompt injection podpalają dywan.

Kiedy to ma sens

Tool use ma sens, gdy model potrzebuje aktualnych danych, dokładnych obliczeń, dostępu do wewnętrznych systemów albo działania poza czatem. Typowo: RAG, coding agent, CRM, kalendarz, raporty, administracja serwera.

Nie warto wciskać narzędzi wszędzie. Jeśli odpowiedź wystarczy z kontekstu, narzędzie jest tylko kolejnym punktem awarii.

Częste błędy

Narzędzia bez schematów. Model zgaduje argumenty, a aplikacja udaje zdziwienie.
Zbyt szerokie uprawnienia. Agent nie potrzebuje produkcyjnej bazy tylko dlatego, że zna SQL.
Brak approvali. Usuwanie, płatności, e-maile i deploye nie powinny być cichą misją poboczną.
Brak audit logu. Kiedy agent coś zepsuje, chcesz wiedzieć co, kiedy i dlaczego wywołał.
Tool use jako teatr. Wywoływanie narzędzi tylko po to, by produkt wyglądał agentowo, to droga dekoracja.

Co zapamiętać

Tool use to granica między odpowiedzią a działaniem. Gdy model wywołuje narzędzia, jakość tekstu już nie wystarcza. Liczą się uprawnienia, bezpieczeństwo, audit, odzyskiwanie po błędach i koszt każdego kliknięcia.