← Biblioteka · foundations
Tool use - kiedy model wywołuje narzędzia
Tool use to moment, kiedy LLM przestaje tylko odpowiadać i zaczyna wywoływać API, uruchamiać komendy, czytać pliki albo dotykać baz danych. Użyteczne, ostre i niebezpieczne.
Co to jest
Tool use oznacza, że model nie dostaje tylko promptu i nie zwraca tylko tekstu. Dostaje listę narzędzi, ich schematy i reguły użycia. Potem decyduje, kiedy wywołać wyszukiwarkę, shell, bazę danych, e-mail, kalendarz, wewnętrzne API albo funkcję aplikacji.
To moment, w którym LLM przestaje być sprytną warstwą tekstową i staje się częścią systemu. I dokładnie tam zaczynają się liczyć uprawnienia, granice i sprzątanie po błędach.
Jak to działa
Typowa pętla wygląda prosto:
- Użytkownik podaje cel.
- Model wybiera narzędzie i przygotowuje strukturalne argumenty.
- Aplikacja uruchamia narzędzie poza modelem.
- Wynik wraca do kontekstu.
- Model kontynuuje, poprawia plan albo odpowiada.
Nowsze modele potrafią przeplatać narzędzia z reasoningiem. Najpierw coś sprawdzają, potem zmieniają plan, potem sięgają do kolejnego źródła. Mocne. I dokładnie tam złe narzędzie, zbyt szerokie uprawnienia albo prompt injection podpalają dywan.
Kiedy to ma sens
Tool use ma sens, gdy model potrzebuje aktualnych danych, dokładnych obliczeń, dostępu do wewnętrznych systemów albo działania poza czatem. Typowo: RAG, coding agent, CRM, kalendarz, raporty, administracja serwera.
Nie warto wciskać narzędzi wszędzie. Jeśli odpowiedź wystarczy z kontekstu, narzędzie jest tylko kolejnym punktem awarii.
Częste błędy
- Narzędzia bez schematów. Model zgaduje argumenty, a aplikacja udaje zdziwienie.
- Zbyt szerokie uprawnienia. Agent nie potrzebuje produkcyjnej bazy tylko dlatego, że zna SQL.
- Brak approvali. Usuwanie, płatności, e-maile i deploye nie powinny być cichą misją poboczną.
- Brak audit logu. Kiedy agent coś zepsuje, chcesz wiedzieć co, kiedy i dlaczego wywołał.
- Tool use jako teatr. Wywoływanie narzędzi tylko po to, by produkt wyglądał agentowo, to droga dekoracja.
Co zapamiętać
Tool use to granica między odpowiedzią a działaniem. Gdy model wywołuje narzędzia, jakość tekstu już nie wystarcza. Liczą się uprawnienia, bezpieczeństwo, audit, odzyskiwanie po błędach i koszt każdego kliknięcia.