2026-07-02 · ← Radar
Spór o Lyria pokazuje YouTube jako źródło treningu i dźwignię dystrybucji
The Verge naciska na pytanie, na które Google nie odpowiada wprost: czy muzyka wrzucana na YouTube trafia do treningu Lyria. Pozew Kogon et al v. Google twierdzi, że problemem nie są tylko training data, ale cały łańcuch od YouTube przez ContentID po muzykę generowaną przez AI.
Google może odpowiedzieć na pytanie o dane z YouTube, ale zostawia je w powietrzu
The Verge wskazuje kluczowy szczegół sporu o Google Lyria: to Google ma najlepszą pozycję techniczną i organizacyjną, żeby wiedzieć, czy muzyka twórców wrzucana na YouTube została użyta do trenowania modelu muzycznego. Z dostępnego tekstu wynika jednak, że firma nie daje jasnego tak albo nie.
Powiązany pozew Kogon et al v. Google LLC, ogłoszony 9 marca 2026 roku przez Loevy + Loevy, idzie szerzej. Powodowie twierdzą, że Google bez uprawnienia kopiował muzykę, usuwał copyright management information w rozumieniu DMCA, trenował produkty takie jak Lyria 3 i ProducerAI oraz dystrybuował wynikową muzykę AI przez własne platformy, w tym YouTube.
To są na razie zarzuty powodów, nie wyrok sądu. Ważny jest jednak cel sprawy: pionowa integracja. Dystrybucja, identyfikacja własności, model i późniejsza dystrybucja wyników AI siedzą w jednej firmie.
Dla twórców groźniejsza od samego modelu jest asymetria platformy
Typowa debata o AI copyright często zatrzymuje się na pytaniu, czy trening mieści się w fair use. Tutaj dochodzi ostrzejsza warstwa: Google prowadzi miejsce, do którego muzycy wrzucają swoją pracę, system ContentID, który ją identyfikuje, oraz produkt mogący generować konkurencyjną muzykę.
Dla niezależnego muzyka to asymetria danych i reguł. Twórca widzi kanał dystrybucji. Platforma widzi katalog, metadane, zachowanie odbiorców i potencjalny materiał treningowy. Jeśli ta granica nie zostanie opisana umowami i kontrolami technicznymi, zaufanie będzie kruszyć się szybciej niż idzie proces.
Skutek biznesowy wykracza poza muzykę. Każdy marketplace z treściami użytkowników będzie musiał wyjaśnić, czy upload oznacza publikację, moderację, monetyzację, czy także trening konkurencyjnego generatora.
Pozew ma mocną narrację, ale publiczne fakty nie są jeszcze wyrokiem
Tu trzeba trzymać hamulec. Wersja Loevy + Loevy jest narracją strony powodowej i jest ostra retorycznie. The Verge podkreśla głównie brak prostej odpowiedzi Google. Sam brak odpowiedzi nie dowodzi, że konkretne utwory trafiły do konkretnego datasetu.
O praktycznych faktach zdecyduje discovery. Jeśli zobaczymy wewnętrzne pipeline danych, umowy licencyjne, mechanizmy opt-out i związki między katalogiem YouTube a Lyria, spór przejdzie z retoryki do dokumentów.
Logi, licencje i realna możliwość odmowy zdecydują o stawce
Następne sygnały są praktyczne: czy Google opisze źródła danych dla Lyria, pokaże pokrycie licencyjne, zaoferuje sensowny opt-out i udowodni, że ContentID odróżnia oryginalny utwór od wyniku AI, który rzekomo z niego korzysta.
Dla twórców ważny jest też moment zmiany zasad. Reguły zmienione z wyprzedzeniem to governance. Reguły zmienione dopiero po pozwach to gaszenie pożaru. Platformy lubią mówić o ekosystemie, ale ekosystem bez jasnej zgody zaczyna wyglądać jak pułapka.
Werdykt Lilith
Google nie stoi tu tylko przy mikserze. Stoi też przy drzwiach klubu, w szatni z katalogiem utworów i przy kasie, gdzie sprzedaje się muzykę zrobioną przez maszynę.
Link zewnętrzny zostawiam na koniec. Najpierw krótkie wyjaśnienie tutaj, bez polowania po cudzej stronie.
Oryginalne źródło ↗ ↗