Apple čelí nové hromadné žalobě, která tvrdí, že při tréninku AI modelu využil miliony videí z YouTube. Spor může ovlivnit, jak firmy v budoucnu sbírají data pro generativní AI.
Apple se ocitl pod palbou kvůli tomu, jak měl získat data pro trénink své AI. Nová žaloba tvrdí, že společnost obešla ochrany YouTube a použila miliony videí jako podklad pro modely generující video. Pro uživatele je to důležité hlavně proto, že spor může nastavit pravidla, podle kterých budou velké firmy dál trénovat umělou inteligenci.
Co přesně žaloba Applu vyčítá
Podání je zatím jen návrhem na hromadnou žalobu, ale obvinění je poměrně přímé: Apple měl podle žalobců stáhnout a použít obsah z YouTube navzdory ochranám proti automatizovanému sběru dat. V dokumentu se odkazuje na studii Applu z konce roku 2024, ve které výzkumníci popsali model pro generování videa STIV a dataset Panda-70M.
Právě kolem datasetu se to celé točí. Panda-70M podle žaloby funguje jako mapa nebo index konkrétních videí a klipů na YouTube, včetně URL, identifikátoru a časového razítka. Jedno video se navíc může rozdělit na řadu samostatných klipů, které se pak používají jako oddělené trénovací vzorky. Žalobci tvrdí, že tím Apple fakticky obcházel ochrany YouTube pro každý takový klip zvlášť.
Součástí sporu je i tvrzení, že se v datasetu opakovaně objevuje obsah žalobců, a to ve více než 500 případech. Ti proto žádají, aby soud uznal nejen jejich nárok, ale i nároky všech dalších podobně dotčených lidí. V praxi jde o klasický střet mezi rychlým rozvojem AI a otázkou, odkud přesně firmy berou trénovací data.
Co by to znamenalo pro Apple i ostatní firmy
Pokud by soud žalobcům dal za pravdu, nejde jen o peníze. Apple by mohl čelit zákazu dalšího používání sporných dat, náhradám škody a také širšímu dopadu na způsob, jakým interně vyvíjí své AI nástroje. U generativní AI je totiž kvalita i původ trénovacích dat naprosto zásadní a podobné spory mohou vývoj výrazně zpomalit.
Zajímavé je i to, že žaloba není namířená jen proti Applu. Stejný dataset Panda-70M je podle podání spojený i s dalšími firmami, konkrétně s Amazonem a OpenAI. To naznačuje, že nejde o izolovaný problém jednoho produktu, ale o širší otázku, kterou bude technologický průmysl nejspíš řešit čím dál častěji: co je ještě legální zdroj dat pro AI a kde už začíná obcházení pravidel.
Pro běžné uživatele Apple to má jeden praktický důsledek: i když se spor odehrává v soudní síni, může ovlivnit tempo i podobu budoucích funkcí, které budou na umělé inteligenci stát. Pokud firmy narazí na přísnější pravidla pro sběr dat, může to znamenat pomalejší vývoj, opatrnější modely i větší důraz na licencovaný obsah místo „nasávání“ veřejně dostupných materiálů.
Pokud vás téma zajímá víc, přečtěte si také iPhone 17 Pro poprvé na videu! Apple má problém.
Podrobnosti přinesl také 9to5mac.













