Meta, technologiczny gigant kierowany przez Marka Zuckerberga, znalazła się w centrum kontrowersji dotyczącej naruszenia praw autorskich. Jak ujawniono w dokumentach sądowych, Zuckerberg miał zatwierdzić wykorzystanie zbioru danych z pirackimi książkami i artykułami do szkolenia modeli sztucznej inteligencji Llama.
Sprawa Kadrey kontra Meta: Nowe fakty na jawie
Pozew Kadrey przeciwko Meta to jedna z wielu spraw sądowych przeciwko firmom technologicznym, które rzekomo wykorzystują chronione prawem autorskim treści bez zgody twórców. Meta broni się, powołując się na zasadę dozwolonego użytku (fair use), która pozwala na przetwarzanie treści w celu stworzenia czegoś nowego, o ile jest to wystarczająco transformacyjne. Wielu twórców odrzuca jednak to uzasadnienie.
Elon Musk: wyczerpaliśmy już dane do trenowania sztucznej inteligencji
LibGen jako źródło danych dla Llama AI
Z dokumentów wynika, że Meta wykorzystywała zasoby LibGen — serwisu agregującego linki do pirackich książek i artykułów. LibGen był wielokrotnie pozwany i nakazano mu zamknięcie działalności oraz zapłatę wysokich kar finansowych. Mimo wewnętrznych obaw w Meta, Zuckerberg miał osobiście zatwierdzić wykorzystanie tych danych.
Usuwanie informacji o prawach autorskich
Zarzuty wobec Meta obejmują również świadome usuwanie oznaczeń praw autorskich z wykorzystywanych danych. Inżynier Meta, Nikolay Bashlykov, miał stworzyć skrypt usuwający słowa takie jak “copyright” i “acknowledgments” z e-booków z LibGen. Podobne działania miały miejsce w przypadku artykułów naukowych.
Meta miała również korzystać z torrentów, by pobrać dane z LibGen, co według pozwu jest kolejnym naruszeniem praw autorskich. Torrentowanie wymaga udostępniania pobieranych plików, co mogło przyczynić się do dalszego rozprzestrzeniania nielegalnych treści. Ahmad Al-Dahle, szef generatywnej AI w Meta, miał zignorować obawy dotyczące legalności tego działania.
Przyszłość sprawy i reputacja Meta
Sprawa dotyczy wczesnych wersji modeli Llama, a nie najnowszych wersji. Choć sąd może jeszcze uznać argumentację Meta opartą na dozwolonym użytku, zarzuty poważnie podważają reputację firmy. Sędzia Vince Chhabria odrzucił prośbę Meta o utajnienie dokumentów, uznając, że firma próbuje uniknąć negatywnego rozgłosu.
Sprawa Kadrey przeciwko Meta może mieć daleko idące konsekwencje dla branży AI i kwestii praw autorskich w kontekście trenowania modeli sztucznej inteligencji.
Źródło: TechCrunch