Kontrowersje wokół OpenAI dotyczące łamania praw autorskich nie ustają. Ostatnio pozew przeciwko fundacji wysunął New York Times (NYT). Ta sprawa rzuca światło na złożone i często niejasne kwestie dotyczące wykorzystywania materiałów publicznych w treningu modeli AI, jak GPT-4.
Oskarżenia New York Times i odpowiedź OpenAI na zarzuty
NYT oskarża OpenAI oraz Microsoft o wykorzystanie milionów artykułów bez licencji do szkolenia swoich modeli AI. OpenAI odpiera te oskarżenia, twierdząc, że trening modeli AI z użyciem publicznie dostępnych materiałów internetowych jest praktyką legalną i stanowi dozwolony użytek.
Ponadto, OpenAI podkreśla, że duże modele AI uczą się z “ogromnej sumy ludzkiej wiedzy”, a każdy treningowy materiał stanowi tylko “nikłą” część wpływającą na wydajność modelu. W opinii OpenAI, artykuły New York Times nie są znaczące dla szkolenia modeli AI, takich jak GPT-4.
NYT twierdzi, że jego treści były celowo przeważone w materiałach szkoleniowych, aby poprawić jakość generacji tekstu. OpenAI broni się, stwierdzając, że przykłady cytowane w oskarżeniu zawierają artykuły sprzed kilku lat, które można znaleźć na różnych stronach internetowych. Dodatkowo, OpenAI twierdzi, że NYT manipulowało promptami, aby celowo wywołać zapamiętywanie treści.
Współpraca OpenAI z agencjami prasowymi ws. praw autorskich
OpenAI podkreśla swoje wysiłki na rzecz wspierania organizacji informacyjnych, wskazując na partnerstwa z Associated Press, Axel Springer, American Journalism Project i NYU. Te współprace mają na celu wspieranie reporterów i redaktorów, szkolenie modeli AI z historycznych treści oraz wyświetlanie treści w czasie rzeczywistym za pomocą źródeł w ChatGPT.
OpenAI wraz z innymi gigantami technologicznymi, takimi jak Google i Apple, znajduje się w rozmowach z licznymi wydawcami na temat wykorzystania treści do wyświetlania w czasie rzeczywistym i szkolenia AI.
Wysiłki OpenAI na rzecz etycznych i legalnych działań modelu LLM
OpenAI akcentuje swoje zaangażowanie w społeczną odpowiedzialność, wprowadzając funkcję opt-out dla wydawców. Ta inicjatywa umożliwia im ograniczenie dostępu narzędzi OpenAI do ich zasobów internetowych. Działanie to, według firmy, odzwierciedla ich dążenie do etycznego postępowania, stawiając dobro społeczne ponad własne prawa.
W kontekście sporu prawnego z New York Times, OpenAI odnosi się do incydentów, gdzie ich modele lingwistyczne nieumyślnie reprodukowały treści. Firma uznaje te zdarzenia za nieliczne anomalie w procesie uczenia maszynowego, które są intensywnie korygowane. OpenAI informuje, że w najnowszych modelach zauważalny jest znaczący postęp w eliminacji tego rodzaju problemów.
OpenAI podkreśla, że świadome wywoływanie tych błędów jest uznawane za naruszenie ich zasad użytkowania. Stanowisko to było wcześniej komunikowane przez Toma Rubina, odpowiedzialnego w OpenAI za prawo własności intelektualnej i zarządzanie treściami.
Nie tylko media atakują dostawców rozwiązań opartych na AI
Konfrontacja prawna z OpenAI nie ogranicza się wyłącznie do wydawców. Autorzy, programiści oraz artyści również dołączają do fali pozwów przeciwko firmom dostarczającym generatywne AI. Podstawą ich zarzutów jest wykorzystanie ich dzieł bez wyraźnej zgody, co budzi obawy o możliwość zastępowania ich pracy przez modele AI w przyszłości. Ta sytuacja podnosi kwestię etyki i odpowiedzialności w rozwoju technologii sztucznej inteligencji, zmuszając branżę do przemyślenia praktyk w zakresie wykorzystania twórczości ludzkiej.
Stanowisko OpenAI i Nadzieja na Przyszłą Współpracę
OpenAI, w odpowiedzi na te wyzwania, podkreśla, że ich model, ChatGPT, nie jest zaprojektowany jako zamiennik usług świadczonych przez New York Times czy inne organizacje medialne. Firma wyraża nadzieję na kontynuację owocnej współpracy i podkreśla, że jej celem jest wspieranie, a nie zastępowanie ludzkiej pracy w mediach. To oświadczenie sygnalizuje chęć OpenAI do dialogu i poszukiwania wspólnych rozwiązań, które będą korzystne zarówno dla twórców, jak i przemysłu AI.
Źródło: The-decoder
Photo by Saúl Bucio on Unsplash