OpenAI wytrenował swój najlepszy model AI na milionach godzin z YouTube. Serwis nie jest zachwycony
OpenAI osiągnęło kolejny kamień milowy, trenując swój najnowszy model GPT-4 na ponad milionie godzin transkrypcji wideo z YouTube.
Ten przełomowy krok wywołał kontrowersje, gdyż narusza warunki użytkowania platformy, co podkreślił rzecznik Google, Matt Bryant w ostrzeżeniu skierowanym do OpenAI - „nieautoryzowane pobieranie treści z YouTube jest zabronione”.
Według doniesień The New York Times, OpenAI wykorzystało dane z YouTube do szkolenia swojego zaawansowanego modelu AI, co może stanowić naruszenie praw autorskich. Co ciekawe, samo Google, właściciel YouTube, również używał transkryptów audio i wideo do trenowania swoich modeli AI, co jest jasnym naruszeniem warunków użytkowania YouTube.
Dodatkowo New York Times (NYT) złożyło pozew przeciwko OpenAI i Microsoft za naruszenie praw autorskich, twierdząc, że firmy te wykorzystały treści z ich gazety bez pozwolenia.
OpenAI pozostaje powściągliwe w informowaniu opinii publicznej o źródłach danych do szkolenia swoich imponujących modeli AI. Problem prawny jest wielowymiarowy, obejmując kwestie naruszenia praw autorskich i tzw. „fair use”, które są słynnym szarym obszarem w prawie amerykańskim.