Seorang pembuat konten YouTube ingin mengajukan gugatan terhadap OpenAI, dengan tuduhan bahwa perusahaan tersebut melatih model AI-nya pada satu juta video YouTube tanpa memberi tahu – atau memberikan kompensasi – kepada pemilik video.
Dalam pengaduan yang diajukan Jumat lalu di Pengadilan Distrik AS untuk Distrik Utara California, pengacara David Millette, seorang pengguna YouTube di Massachusetts, mengklaim bahwa OpenAI diam-diam merekam video Millette dan pengembang lain untuk melatih model yang mendukung AI perusahaan. -Chatbot didukung oleh platform, ChatGPT, serta alat dan fitur AI lainnya. Dengan mengumpulkan informasi ini, OpenAI “mendapat keuntungan besar” dari karya pembuatnya, kata pengaduan tersebut, sekaligus melanggar undang-undang hak cipta dan peraturan YouTube yang melarang penggunaan video dalam program yang independen dari karyanya.
“Ketika produk AI (OpenAI) menjadi lebih canggih dengan menggunakan kumpulan data pelatihan, produk tersebut menjadi lebih berharga bagi calon pengguna dan pengguna saat ini, yang membeli langganan untuk mengakses produk AI (OpenAI),” demikian bunyi keluhan tersebut. Namun, sebagian besar materi pengajaran OpenAI didasarkan pada karya yang disalin oleh OpenAI tanpa izin, tanpa kredit, dan tanpa kompensasi.
Millette, yang diwakili oleh firma hukum Bursor and Fisher, mengupayakan persidangan juri dan ganti rugi lebih dari $5 juta untuk semua pengguna YouTube yang datanya diambil dalam studi OpenAI.
Model AI generatif seperti OpenAI tidak memiliki kecerdasan nyata. Dalam banyak contoh (seperti film, rekaman audio, dokumen, dll.), model “mengetahui” bagaimana data dapat diproses berdasarkan proses tersebut, termasuk apa yang ada di dekatnya.
Banyak model dilatih berdasarkan data dari situs publik dan data online. Perusahaan berpendapat bahwa penggunaan wajar melindungi upaya mereka untuk menghancurkan data tanpa pandang bulu dan menggunakannya untuk tujuan pemasaran. Namun banyak pemegang hak cipta tidak setuju – dan mengajukan tuntutan hukum untuk menghentikan praktik tersebut.
Videografi telah menjadi bagian penting dalam pengajaran ketika sumber daya lain mulai mengering.
Lebih dari 35% dari 1.000 situs web teratas di dunia kini telah memblokir crawler OpenAI, menurut data dari Originality.AI. Dan sekitar 25% data dari sumber “berkualitas tinggi” telah disembunyikan dari kumpulan data besar yang digunakan untuk melatih model AI, berdasarkan studi yang dilakukan oleh Data Provenance Initiative MIT. Jika tren pemblokiran saat ini terus berlanjut, kelompok riset Epoch AI memperkirakan bahwa pengembang akan kehabisan data untuk melatih kecerdasan buatan antara tahun 2026 dan 2032.
Pada bulan April, New York Times melaporkan bahwa OpenAI mengembangkan model pengenalan suara pertamanya, Whisper, dengan tujuan mengekstraksi informasi dari video untuk pembelajaran. Tim OpenAI, termasuk presiden perusahaan, Greg Brockman, merekam lebih dari satu juta video dari YouTube menggunakan Whisper, menurut The Times, dan menggunakan rekaman tersebut untuk melatih model pembuatan dan analisis teks GPT-4 OpenAI.
Staf OpenAI membahas bagaimana langkah tersebut dapat melanggar peraturan YouTube, menurut The Times.
Pada bulan Juli, News News melaporkan bahwa perusahaan termasuk Anthropic, Apple, Salesforce, dan Nvidia menggunakan kumpulan data yang disebut The Pile, yang berisi teks dari ratusan ribu video YouTube, untuk melatih model kecerdasan buatan. Sebagian besar pembuat konten YouTube yang sub-judulnya telah dimasukkan ke dalam Pile tidak mengetahui dan tidak menerima fakta ini; Apple kemudian mengeluarkan pernyataan yang mengatakan mereka tidak bermaksud menggunakan model ini untuk memasukkan kemampuan AI apa pun ke dalam produknya.
Google, perusahaan induk YouTube, juga ingin menggunakan teks untuk melatih modelnya.
Tahun lalu, Google memperluas kebijakan privasi (ToS) untuk memungkinkan perusahaan menggunakan data pengguna untuk pelatihan AI. Berdasarkan ToS yang lama, tidak jelas apakah Google dapat menggunakan data YouTube untuk membuat konten di luar platform video. Tidak demikian halnya dengan kata baru, yang banyak menghilangkan bekas luka.
Kami telah menghubungi OpenAI dan Google untuk memberikan komentar mengenai gugatan kelompok ini dan akan memperbarui bagian ini jika mereka merespons.
Ini merupakan awal yang sulit untuk bulan OpenAI.
Eksekutif Tesla dan X Elon Musk pada hari Senin mengajukan gugatan baru terhadap OpenAI dengan CEO Sam Altman menuduh perusahaan tersebut meninggalkan misi awalnya yang tidak menguntungkan dengan mencadangkan beberapa teknologi tercanggihnya untuk pelanggan komersial. Musk membuat klaim yang sama dalam gugatannya pada bulan Februari terhadap OpenAI, tetapi gugatan baru tersebut menuduh bahwa OpenAI juga terlibat dalam penipuan.