Infomalangraya.com –
OpenAI dan Google melatih model AI mereka pada teks yang ditranskripsi dari video YouTube, yang menurutnya berpotensi melanggar hak cipta pembuatnya . Laporan tersebut, yang menjelaskan sejauh mana OpenAI, Google, dan Meta telah berupaya memaksimalkan jumlah data yang dapat mereka berikan ke AI mereka, mengutip banyak orang yang memiliki pengetahuan tentang praktik perusahaan tersebut. Itu terjadi hanya beberapa hari setelah CEO YouTube Neal Mohan mengatakannya dalam sebuah wawancara bahwa dugaan penggunaan video YouTube oleh OpenAI untuk melatih generator teks-ke-video barunya, Sora, .
Menurut SEKARANGOpenAI menggunakan alat pengenalan ucapan Whisper untuk menyalin lebih dari satu juta jam video YouTube, yang kemudian digunakan untuk melatih GPT-4. sebelumnya melaporkan bahwa OpenAI telah menggunakan video dan podcast YouTube untuk melatih kedua sistem AI tersebut. Presiden OpenAI Greg Brockman dilaporkan termasuk di antara orang-orang di tim ini. Sesuai aturan Google, “pengambilan atau pengunduhan konten YouTube secara tidak sah” tidak diperbolehkan, kata Matt Bryant, juru bicara Google. SEKARANGjuga mengatakan bahwa perusahaan tidak mengetahui adanya penggunaan OpenAI.
Namun laporan tersebut mengklaim ada orang-orang di Google yang mengetahui tetapi tidak mengambil tindakan terhadap OpenAI karena Google menggunakan video YouTube untuk melatih model AI-nya sendiri. Google memberi tahu SEKARANG ini hanya dilakukan pada video dari pembuat konten yang telah setuju untuk mengambil bagian dalam program eksperimental. Engadget telah menghubungi Google dan OpenAI untuk memberikan komentar.
Itu SEKARANG Laporan tersebut juga mengklaim bahwa Google mengubah kebijakan privasinya pada bulan Juni 2022 untuk mencakup penggunaan konten yang tersedia untuk umum secara lebih luas, termasuk Google Dokumen dan Google Spreadsheet, untuk melatih model dan produk AI-nya. kata Bryant SEKARANG bahwa hal ini hanya dilakukan dengan izin dari pengguna yang ikut serta dalam fitur eksperimental Google, dan bahwa perusahaan “tidak memulai pelatihan tentang jenis data tambahan berdasarkan perubahan bahasa ini”.