Postingan Tumblr dan WordPress kabarnya akan digunakan untuk pelatihan OpenAI dan Midjourney

TEKNOLOGI111 Dilihat

Infomalangraya.com –

Tumblr dan WordPress dilaporkan akan mencapai kesepakatan untuk menjual data pengguna ke perusahaan kecerdasan buatan OpenAI dan Midjourney. 404 Media melaporkan bahwa perusahaan induk platform tersebut, Automattic, hampir menyelesaikan perjanjian untuk menyediakan data guna membantu melatih model perusahaan AI.

Tidak jelas data mana yang akan dimasukkan, namun laporan tersebut menunjukkan bahwa Automattic mungkin telah melampaui batas pada awalnya. Dugaan postingan internal dari manajer produk Tumblr, Cyle Gage, menyarankan Automattic bersiap mengirimkan data pribadi atau terkait mitra yang tidak seharusnya disertakan dalam kesepakatan. Konten yang dipertanyakan dilaporkan mencakup postingan pribadi di postingan blog publik, blog yang dihapus atau ditangguhkan, pertanyaan yang tidak terjawab (oleh karena itu, tidak diposting secara publik), jawaban pribadi, postingan yang ditandai sebagai eksplisit, dan konten dari blog mitra premium (seperti situs musik Apple sebelumnya).

Postingan internal menunjukkan bahwa para insinyur Automattic sedang menyiapkan daftar ID postingan yang seharusnya dikecualikan. Tidak jelas apakah data tersebut telah dikirim ke perusahaan AI. Engadget mengirim email ke Automattic untuk meminta komentar atas laporan tersebut, dan kami akan memperbarui artikel ini jika kami mendengarnya kembali.

Perusahaan dilaporkan berencana untuk meluncurkan alat opt-out baru pada hari Rabu yang mengklaim memungkinkan pengguna untuk memblokir pihak ketiga – termasuk perusahaan AI – dari pelatihan data mereka. 404 Media meninjau dugaan FAQ internal Automattic yang disiapkan untuk alat tersebut, yang mencakup jawaban, “Jika Anda memilih untuk tidak ikut serta dari awal, kami akan memblokir perayap mengakses konten Anda dengan menambahkan situs Anda ke daftar yang tidak diizinkan. Jika nanti Anda berubah pikiran, kami juga berencana untuk memberi tahu mitra mana pun tentang orang-orang yang baru memilih untuk tidak ikut serta dan meminta agar konten mereka dihapus dari sumber sebelumnya dan pelatihan di masa mendatang.”

Ungkapan tersebut, yang menggambarkannya sebagai “meminta” perusahaan AI untuk menghapus data, mungkin relevan.

Dugaan dokumen internal dari kepala AI Automattic, Andrew Spittle, menjawab pertanyaan staf tentang jaminan penghapusan data saat menggunakan alat tersebut, menjelaskan, “Kami akan memberi tahu mitra yang ada secara teratur tentang siapa saja yang memilih tidak ikut serta sejak terakhir kali kami menyediakan sebuah daftar. Saya ingin ini menjadi proses berkelanjutan di mana kami secara rutin menganjurkan agar konten lama dikecualikan berdasarkan preferensi saat ini. Kami akan meminta agar konten tersebut dihapus dan dihapus dari pelatihan apa pun yang dijalankan di masa mendatang. Saya yakin mitra akan menghormati hal ini berdasarkan percakapan kami dengan mereka hingga saat ini. Saya tidak berpikir mereka mendapatkan banyak keuntungan secara keseluruhan dengan mempertahankannya.”

Jadi, jika pengguna Tumblr atau WordPress meminta untuk tidak mengikuti pelatihan AI, Automattic diduga akan “meminta” dan “menganjurkan” penghapusannya. Dan bos AI perusahaan tersebut “yakin” bahwa perusahaan AI akan melakukan yang terbaik untuk mematuhinya “berdasarkan percakapan kami.” (Bagaimana dengan kepastiannya!)

Kesepakatan pelatihan data AI telah menjadi peluang yang menguntungkan bagi situs web yang kesulitan dalam lanskap penerbitan online yang licin saat ini. (Staf Tumblr dilaporkan dikurangi menjadi kru kerangka pada akhir tahun 2023.) Minggu lalu, Google membuat kesepakatan dengan Reddit (menjelang IPO yang terakhir) untuk melatih basis pengetahuan platform yang luas tentang konten buatan pengguna. Sementara itu, OpenAI meluncurkan program kemitraan tahun lalu untuk mengumpulkan kumpulan data dari pihak ketiga guna membantu melatih model AI-nya.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *