Alat AI Microsoft dapat mengubah foto menjadi video realistis dari orang-orang yang berbicara dan bernyanyi

Infomalangraya.com –

Microsoft Research Asia telah meluncurkan alat AI eksperimental baru yang disebut VASA-1 yang dapat mengambil gambar diam seseorang — atau gambar seseorang — dan file audio yang sudah ada untuk membuat wajah berbicara yang nyata dari gambar tersebut secara real-time. Ia mempunyai kemampuan untuk menghasilkan ekspresi wajah dan gerakan kepala untuk gambar diam yang ada dan gerakan bibir yang sesuai untuk disesuaikan dengan pidato atau lagu. Para peneliti mengunggah banyak sekali contoh di halaman proyek, dan hasilnya terlihat cukup bagus sehingga bisa membodohi orang dengan berpikir bahwa contoh tersebut nyata.

Meskipun gerakan bibir dan kepala dalam contoh masih terlihat seperti robot dan tidak sinkron setelah diperiksa lebih dekat, masih jelas bahwa teknologi tersebut dapat disalahgunakan untuk membuat video deepfake orang sungguhan dengan mudah dan cepat. Para peneliti sendiri menyadari potensi tersebut dan telah memutuskan untuk tidak merilis “demo online, API, produk, rincian implementasi tambahan, atau penawaran terkait” sampai mereka yakin bahwa teknologi mereka “akan digunakan secara bertanggung jawab dan sesuai dengan peraturan yang berlaku.” peraturan.” Namun mereka tidak mengatakan apakah mereka berencana menerapkan pengamanan tertentu untuk mencegah pelaku kejahatan menggunakannya untuk tujuan jahat, seperti membuat kampanye pornografi palsu atau misinformasi.

Para peneliti yakin teknologi mereka memiliki banyak manfaat meski berpotensi disalahgunakan. Mereka mengatakan hal ini dapat digunakan untuk meningkatkan kesetaraan pendidikan, serta meningkatkan aksesibilitas bagi mereka yang memiliki tantangan komunikasi, mungkin dengan memberi mereka akses ke avatar yang dapat berkomunikasi untuk mereka. Alat ini juga dapat memberikan pendampingan dan dukungan terapeutik bagi mereka yang membutuhkannya, kata mereka, seraya menyindir bahwa VASA-1 dapat digunakan dalam program yang menawarkan akses terhadap karakter AI yang dapat diajak bicara oleh manusia.

Menurut makalah yang diterbitkan bersama pengumuman tersebut, VASA-1 dilatih pada Kumpulan Data VoxCeleb2, yang berisi “lebih dari 1 juta ucapan untuk 6.112 selebriti” yang diambil dari video YouTube. Meskipun alat ini dilatih pada wajah asli, alat ini juga berfungsi pada foto artistik seperti Mona Lisa, yang secara lucu digabungkan oleh para peneliti dengan file audio dari lagu Lil Wayne yang dibawakan oleh Anne Hathaway yang sedang viral. Paparazi. Sangat menyenangkan, layak untuk ditonton, bahkan jika Anda ragu akan manfaat teknologi seperti ini.

Artikel ini berisi link afiliasi; jika Anda mengeklik tautan tersebut dan melakukan pembelian, kami dapat memperoleh komisi.

Jumlah Pembaca: 108