Model video AI baru Google tidak terlalu buruk dalam bidang fisika

TEKNOLOGI17 Dilihat

Infomalangraya.com –

Google mungkin baru saja mulai meluncurkan AI generatif Veo kepada pelanggan perusahaan, namun perusahaan tersebut tidak membuang waktu untuk meluncurkan versi baru alat video tersebut kepada penguji awal. Pada hari Senin, Google mengumumkan pratinjau Veo 2. Menurut perusahaan, Veo 2 “memahami bahasa sinematografi.” Dalam praktiknya, hal ini berarti Anda dapat mereferensikan genre film, efek sinematik, atau lensa tertentu saat meminta model.

Selain itu, Google mengatakan model baru ini memiliki pemahaman yang lebih baik tentang fisika dunia nyata dan pergerakan manusia. Memodelkan manusia yang sedang bergerak dengan benar adalah sesuatu yang sulit dilakukan oleh semua model generatif. Jadi klaim perusahaan bahwa Veo 2 lebih baik dalam kedua masalah tersebut adalah penting. Tentu saja, sampel yang diberikan perusahaan tidak cukup untuk mengetahui secara pasti; ujian sebenarnya dari kemampuan Veo 2 akan datang ketika seseorang memintanya untuk membuat video rutinitas pesenam. Oh, dan berbicara tentang masalah yang dihadapi model video, Google mengatakan Veo akan “lebih jarang” memproduksi artefak seperti jari tambahan.

Contoh gambar tupai Imagen 3 Google dihasilkan.

Google

Secara terpisah, Google meluncurkan perbaikan pada Imagen 3. Dari model text-to-image, perusahaan mengatakan versi terbaru menghasilkan gambar yang lebih cerah dan komposisi yang lebih baik. Selain itu, ini dapat menampilkan gaya seni yang lebih beragam dengan akurasi yang lebih tinggi. Pada saat yang sama, lebih baik juga mengikuti petunjuk dengan lebih setia. Kepatuhan yang cepat adalah masalah yang saya soroti ketika perusahaan menyediakan Imagen 3 untuk pelanggan Google Cloud awal bulan ini, jadi Google menyadari area di mana model AI-nya perlu dikerjakan.

Veo 2 secara bertahap akan diluncurkan ke pengguna Google Labs di AS. Untuk saat ini, Google akan membatasi penguji untuk menghasilkan rekaman hingga delapan detik pada resolusi 720p. Untuk konteksnya, Sora dapat menghasilkan rekaman 1080p hingga 20 detik, meskipun hal itu memerlukan langganan ChatGPT Pro sebesar $200 per bulan. Adapun penyempurnaan terbaru pada Imagen 3 tersedia untuk pengguna Google Labs di lebih dari 100 negara melalui ImageFX.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *