Meta baru saja mengumumkan model kecerdasan buatannya yang berfokus pada media, yang disebut Movie Gen, yang dapat digunakan untuk menghasilkan klip video dan audio fotorealistik.
Perusahaan membagikan beberapa klip berdurasi 10 detik yang dibuat dengan Movie Gen, termasuk bayi kuda nil mirip Moo Deng yang sedang berenang, untuk menunjukkan kemampuannya. Meskipun alat ini belum tersedia untuk digunakan, pengumuman dari Movie Gen ini muncul tak lama setelah acara Meta Connect, yang memamerkan perangkat keras baru dan diperbarui serta versi terbaru dari model bahasa besarnya, Llama 3.2.
Selain menghasilkan klip teks-ke-film sederhana, model Movie Gen juga dapat melakukan pengeditan yang ditargetkan pada klip yang sudah ada, seperti menambahkan objek ke tangan seseorang atau mengubah tampilan permukaan. Dalam salah satu contoh video Meta, seorang wanita yang memakai headset VR terlihat seperti sedang memakai teropong steampunk.
Movie Gen dapat digunakan untuk menghasilkan klip audio bersama video. Mesin mobil sport mendengkur, ban berdecit saat melaju di trek, dan seekor ular merayap di sepanjang lantai hutan diiringi suara klakson yang menegangkan.
Meta membagikan detail lebih lanjut tentang Movie Gen dalam makalah penelitian yang dirilis Jumat. Movie Gen Video terdiri dari 30 miliar parameter, sedangkan Movie Gen Audio terdiri dari 13 miliar parameter. (Jumlah parameter model kira-kira sesuai dengan kemampuannya; sebagai perbandingan, varian terbesar Llama 3.1 memiliki 405 miliar parameter.) Movie Gen dapat menghasilkan video HD berdurasi hingga 16 detik, dan Meta mengklaim kualitas videonya mengungguli model pesaing secara keseluruhan.
Awal tahun ini, CEO Mark Zuckerberg mendemonstrasikan fitur Imagine Me dari Meta AI, yang memungkinkan pengguna mengunggah foto diri mereka sendiri dan memposting gambar AI diri mereka yang terendam dalam rantai emas dalam beberapa adegan di Threads. Model Movie Gen mengimplementasikan versi video dengan fungsi serupa – anggap saja sebagai ElfYourself yang menggunakan steroid.
Informasi apa saja yang dilatih oleh Movie Gen? Postingan pengumuman Meta tidak menjelaskan secara spesifik: “Kami telah melatih model ini pada kombinasi kumpulan data berlisensi dan tersedia untuk umum.” Dari mana data pelatihan berasal dan data mana yang dianggap adil untuk alat AI generatif, Data dari web tetap menjadi isu kontroversial , dan sedikit yang diketahui publik tentang teks, video, atau klip audio apa yang digunakan untuk membuat model besar apa pun.
Menarik untuk melihat berapa lama waktu yang dibutuhkan Meta untuk membuat Movie Gen tersedia secara luas. Blog pengumuman tersebut secara samar-samar mengisyaratkan “kemungkinan rilis di masa mendatang”. Meskipun WIRED menerima beberapa klip Sora eksklusif dari perusahaan untuk digunakan dalam menyelidiki bias).
Mengingat warisan Meta sebagai perusahaan media sosial, alat yang didukung oleh Movie Gen pada akhirnya mungkin mulai muncul di Facebook, Instagram, dan WhatsApp. Pada bulan September, saingannya Google berbagi rencana untuk membuat aspek model video Veo tersedia bagi pembuat konten di YouTube Shorts sekitar tahun depan.
Meskipun perusahaan teknologi besar masih menunda peluncuran penuh model video ke publik, kini Anda dapat mencoba alat video AI dari startup kecil seperti Runway dan Pika. Jika Anda pernah bertanya-tanya bagaimana rasanya melihat diri Anda dihancurkan secara kartun oleh mesin press hidrolik atau tiba-tiba meleleh ke dalam genangan air, cobalah Pikaffects.