Mendukung fitur-fitur baru Meta AI adalah versi yang ditingkatkan dari model bahasa besar utama Meta, Llama. Mengingat seri Llama telah diadopsi secara luas oleh para pengembang dan startup, model free-to-play yang diumumkan hari ini kemungkinan besar juga akan berdampak luas.
Berbeda dengan model OpenAI, Llama gratis untuk diunduh dan dijalankan secara lokal – meskipun ada beberapa batasan untuk penggunaan komersial skala besar. Llama juga memudahkan untuk menyempurnakannya untuk tugas tertentu atau memodifikasinya melalui pelatihan tambahan.
Patrick Wendell, salah satu pendiri dan wakil presiden teknik di Databricks, sebuah perusahaan yang menampung model kecerdasan buatan termasuk Llama, mengatakan banyak perusahaan tertarik pada model terbuka karena model tersebut memungkinkan mereka melindungi data dengan lebih baik.
Model bahasa besar semakin menjadi “multimodal,” yang berarti mereka dilatih untuk memproses pesan dan gambar sebagai masukan serta teks. Hal ini memperluas kemampuan model dan memungkinkan pengembang untuk membangun jenis aplikasi AI baru di atasnya, termasuk apa yang disebut agen AI yang dapat melakukan tugas-tugas berguna atas nama mereka di komputer. Llama 3.2 akan memudahkan pengembang untuk membangun agen kecerdasan buatan yang dapat, misalnya, menjelajahi web dan mungkin mencari penawaran untuk jenis produk tertentu dengan penjelasan singkat.
“Model multimodal adalah hal yang besar karena data yang digunakan oleh masyarakat dan bisnis tidak hanya berupa teks, namun bisa dalam berbagai format termasuk gambar dan audio atau format yang lebih khusus seperti urutan protein atau buku besar keuangan,” Profesor Philip “Selama beberapa tahun terakhir , kami telah berevolusi dari model bahasa yang canggih menjadi model yang kini juga berfungsi dengan baik dengan gambar dan ucapan,” kata Isola. “Setiap tahun kami melihat semakin banyak pola data yang tersedia untuk sistem ini.” .
“Dengan Llama 3.1, Meta menunjukkan bahwa model terbuka pada akhirnya dapat menutup kesenjangan dengan model berpemilik,” kata Nathan Benaich, pendiri dan mitra umum di Air Street Capital dan penulis laporan tahunan berpengaruh tentang kecerdasan buatan. Model multimodal cenderung mengungguli model teks saja yang lebih besar, tambah Benaich. “Saya senang melihat perkembangan 3.2,” katanya.
Sebelumnya hari ini, Allen Institute for Artificial Intelligence (Ai2) di Seattle merilis model multi-modal sumber terbuka canggih yang disebut Molmo. Lisensi rilis Molmo tidak seketat Llama, dan Ai2 juga merilis detail data pelatihannya, yang dapat membantu peneliti dan pengembang bereksperimen dan memodifikasi model.
Meta hari ini mengatakan akan merilis Llama 3.2 dalam beberapa ukuran dan fitur yang sesuai. Selain dua instans yang lebih kuat dengan 11 miliar dan 90 miliar parameter (ukuran kompleksitas model dan ukurannya), Meta juga merilis versi parameter 1 miliar dan 3 miliar yang kurang kuat yang ditujukan agar perangkat portabel berfungsi dengan baik. Meta mengatakan versi ini telah dioptimalkan untuk chip seluler berbasis ARM dari Qualcomm dan MediaTek.
Revolusi AI Meta terjadi pada saat yang menarik, ketika raksasa teknologi bersaing untuk menghadirkan kecerdasan buatan tercanggih. Keputusan perusahaan untuk merilis model paling berharga secara gratis dapat memberikan keuntungan dalam menyediakan dasar bagi banyak alat dan layanan kecerdasan buatan, terutama ketika perusahaan mulai mengeksplorasi potensi agen kecerdasan buatan.