4 AI baru besutan Meta, dari mutimedia hingga multi-token

Meta

Grup riset (FAIR) Meta, Inc telah merilis beberapa model dan teknik sumber terbuka baru yang dirancang untuk meningkatkan berbagai aspek teknologi artificial intelligence (AI) atau kecerdasan buatan.

Inovasi-inovasi ini mencakup alat untuk tugas bahasa multimodal, pembuatan teks ke musik dan audio, serta pendeteksian ucapan sintetik. Dengan alat-alat ini, Meta berupaya memperluas cakupan dan kemampuan AI untuk memenuhi kebutuhan yang semakin kompleks dan beragam.

"Sebagai bagian dari komitmen berkelanjutan kami terhadap pertumbuhan dan pengembangan ekosistem terbuka, hari ini di Meta FAIR kami mengumumkan empat model AI baru yang tersedia untuk umum dan artefak penelitian tambahan untuk menginspirasi inovasi di komunitas dan membantu memajukan AI dengan cara yang bertanggung jawab," ungkap Meta dalam postingannya di media sosial X, dikutip Kamis (20/6/2024).

Perusahaan induk Facebook dan Instagram itu percaya bahwa akses terhadap AI yang canggih menciptakan peluang bagi semua orang, tidak hanya segelintir perusahaan Teknologi Besar.

"Kami sangat antusias untuk membagikan karya ini dan melihat bagaimana komunitas belajar, mengulangi, dan membangun menggunakan teknologi ini," jelasnya.

Meta menunjukkan komitmennya dalam mendorong inovasi di bidang AI dan menyediakan teknologi yang dapat digunakan oleh komunitas secara luas.

Alat-alat ini tidak hanya memperluas cakupan kemampuan AI, tetapi juga memberikan kontrol yang lebih besar kepada pengguna dan meningkatkan keamanan dalam penggunaan teknologi kecerdasan buatan. Berikut empat AI baru besutan Meta yang baru saja dirilis:

1. Chameleon: Keluarga model bahasa dengan parameter 7B dan 34B yang mampu menangani input dari gambar, audio, dan teks. Chameleon dirancang untuk mengintegrasikan berbagai bentuk media dalam satu model, memungkinkan pemrosesan dan pemahaman yang lebih komprehensif terhadap informasi multimodal.

2. JASCO: Model teks-ke-musik terbaru dari Meta yang memungkinkan kontrol input yang mendetail untuk menghasilkan musik. JASCO memberikan kebebasan bagi pengguna untuk mengatur berbagai aspek musik yang dihasilkan, seperti tempo, gaya, dan instrumen, sehingga hasil yang diinginkan dapat tercapai dengan lebih presisi.

3. AudioSeal: Model watermarking audio pertama yang dirancang khusus untuk mendeteksi ucapan yang dihasilkan oleh AI. AudioSeal, yang tersedia di bawah lisensi komersial, menawarkan solusi canggih untuk mengenali dan memverifikasi keaslian ucapan, membantu mengatasi masalah plagiarisme dan penyalahgunaan konten suara yang dihasilkan secara sintetis.

4. Model Prediksi Multi-Token: Model ini meningkatkan pelengkapan otomatis kode dengan memprediksi beberapa token sekaligus, sehingga meningkatkan kecepatan dan efisiensi dalam penulisan kode. Dengan kemampuan untuk memprediksi dan melengkapi beberapa token dalam satu langkah, model ini mempermudah proses coding dan membantu pengembang menulis kode dengan lebih cepat dan akurat.

4 AI baru besutan Meta, dari mutimedia hingga multi-token

Populer