iklan - scroll untuk melanjutkan membaca.

Alibaba gercep bikin Wan AI, generasi video sumber terbuka

Alibaba membuka akses teknologi AI generatif, baik melalui Wan2.1 maupun pembaruan pada Qwen AI dengan sumber terbuka.

author photo
A- A+
cover | @alibaba
Alibaba gerak cepat kembali menunjukkan gebrakan di dunia kecerdasan buatan, aerificial intelligence (AI) dengan meluncurkan Wan2.1, model AI generatif video terbaru yang kini tersedia sebagai sumber terbuka. 

Dari penelusuran topik.id, Rabu (26/2/2025) dari laman resmi wanxia.com, menjelaskan serangkaian inovasi mutakhir, termasuk spatio-temporal variational autoencoder (VAE) baru dan strategi pra-pelatihan yang dapat diskalakan, Wan2.1 diklaim mampu menghasilkan video berkualitas tinggi dengan efisiensi luar biasa. 

Tak hanya itu, model ini juga mendukung berbagai tugas, mulai dari teks-ke-video hingga penyuntingan video, sekaligus kompatibel dengan GPU kelas konsumen.
"Dibangun berdasarkan paradigma transformator difusi arus utama, Wan2.1 mencapai kemajuan signifikan dalam kemampuan generatif melalui serangkaian inovasi, termasuk spatio-temporal variational autoencoder (VAE) baru kami," tulis dalam laporannya.
Langkah Alibaba dalam membuka akses teknologi AI generatif, baik melalui Wan2.1 maupun pembaruan pada Qwen AI, semakin memperkuat komitmennya dalam mendorong inovasi di bidang kecerdasan buatan. 

"Strategi pra-pelatihan yang dapat diskalakan, konstruksi data skala besar, dan metrik evaluasi otomatis. Kontribusi ini secara kolektif meningkatkan kinerja dan fleksibilitas model," ungkapnya.

Berikut fitur yang dikembangkan Wan AI:

  • Kinerja SOTA: Wan2.1 secara konsisten mengungguli model sumber terbuka yang ada dan solusi komersial canggih di berbagai tolok ukur.
  • Mendukung GPU kelas konsumen: Model T2V-1.3B hanya memerlukan VRAM 8,19 GB, sehingga kompatibel dengan hampir semua GPU kelas konsumen. Model ini dapat menghasilkan video 480P berdurasi 5 detik pada RTX 4090 dalam waktu sekitar 4 menit (tanpa teknik pengoptimalan seperti kuantisasi). Performanya bahkan sebanding dengan beberapa model sumber tertutup.
  • Berbagai tugas: Wan2.1 unggul dalam Teks-ke-Video, Gambar-ke-Video, Penyuntingan Video, Teks-ke-Gambar, dan Video-ke-Audio, memajukan bidang pembuatan video.
  • Pembuatan Teks Visual: Wan2.1 adalah model video pertama yang mampu membuat teks bahasa Mandarin dan Inggris, dilengkapi pembuatan teks tangguh yang menyempurnakan aplikasi praktisnya.
  • Video VAE yang Kuat: Wan-VAE menghadirkan efisiensi dan kinerja yang luar biasa, mengodekan dan mendekode video 1080P dengan durasi apa pun sambil mempertahankan informasi temporal, menjadikannya fondasi ideal untuk pembuatan video dan gambar.
Rilis Qwen AI.

cover: topik.id
Sebelumnya Alibaba juga merilis pembaruan Qwen, chatbot artificial intelligence (AI) QwQ-Max-Preview, model terbaru yang diklaim memiliki kemampuan lebih unggul dalam pemrograman dan pemecahan masalah. 

Dibangun di atas fondasi Qwen2.5-Max, model ini dikembangkan untuk meningkatkan akurasi dalam matematika, pengodean, serta berbagai tugas berbasis AI lainnya. Dengan fitur-fitur yang lebih canggih, QwQ-Max-Preview diharapkan mampu memberikan performa yang lebih baik dalam alur kerja berbasis Agen.

"Kami dengan senang hati meluncurkan QwQ-Max-Preview, kemajuan terbaru dalam seri Qwen, yang dirancang untuk mendorong batasan penalaran mendalam dan pemecahan masalah yang serbaguna. Dibangun di atas fondasi Qwen2.5-Max yang kuat, model pratinjau ini unggul dalam matematika, pengodean, dan tugas-tugas domain umum, sekaligus memberikan kinerja yang luar biasa dalam alur kerja yang terkait dengan Agen," tulis Qwen dalam sebuah postingan, Selasa (25/2/2025).

Perusahaan berbasis AI yang dinaungi Alibaba itu juga merincikan penyempurnaan yang berkelanjutan dan peluncuran QwQ-Max dan Qwen2.5-Max sumber terbuka berlisensi Apache 2.0.

"Sebagai cuplikan dari rilis QwQ-Max mendatang, versi ini menawarkan sekilas kemampuan yang disempurnakan, dengan penyempurnaan yang berkelanjutan dan peluncuran QwQ-Max dan Qwen2.5-Max sumber terbuka berlisensi Apache 2.0 yang resmi direncanakan segera. Nantikan era baru penalaran cerdas," terangnya.

Peluncuran QwQ-Max-Preview ini menjadi langkah awal menuju rilis resmi QwQ-Max yang dijanjikan akan membawa peningkatan lebih lanjut. 

Dengan model sumber terbuka berlisensi Apache 2.0, Qwen AI berkomitmen untuk mendorong inovasi di bidang AI dan memberikan akses luas bagi pengembang. 


Share:
Premium.
Komentar
Komentar sepenuhnya tanggung jawab pengguna dan diatur dalam UU ITE.

Update
Indeks