Peneliti ByteDance bikin Goku, AI canggih visual skala besar

Visual yang dihasilkan Goku | @goku

Sebuah inovasi terbaru dalam dunia kecerdasan buatan atau artificial intelligence (AI) yang dikembangkan oleh para peneliti ByteDance.

AI itu disebut Goku, merupakan model AI gabungan gambar dan video yang mengusung teknologi Transformator aliran terkoreksi, yang dirancang untuk mencapai kinerja terdepan dalam industri AI.

Dalam penelitiannya, kemampuan Goku dapat menghasilkan visual berkualitas tinggi, serta infrastruktur yang digunakan untuk melatih model ini secara efisien pada skala besar.

Hal itu diungkapkan dalam makalah yang memperkenalkan Goku, model gabungan gambar dan video mutakhir yang memanfaatkan transformator aliran terkoreksi untuk mencapai kinerja terdepan di industri.

"Kami merinci elemen dasar yang memungkinkan pembuatan visual berkualitas tinggi, termasuk alur kurasi data, desain arsitektur model, formulasi aliran, dan infrastruktur canggih untuk pelatihan skala besar yang efisien dan tangguh," tulis dalam makalah itu, dikutip Rabu (12/2/2025).

Perusahaan asal China itu juga merincikan model Goku dengan kinerja yang unggul dalam evaluasi kualitatif dan kuantitatif, yang menetapkan tolok ukur baru di seluruh tugas utama.

Secara khusus, Goku mencapai 0,76 pada GenEval dan 83,65 pada DPG-Bench untuk pembuatan teks ke gambar, dan 84,85 pada VBench untuk tugas teks ke video.

"Kami percaya bahwa karya ini memberikan wawasan berharga dan kemajuan praktis bagi komunitas penelitian dalam mengembangkan model gabungan gambar dan video," terangnyanya.

Dengan pencapaian yang luar biasa dalam evaluasi kualitatif dan kuantitatif, seperti skor tinggi pada GenEval dan DPG-Bench untuk pembuatan teks ke gambar, serta VBench untuk tugas teks ke video, Goku menetapkan tolok ukur baru dalam bidang AI terkini.

Berikut video yang dihasilkan AI Goku:

Peneliti ByteDance bikin Goku, AI canggih visual skala besar

Populer