Google klaim Gemini 2.5 Flash-Lite paling hemat biaya

cover | @google

Google secara resmi merilis Gemini 2.5 Flash-Lite, model terbaru dalam keluarga Gemini 2.5 yang diklaim sebagai yang paling hemat biaya dan tercepat hingga saat ini. Model ini dirancang untuk memberikan kecerdasan maksimum per dolar, dengan kombinasi efisiensi dan kinerja tinggi yang menyasar skenario penggunaan berskala besar dan sensitif terhadap latensi.

Dengan biaya hanya $0,10 per satu juta token input dan $0,40 untuk token output, Google menargetkan pengguna yang membutuhkan kemampuan AI cepat namun terjangkau. Gemini 2.5 Flash-Lite menjadi pelengkap dari dua model sebelumnya—2.5 Flash dan 2.5 Pro—dalam ekosistem Gemini 2.5.

Model ini diposisikan sebagai solusi ideal bagi pengguna yang menginginkan performa tinggi dalam pemrosesan data dengan anggaran terbatas. Tabel perbandingan internal menunjukkan bahwa meskipun Flash-Lite memiliki harga yang jauh lebih rendah, performanya tetap kompetitif dalam tugas-tugas tertentu.

"Hari ini, kami merilis versi stabil Gemini 2.5 Flash-Lite, model tercepat dan berbiaya terendah kami (input $0,10 per 1 juta, output $0,40 per 1 juta) dalam keluarga model Gemini 2.5. 2.5 Flash-Lite kami kembangkan untuk mendorong batas kecerdasan per dolar, dengan kemampuan penalaran bawaan yang dapat diaktifkan secara opsional untuk kasus penggunaan yang lebih menantang," tulis Google dalam pengumuman resminya, dilansir Minggu (27/7/2025).

Salah satu keunggulan utama dari Gemini 2.5 Flash-Lite adalah kecepatan pemrosesannya. Dibandingkan dengan generasi sebelumnya seperti 2.0 Flash-Lite dan 2.0 Flash, model baru ini memiliki latensi yang jauh lebih rendah saat menangani berbagai perintah. Ini menjadikannya sangat cocok untuk aplikasi real-time seperti penerjemahan bahasa, klasifikasi, dan tugas interaktif lainnya yang mengutamakan waktu respons cepat.

Dari sisi kualitas, Flash-Lite juga mengalami peningkatan signifikan. Google menyebut bahwa model ini melampaui 2.0 Flash-Lite dalam sejumlah tolok ukur utama seperti pengodean, matematika, penalaran ilmiah, dan pemahaman multimodal. Ini menunjukkan bahwa meskipun harganya lebih murah, performa kognitif dan fleksibilitas Flash-Lite tidak dikompromikan.

Google juga mencatat bahwa mereka telah menurunkan harga input audio sebesar 40% sejak peluncuran pratinjau, membuat integrasi audio menjadi lebih terjangkau bagi pengembang. Ini membuka jalan bagi lebih banyak aplikasi AI berbasis suara dan multimodal di sektor bisnis, pendidikan, serta layanan pelanggan.

Flash-Lite juga mendukung berbagai fitur lanjutan yang biasanya hanya tersedia di model premium. Pengguna mendapatkan akses ke jendela konteks sebesar satu juta token, serta dapat mengatur “anggaran pemikiran” sesuai kebutuhan tugas. Hal ini memungkinkan pengembang untuk menyeimbangkan antara kedalaman pemrosesan dan efisiensi komputasi.

Selain itu, model ini kompatibel dengan berbagai alat produktivitas AI milik Google seperti Grounding with Google Search, Eksekusi Kode langsung, dan Konteks URL. Fitur-fitur ini memungkinkan Flash-Lite untuk memberikan respons yang lebih akurat dan kontekstual dalam berbagai aplikasi dunia nyata.

Dengan peluncuran Gemini 2.5 Flash-Lite, Google mempertegas komitmennya dalam menyediakan model AI yang tidak hanya kuat dan cerdas, tetapi juga terjangkau dan dapat diskalakan. Model ini dirancang untuk memperluas akses ke AI canggih, memungkinkan lebih banyak organisasi membangun aplikasi berbasis AI tanpa harus mengorbankan anggaran mereka.

"Gemini 2.5 Flash-Lite mencapai keseimbangan antara kinerja dan biaya, tanpa mengorbankan kualitas, khususnya untuk tugas-tugas yang sensitif terhadap latensi seperti penerjemahan dan klasifikasi," jelasnya.

Google klaim Gemini 2.5 Flash-Lite paling hemat biaya

Populer