![]() |
| cover | topik.id |
Google resmi mengumumkan pembaruan Gemini Deep Research dalam versi yang lebih canggih, diperkenalkan bersamaan dengan API Interaksi yang memungkinkan kemampuan riset otonom Google digunakan langsung dalam aplikasi pengembang. Google juga merilis tolok ukur baru, DeepSearchQA, yang dirancang untuk menguji kualitas agen dalam tugas pencarian web yang kompleks. Pembaruan ini menandai lompatan signifikan dalam kemampuan riset berbasis AI.
Agen ini dibangun untuk mengumpulkan dan menyintesis konteks jangka panjang secara presisi tinggi, menggunakan Gemini 3 Pro sebagai inti penalaran. Model tersebut dilatih untuk menekan halusinasi dan memaksimalkan keakuratan laporan, sekaligus meningkatkan penguatan multi-langkah dalam proses pencarian web. Dengan pendekatan iteratif, agen dapat merumuskan pertanyaan, membaca hasil, lalu kembali menggali data untuk menutup celah informasi.
Gemini Deep Research menunjukkan kinerja unggul pada Humanity’s Last Exam, DeepSearchQA, dan BrowseComp—mencetak angka mutakhir di seluruh tolok ukur tersebut. Optimalisasi biaya membuat agen lebih efisien saat menghasilkan laporan mendalam yang sebelumnya memakan waktu dan tenaga besar. Google memastikan kemampuan ini segera diperluas ke Search, NotebookLM, Google Finance, dan Aplikasi Gemini.
"Tolok ukur yang ada seringkali gagal menangkap kompleksitas riset web multi-langkah di dunia nyata. Inilah mengapa kami membuka kode sumber DeepSearchQA , tolok ukur baru untuk mengevaluasi agen pada tugas pencarian informasi multi-langkah yang rumit," tulis Google dalam pengumuman resminya, seperti dilansir topik.id, Jumat (12/12/2025).
DeepSearchQA sendiri hadir untuk menangkap kompleksitas riset web multi-langkah yang tidak mampu ditangani tolok ukur generasi lama. Dengan 900 tugas rantai sebab-akibat di 17 bidang, benchmark ini menilai kelengkapan dan ketelitian jawaban, bukan sekadar kemampuan memanggil fakta. Penskalaan waktu inferensi juga diuji untuk melihat manfaat eksplorasi lintasan penalaran paralel.
Bidang-bidang kompleks yang membutuhkan presisi tinggi.
![]() |
| dok: @google |
Google merilis dataset, leaderboard, serta Colab pemula untuk mendorong komunitas riset mengembangkan agen yang lebih tangguh. Pengujian menunjukkan bahwa waktu berpikir lebih lama memberikan peningkatan performa berarti, memberi dasar bagi pembaruan lanjutan. Benchmark ini diproyeksikan menjadi standar baru untuk penilaian agen riset mendalam.
"Agen Gemini Deep Research telah menunjukkan hasil yang mendalam dan langsung di bidang-bidang kompleks yang membutuhkan presisi tinggi dan konteks berdasarkan umpan balik dan pengujian awal. Ini termasuk sektor-sektor seperti jasa keuangan, bioteknologi, dan riset pasar, yang telah menggunakan Gemini Deep Research untuk menangani tugas-tugas riset pendahuluan," ungkap Google.
Dalam pengujian dunia nyata, Gemini Deep Research telah dipakai di sektor keuangan, bioteknologi, hingga riset pasar yang membutuhkan analisis kompleks. Agen ini mampu mengotomatisasi uji tuntas awal, menggabungkan sinyal pasar, risiko kepatuhan, dan data pesaing dengan kecepatan jauh melampaui metode manual. Perusahaan seperti GV dan Axiom Bio menilai peningkatannya signifikan untuk riset awal dan penemuan obat.
Bagi pengembang, Gemini Deep Research menawarkan kendali penuh atas struktur laporan, kemampuan unggah file, referensi terperinci, hingga output JSON yang mudah diurai aplikasi hilir. API Interaksi menjadi pintu masuk utama untuk mengintegrasikan kemampuan ini, dengan rencana pembaruan mencakup grafik visual asli, dukungan Model Context Protocol, dan ketersediaan di Vertex AI bagi perusahaan.
"Pembaruan mendatang juga akan berfokus pada output yang lebih kaya seperti pembuatan grafik asli untuk laporan analitik visual dan perluasan konektivitas melalui dukungan Model Context Protocol (MCP) untuk lebih mudah mengakses sumber data kustom Anda. Kami juga berupaya menghadirkan Gemini Deep Research ke Vertex AI untuk perusahaan," tutup Google dalam pengumuman itu.
.webp)
