![]() |
cover |
Fitur baru ini menggabungkan kekuatan teknologi sebelumnya, termasuk browsing web, riset mendalam, dan percakapan berbasis AI, ke dalam satu sistem yang terpadu.
Dengan akses ke komputer virtual, agen ChatGPT dapat menavigasi situs, menjalankan kode, hingga menghasilkan presentasi dan spreadsheet yang dapat diedit, menjadikannya alat produktivitas baru bagi pengguna Pro, Plus, dan Tim.
"Agen ChatGPT menggabungkan kemampuan Operator untuk berinteraksi dengan situs web, kekuatan riset dalam guna mempersatukan informasi web, dan keahlian percakapan ChatGPT menjadi sistem agen terpadu," tulis OpenAI dalam pengumuman resminya, dilansir Sabtu (19/7/2025).
Kemampuan agensi terpadu.
Agen ChatGPT yang baru menggabungkan keunggulan Operator dan riset mendalam, mengatasi keterbatasan masing-masing dengan memungkinkan analisis mendalam dan navigasi web interaktif, termasuk login aman untuk konten yang dipersonalisasi.
Agen ini menggunakan berbagai alat seperti peramban visual, peramban berbasis teks, terminal, dan akses API, memilih metode optimal untuk menyelesaikan tugas secara efisien.
Agen ini juga mendukung alur kerja kolaboratif yang iteratif di mana pengguna dapat memandu atau menjeda agen, dan menerima notifikasi setelah tugas selesai.
Aplikasi praktis.
Agen ChatGPT meningkatkan produktivitas dalam konteks profesional dan pribadi dengan mengotomatiskan tugas-tugas seperti membuat presentasi dari dasbor, mengelola rapat, memperbarui spreadsheet keuangan, merencanakan perjalanan, dan membuat janji temu. Agen ini mencapai kinerja terbaik pada berbagai tolok ukur, termasuk:
- Ujian Terakhir Kemanusiaan : Mencapai skor SOTA pass@1 baru sebesar 41,6, meningkat menjadi 44,4 dengan upaya paralel.
- FrontierMath : Mencapai akurasi 27,4% pada soal matematika yang paling sulit, mengungguli model sebelumnya.
- DSBench dan SpreadsheetBench : Melampaui kinerja manusia dan model yang ada dalam ilmu data dan tugas pengeditan spreadsheet.
- Pemodelan Perbankan Investasi : Mengungguli model sebelumnya dalam tugas pemodelan keuangan yang kompleks.
- BrowseComp dan WebArena : Menetapkan rekor baru dalam penelusuran web dan penyelesaian tugas web di dunia nyata.
- Penggunaan dan Integrasi.
Pengguna dengan langganan Pro, Plus, dan Tim dapat mengaktifkan mode agen dari menu tarik-turun alat di percakapan apa pun. Agen dapat mengakses aplikasi yang terhubung dengan pengguna (misalnya, Gmail, GitHub) melalui konektor ChatGPT, yang memungkinkannya terintegrasi dengan alur kerja dan bertindak berdasarkan data yang relevan, sekaligus mewajibkan login eksplisit untuk situs sensitif. Tugas dapat dijadwalkan untuk berulang secara otomatis.
Mitigasi risiko.
Mengingat kemampuan agen untuk bertindak di web dan mengakses data pengguna, OpenAI telah menerapkan perlindungan yang kuat termasuk:
- Konfirmasi pengguna secara eksplisit sebelum tindakan konsekuensial.
- Pengawasan aktif (“Mode Pengawasan”) untuk tugas-tugas kritis.
- Penolakan proaktif terhadap tindakan berisiko tinggi seperti transfer bank.
- Kontrol privasi memungkinkan pengguna untuk menghapus data penelusuran dan keluar dari sesi.
- Mode pengambilalihan browser yang aman yang menjaga masukan pengguna tetap pribadi.
- Pertahanan yang kuat terhadap serangan injeksi cepat, yang dapat memanipulasi agen melalui konten web berbahaya.
- Pemantauan berkelanjutan dan respons cepat terhadap ancaman keamanan.
Agen tersebut diklasifikasikan di bawah kerangka kerja kesiapan kemampuan Biologi dan Kimia Tinggi OpenAI, dengan langkah-langkah biosafety yang komprehensif dan kolaborasi berkelanjutan dengan para ahli biosecurity eksternal.
Keterbatasan.
Agen ChatGPT masih dalam tahap awal dan mungkin masih terdapat kesalahan. Pembuatan slide saat ini masih dalam tahap beta, dengan rencana perbaikan berkelanjutan untuk pemformatan dan pemolesan.
Pengeditan spreadsheet sudah lebih canggih, tetapi pengunggahan slide untuk pengeditan belum didukung. OpenAI berencana melakukan penyempurnaan berulang untuk meningkatkan efisiensi, kedalaman, fleksibilitas, dan keseimbangan pengawasan pengguna agen.
Agen ChatGPT akan diluncurkan untuk pengguna Pro, Plus, dan Tim, dengan akses Enterprise dan Education segera hadir. Batas penggunaan bervariasi berdasarkan tingkat langganan, dengan opsi kredit tambahan. Pratinjau riset Operator akan segera dihentikan, dengan riset mendalam terintegrasi ke dalam agen baru.
"Agen ChatGPT mulai digulirkan hari ini untuk pengguna Pro, Plus, dan Team, dengan ketersediaan bagi pengguna Enterprise dan Education pada bulan Juli. Pengguna Pro memiliki tugas yang hampir tidak terbatas per bulan, sedangkan pengguna berbayar lainnya mendapatkan 50 tugas per bulan, dengan penggunaan tambahan yang tersedia melalui opsi berbasis kredit yang fleksibel," jelasnya.