![]() |
| cover | topik.id |
OpenAI resmi merilis GPT-5.2 sebagai model frontier terbaru yang dirancang khusus untuk pekerjaan profesional dan agen otonom yang berjalan terus-menerus. Model ini membawa peningkatan signifikan dalam penalaran, kemampuan alat, pemahaman konteks panjang, hingga visual. OpenAI menekankan bahwa GPT-5.2 dibangun untuk menghasilkan manfaat ekonomi nyata bagi penggunanya.
Dari sisi performa, GPT-5.2 mencatatkan lonjakan besar di berbagai tolok ukur industri. Pada GDPval, model ini menyalip performa profesional manusia di 70,9% tugas kerja pengetahuan. Peningkatan juga terlihat pada SWE-Bench Pro, GPQA Diamond, FrontierMath, ARC-AGI-1, dan ARC-AGI-2, menegaskan superioritasnya dalam rekayasa perangkat lunak hingga penalaran abstrak.
"Pada ARC-AGI-2 (Verified), yang meningkatkan kesulitan dan lebih baik mengisolasi penalaran fleksibel, GPT‑5.2 Thinking mencapai state of the art baru untuk model rantai pemikiran, dengan skor 52,9%. GPT‑5.2 Pro mencapai kinerja yang bahkan lebih tinggi, mencapai 54,2%, yang semakin memperluas kemampuan model untuk bernalar melalui masalah baru dan abstrak," tulis OpenAI dalam pengumuman resminya, seperti dipansir topik.id, Jumat (12/12/2025).
GPT-5.2 Thinking dirilis sebagai model unggulan untuk pekerjaan dunia nyata, menawarkan kecepatan dan biaya jauh lebih rendah dibandingkan pekerja ahli. Model ini juga menghadirkan kemampuan membuat spreadsheet, presentasi, serta artefak profesional yang lebih presisi dan terstandar. Peningkatan pemformatan terlihat jelas dibandingkan GPT-5.1.
Kemampuan pengodean GPT-5.2 juga naik kelas secara mencolok. Dengan skor 55,6% di SWE-Bench Pro, model ini mampu memperbaiki bug, melengkapi fitur, dan merefaktorisasi kode besar dengan intervensi minimal. Penguji awal menilai GPT-5.2 sangat unggul pada pekerjaan front-end dan UI kompleks, termasuk elemen grafis 3D.
Dalam hal faktualitas, GPT-5.2 Thinking menunjukkan tingkat halusinasi lebih rendah, menghasilkan respons 38% lebih akurat pada kueri riil pengguna. Ini menjadikannya pilihan lebih andal untuk riset, analisis, dan pengambilan keputusan. Meski demikian, OpenAI tetap mengingatkan perlunya verifikasi pada konteks kritis.
"GPT‑5.2 dihargai $1,75/1JT token masukan dan $14/1JT token keluaran, dengan diskon 90% untuk masukan yang di-cache. Pada beberapa evaluasi agentik, kami menemukan bahwa meskipun GPT‑5.2 mempunyai biaya yang lebih besar per token, biaya untuk mencapai tingkat kualitas tertentu menjadi lebih murah karena efisiensi token yang lebih tinggi dari GPT‑5.2," ungkap OpenAI.
Pada konteks panjang, GPT-5.2 memecahkan rekor baru dengan akurasi hampir sempurna pada OpenAI MRCRv2 hingga 256 ribu token. Hal ini memungkinkan penggunaan untuk analisis kontrak, laporan, riset ilmiah, hingga proyek kompleks multi-file tanpa kehilangan koherensi informasi. Kemampuan ini diperkuat oleh endpoint Responses /compact.
Berikut fitur dan kemampuan utama.
GPT-5.2 lebih baik daripada versi sebelumnya karena unggul dalam tugas-tugas seperti:
- Membuat spreadsheet
- Membuat presentasi
- Menulis kode
- Mempersepsikan gambar
- Memahami konteks jangka panjang
- Menggunakan alat secara efektif
- Menangani proyek-proyek kompleks dan bertahap.
Versi ini menetapkan standar baru di berbagai tolok ukur, termasuk GDPval, mengungguli para profesional industri dalam tugas-tugas pekerjaan berbasis pengetahuan di 44 profesi.
Ketersediaan dan versi.
GPT-5.2 tersedia untuk pengguna berbayar dan pengembang ChatGPT melalui API dalam tiga versi:
Instan: Dioptimalkan untuk kecepatan, cocok untuk kueri rutin seperti pencarian informasi, penulisan, dan penerjemahan.
Berpikir: Dirancang untuk pekerjaan terstruktur yang kompleks seperti pengkodean, menganalisis dokumen panjang, matematika, dan perencanaan.
Pro: Model kelas atas yang berfokus pada akurasi dan keandalan maksimal untuk masalah yang sulit.
Selain itu, kemampuan visual dan pemanggilan alat GPT-5.2 juga melampaui generasi sebelumnya. Dengan akurasi lebih tinggi pada CharXiv dan ScreenSpot-Pro, model dapat membaca grafik ilmiah, memahami UI, hingga menganalisis perangkat keras dengan lebih presisi. Pada Tau2-Bench, model ini menuntaskan tugas dukungan pelanggan multi-langkah dengan akurasi hampir 99%.
"GPT‑5.2 dibangun dalam kolaborasi dengan mitra jangka panjang kami, NVIDIA dan Microsoft. Pusat data Azure dan GPU NVIDIA, termasuk H100, H200, dan GB200-NVL72, menjadi dasar infrastruktur pelatihan skala besar OpenAI, yang mendorong peningkatan signifikan dalam kecerdasan model," jelas OpenAI dalam pengumuman resminya.
