![]() |
| cover | topik.id |
OpenAI memperkenalkan pembaruan besar pada ChatGPT untuk memperkuat cara model menangani percakapan yang berkaitan dengan tekanan psikologis dan isu kesehatan mental. Lebih dari 170 pakar kesehatan mental dari berbagai negara terlibat langsung dalam proyek ini.
Kolaborasi tersebut membantu sistem mengenali tanda-tanda stres emosional dengan lebih akurat serta mengarahkan pengguna menuju dukungan nyata di dunia luar. Hasil awal menunjukkan penurunan respons yang tidak sesuai antara 65 hingga 80 persen.
Peningkatan ChatGPT mencakup kemampuan mengenali percakapan yang mengandung risiko seperti psikosis, mania, keinginan melukai diri sendiri, atau kecenderungan ketergantungan emosional pada AI.
Model yang diperbarui juga memberi rujukan ke hotline krisis, menyarankan jeda dalam sesi panjang, dan memindahkan percakapan sensitif ke model yang lebih aman. Fokusnya adalah memastikan interaksi tetap terkendali dalam konteks situasi yang rentan.
Pembaruan tersebut mengikuti pedoman dalam Spesifikasi Model OpenAI yang menekankan pentingnya menghormati hubungan sosial pengguna di dunia nyata. Model dirancang untuk tidak memperkuat keyakinan delusional, merespons dengan empati terhadap tanda-tanda gangguan mental, dan memperhatikan sinyal tidak langsung yang berpotensi mengarah pada bahaya diri. Setiap penyesuaian diuji melalui proses evaluasi yang melibatkan analisis perilaku model dalam skenario berisiko tinggi.
"Peningkatan keamanan kami dalam pembaruan model terbaru berfokus pada area-area berikut, masalah kesehatan mental seperti psikosis atau mania, perilaku melukai diri sendiri dan bunuh diri dan ketergantungan emosional pada AI. Ke depannya, selain metrik keamanan dasar kami yang telah lama digunakan untuk bunuh diri dan perilaku melukai diri sendiri, kami juga akan menambahkan ketergantungan emosional dan keadaan darurat kesehatan mental non-bunuh diri ke dalam rangkaian standar pengujian keamanan dasar kami untuk rilis model mendatang," tulis OpenAI dalam laporan resminya, seperti dilansir topik.id, Selasa (28/10/2025).
Proses peningkatan dilakukan melalui lima langkah sistematis, pemetaan risiko, pengukuran melalui data percakapan nyata, validasi pendekatan bersama pakar, pelatihan ulang model, dan pengujian berulang. Tim pengembang menyusun taksonomi khusus yang menggambarkan jenis percakapan sensitif serta perilaku ideal yang diharapkan dari model. Evaluasi dilakukan secara luring dengan skenario sulit yang sengaja dirancang untuk menguji ketahanan model dalam kondisi ekstrem.
Dalam evaluasi terkait psikosis dan mania, model GPT-5 menunjukkan perbaikan signifikan. Respons yang dianggap tidak sesuai menurun hingga 65 persen. Dari seluruh pengguna aktif mingguan, hanya sekitar 0,07 persen yang menunjukkan tanda-tanda darurat psikologis. Pada uji percakapan menantang, tingkat kepatuhan model terhadap panduan perilaku mencapai 92 persen, meningkat jauh dari versi sebelumnya.
Pada domain pencegahan bunuh diri dan melukai diri sendiri, tingkat respons yang tidak sesuai turun hingga 52 persen. Model GPT-5 mampu memberikan tanggapan aman, termasuk pengarahan ke layanan bantuan profesional. Dari 1.000 percakapan menantang yang diuji, 91 persen respons dinilai sesuai taksonomi perilaku yang diharapkan. Ketahanan model juga meningkat dalam percakapan panjang dengan tingkat keandalan di atas 95 persen.
"Pada percakapan yang menantang mengenai tindakan menyakiti diri sendiri dan bunuh diri, para ahli menemukan bahwa model GPT‑5 yang baru mengurangi jawaban yang tidak diinginkan hingga 52% dibandingkan dengan GPT‑4o (n=630)," ungkapnya.
Masalah ketergantungan emosional menjadi area penting lain. Pembaruan GPT-5 menurunkan tingkat respons tidak sesuai hingga 80 persen. Evaluasi menunjukkan model lebih konsisten mengarahkan pengguna untuk kembali berinteraksi dengan lingkungan sosial dan dukungan nyata, bukan bergantung pada AI. Dalam uji lapangan, skor kepatuhan mencapai 97 persen, naik signifikan dari versi sebelumnya yang hanya 50 persen.
Penilaian dilakukan bersama Jaringan Dokter Global yang beranggotakan hampir 300 dokter dan psikolog dari 60 negara. Para ahli meninjau lebih dari 1.800 respons model dan mencatat peningkatan konsistensi antara 39 hingga 52 persen dibanding GPT-4o.
OpenAI menyebut pengujian ini sebagai langkah lanjutan menuju sistem AI yang lebih aman bagi pengguna di situasi sensitif. Pekerjaan masih berlanjut dengan pengembangan taksonomi baru dan penyempurnaan metode evaluasi agar model terus menyesuaikan diri dengan tantangan psikologis manusia.
"Kami terus meningkatkan keandalan GPT‑5 dalam percakapan panjang. Kami menciptakan serangkaian percakapan panjang baru yang menantang berdasarkan skenario dunia nyata yang dipilih karena kemungkinan kegagalannya yang lebih tinggi. Kami memperkirakan bahwa model terbaru kami mempertahankan keandalan lebih dari 95% dalam percakapan yang lebih panjang," harapnya.
.png.webp-rw)