![]() |
cover | topik.id |
Anthropic resmi merilis Claude Sonnet 4.5, sebuah model kecerdasan buatan terbaru yang diklaim sebagai model pengkodean terbaik. Model ini disebut mampu bekerja secara intensif hingga lebih dari 30 jam dalam mengerjakan tugas-tugas pemrograman yang kompleks. Selain itu, Claude Sonnet 4.5 juga menunjukkan peningkatan signifikan dalam kemampuan penalaran serta pemahaman matematika, menjadikannya salah satu model AI terkuat di pasaran saat ini.
"Claude Sonnet 4.5 adalah model pengkodean terbaik di dunia. Model ini merupakan model terkuat untuk membangun agen yang kompleks. Model ini juga merupakan model terbaik dalam penggunaan komputer. Dan model ini menunjukkan kemajuan substansial dalam penalaran dan matematika," tulis Anthropic dalam pengumuman resminya, dilansir Selasa (30/9/2025).
Perusahaan menekankan bahwa kode ada di mana-mana, menggerakkan aplikasi, spreadsheet, hingga perangkat lunak yang sehari-hari digunakan masyarakat. Dengan kapabilitas yang lebih canggih, Claude Sonnet 4.5 dirancang untuk tidak hanya memahami kode, tetapi juga mampu bernalar dalam menyelesaikan masalah-masalah sulit. Hal ini menjadikannya solusi AI yang lebih selaras dengan kebutuhan kerja modern yang semakin bergantung pada otomatisasi perangkat lunak.
Bersamaan dengan peluncuran ini, Anthropic juga memperkenalkan berbagai peningkatan pada produk Claude. Di Claude Code, misalnya, hadir fitur checkpoint yang banyak diminta pengguna, memungkinkan penyimpanan progres kerja dan pengembalian ke kondisi sebelumnya. Selain itu, perusahaan merilis ekstensi VS Code asli, menyegarkan antarmuka terminal, serta menambahkan fitur pengeditan konteks dan alat memori pada API Claude. Integrasi eksekusi kode dan pembuatan file langsung ke dalam aplikasi Claude juga menjadi sorotan utama.
Tidak berhenti di situ, Anthropic juga meluncurkan Claude Agent SDK, sebuah fondasi yang sebelumnya digunakan secara internal untuk membangun Claude Code. SDK ini kini dibuka untuk pengembang agar mereka dapat mengembangkan agen AI sendiri dengan infrastruktur yang sama. Dengan demikian, Anthropic mendorong ekosistem terbuka di mana pengembang dapat memanfaatkan teknologi inti Claude untuk membangun solusi yang lebih inovatif.
Dari sisi teknis, Claude Sonnet 4.5 menunjukkan peningkatan luar biasa dalam benchmark SWE-bench Verified, yang menguji kemampuan model dalam pengkodean dunia nyata.
Mengukur kemampuan pengkodean.
Hasil pengujian menunjukkan model ini mampu mempertahankan fokus kerja selama lebih dari 30 jam dalam menangani tugas-tugas bertahap yang kompleks. Sementara itu, di OSWorld benchmark, skor Sonnet 4.5 melonjak hingga 61,4%, jauh lebih tinggi dibanding Sonnet 4 yang hanya mencatat 42,2% empat bulan lalu.
"Claude Sonnet 4.5 merupakan perangkat lunak mutakhir dalam evaluasi SWE-bench Verified, yang mengukur kemampuan pengkodean perangkat lunak di dunia nyata. Secara praktis, kami telah mengamati bahwa perangkat lunak ini tetap fokus selama lebih dari 30 jam pada tugas-tugas kompleks yang bertahap," ungkapnya.
Ketersediaan Claude Sonnet 4.5 pun diperluas secara global. Pengembang bisa langsung mengaksesnya melalui API Claude dengan harga yang sama seperti versi sebelumnya, yakni $3 untuk input dan $15 untuk output per juta token. Anthropic juga memperluas dukungan dengan menghadirkan ekstensi Claude untuk Chrome, yang memungkinkan AI ini beroperasi langsung di peramban untuk mengisi spreadsheet, menavigasi situs, hingga menyelesaikan berbagai tugas praktis.
Kemampuan Claude Sonnet 4.5 tidak hanya unggul dalam pemrograman, tetapi juga diakui oleh para ahli di bidang keuangan, hukum, kedokteran, dan STEM. Dibandingkan model sebelumnya, termasuk Opus 4.1, Sonnet 4.5 menunjukkan pemahaman spesifik domain serta penalaran yang jauh lebih matang. Anthropic menegaskan bahwa model ini adalah pencapaian paling canggih mereka sejauh ini, membuka babak baru dalam pemanfaatan AI untuk kebutuhan lintas industri.
"Para ahli di bidang keuangan, hukum, kedokteran, dan STEM menemukan Soneta 4.5 menunjukkan pengetahuan dan penalaran spesifik domain yang jauh lebih baik dibandingkan dengan model lama, termasuk Opus 4.1," terangnya.