OpenAI Luncurkan Model AI o1: Solusi Penalaran Canggih untuk Masalah Kompleks

Pada 12 September 2024, OpenAI resmi meluncurkan model AI terbaru, o1 dan o1-mini, yang menjadi tonggak baru dalam pengembangan kecerdasan buatan. Model ini dirancang untuk unggul dalam penalaran dan menyelesaikan masalah kompleks, khususnya di bidang matematika, sains, dan pemrograman. Peluncuran ini datang hanya empat bulan setelah perilisan GPT-4o, menambah deretan inovasi OpenAI dalam AI yang mampu berpikir lebih mendalam sebelum merespons sebuah masalah.

Proyek “Strawberry” Akhirnya Terwujud dalam OpenAI o1

Rumor mengenai proyek ini, yang diberi nama kode “Strawberry,” telah beredar sejak awal 2023. Bahkan CEO OpenAI, Sam Altman, sempat memberikan petunjuk pada bulan Agustus lalu melalui unggahan misterius tentang kebun stroberi di platform X (sebelumnya dikenal sebagai Twitter), yang memperkuat spekulasi bahwa OpenAI akan segera meluncurkan model AI yang mampu menangani masalah penalaran kompleks. Kini, rumor tersebut terbukti dengan dirilisnya o1 dan o1-mini, yang sebelumnya dikenal dengan kode Project Strawberry.

Dokumen internal yang diperoleh Reuters pada Mei 2024 mengungkapkan bahwa Project Strawberry akan menjadi model dengan kemampuan penalaran canggih yang mampu digunakan untuk penelitian mendalam, termasuk menavigasi internet secara otonom. Namun, pada kenyataannya, model o1 dan o1-mini belum mencapai tingkat otonomi sepenuhnya seperti yang diisukan, tetapi tetap memberikan lompatan besar dalam hal kemampuan penalaran.

Kemampuan o1 dan o1-mini: Penalaran di Tingkat Lanjut

Poin utama dari model o1 dan o1-mini adalah kemampuan penalaran yang jauh lebih unggul dibandingkan model-model sebelumnya. Model ini dilatih untuk berpikir lebih lama sebelum memberikan respons, dengan menggunakan berbagai strategi untuk menyelesaikan masalah dan memperbaiki kesalahan. Dengan kemampuan ini, model dapat memberikan jawaban yang lebih akurat, terutama untuk masalah-masalah yang memerlukan analisis mendalam seperti matematika, sains, dan pemrograman.

Sebagai contoh, dalam ujian kualifikasi Olimpiade Matematika Internasional (IMO), model o1 berhasil menyelesaikan 83% soal dengan benar, jauh melampaui performa GPT-4o yang hanya mampu menyelesaikan 13% soal. Ini menunjukkan bahwa o1 sangat kuat dalam menyelesaikan masalah kompleks di bidang STEM (Science, Technology, Engineering, Mathematics). Di sisi lain, o1-mini dioptimalkan untuk tugas-tugas pemrograman, menjadikannya pilihan yang tepat bagi pengembang yang membutuhkan bantuan dalam coding.

Bagaimana o1 Dibandingkan dengan GPT-4o?

Dibandingkan dengan GPT-4o, keunggulan o1 dan o1-mini terletak pada kemampuannya untuk berpikir lebih dalam sebelum memberikan jawaban. Proses pelatihan yang menekankan penalaran membuat model ini mampu mencoba berbagai pendekatan sebelum mencapai jawaban yang benar. Hal ini membuatnya sangat efektif untuk menyelesaikan masalah yang rumit di bidang matematika, sains, dan pemrograman.

Namun, perlu dicatat bahwa o1 masih merupakan model awal yang belum memiliki fitur-fitur lengkap seperti browsing internet atau kemampuan untuk mengunggah file dan gambar. Oleh karena itu, dalam penggunaan umum, GPT-4o masih lebih sesuai untuk permintaan yang tidak terlalu kompleks. OpenAI berencana untuk menambahkan lebih banyak fitur ke model o1 di masa mendatang, sehingga pengguna dapat memilih model yang paling sesuai untuk kebutuhan mereka.

Saat ini, pengguna ChatGPT Plus dan Teams dapat beralih antara model GPT-4o dan o1 melalui toggle di bagian kiri atas halaman ChatGPT. Untuk memudahkan pengguna, OpenAI juga sedang mengembangkan fitur yang memungkinkan ChatGPT secara otomatis memilih model terbaik berdasarkan permintaan pengguna.

Aksesibilitas dan Biaya

Model o1 dan o1-mini saat ini tersedia bagi pengguna ChatGPT Plus dan Teams, dengan batas mingguan 30 pesan untuk o1 dan 50 pesan untuk o1-mini. Pengguna ChatGPT Plus dapat mengakses model ini melalui toggle model picker di bagian kiri atas antarmuka ChatGPT mereka. Selain itu, pengembang yang memenuhi syarat untuk API tingkat 5 juga dapat menggunakan model ini dengan batas 20 permintaan per menit (RPM).

Sementara itu, pengguna ChatGPT Enterprise dan Edu akan mendapatkan akses ke model ini mulai minggu depan. Meski belum tersedia secara gratis, OpenAI berencana untuk merilis o1-mini ke semua pengguna gratis di masa mendatang. Bagi pengguna individu, ChatGPT Plus adalah cara terbaik untuk mengakses model ini, dengan biaya $20 per bulan per pengguna, yang juga mencakup akses prioritas ke model-model terbaru dan kemampuan untuk membuat GPT khusus.

Komitmen OpenAI terhadap Keamanan

Selain peningkatan kemampuan penalaran, OpenAI juga menekankan pentingnya keamanan dalam pengembangan model o1. Dalam tes keamanan yang dilakukan, model ini menunjukkan peningkatan signifikan dalam kemampuan untuk tetap mematuhi aturan keamanan, bahkan dalam skenario yang dirancang untuk mencoba melewati pembatasan tersebut. Dalam tes "jailbreaking", di mana model diuji untuk melihat apakah dapat dipaksa melanggar pedoman keamanan, o1 mencetak 84 poin dari skala 100, jauh lebih baik dibandingkan GPT-4o yang hanya mencetak 22 poin.

Sebagai bagian dari komitmen terhadap keamanan AI, OpenAI telah bekerja sama dengan pemerintah AS dan Inggris untuk menguji dan mengevaluasi model ini sebelum dirilis ke publik. Kerja sama ini juga melibatkan lembaga AI Safety Institutes, yang mendapatkan akses awal ke versi penelitian dari model ini untuk melakukan pengujian dan evaluasi lebih lanjut.

Kesimpulan: Masa Depan AI dengan o1

Peluncuran model o1 dan o1-mini menandai langkah besar dalam perkembangan AI, khususnya dalam hal penalaran dan penyelesaian masalah kompleks. Dengan kemampuan yang semakin canggih, model ini diharapkan dapat digunakan secara luas di berbagai bidang, mulai dari penelitian ilmiah hingga pengembangan aplikasi teknologi yang rumit.

Meskipun masih dalam tahap awal, model ini menunjukkan potensi besar untuk menjadi alat yang sangat berguna dalam memecahkan masalah yang kompleks di masa depan. OpenAI terus memperbarui dan menyempurnakan model ini untuk memastikan bahwa kemajuan dalam kemampuan AI selalu sejalan dengan standar keamanan tertinggi, memastikan bahwa AI dapat digunakan secara bertanggung jawab di berbagai industri.