Model o3 generasi berikutnya dari OpenAI akan tiba awal tahun depan

TEKNOLOGI114 Dilihat
Infomalangraya.com –

Setelah hampir dua minggu pengumuman, OpenAI mengakhiri seri livestream 12 Hari OpenAI dengan pratinjau model frontier generasi berikutnya. “Untuk menghormati teman-teman di Telefónica (pemilik jaringan seluler O2 di Eropa), dan dalam tradisi besar OpenAI yang benar-benar buruk dalam menyebutkan nama, ini disebut o3,” CEO OpenAI Sam Altman mengatakan kepada mereka yang menonton pengumuman di YouTube .

Model baru ini belum siap untuk digunakan publik. Sebaliknya, OpenAI pertama-tama menyediakan o3 bagi para peneliti yang membutuhkan bantuan dalam pengujian keamanan. OpenAI juga mengumumkan keberadaan o3-mini. Altman mengatakan perusahaan berencana untuk meluncurkan model tersebut “sekitar akhir Januari,” dan o3 menyusul “segera setelah itu.”

Seperti yang mungkin Anda harapkan, o3 menawarkan peningkatan kinerja dibandingkan pendahulunya, namun seberapa jauh lebih baik dari o1 adalah fitur utama di sini. Misalnya, saat mengikuti Ujian Matematika Undangan Amerika tahun ini, o3 mencapai skor akurasi 96,7 persen. Sebaliknya, o1 memperoleh peringkat yang lebih sederhana yaitu 83,3 persen. “Hal ini menandakan bahwa o3 sering kali melewatkan satu pertanyaan saja,” kata Mark Chen, wakil presiden senior penelitian di OpenAI. Faktanya, o3 bekerja dengan sangat baik pada rangkaian tolok ukur yang biasa digunakan OpenAI pada modelnya sehingga perusahaan harus menemukan pengujian yang lebih menantang untuk dijadikan tolok ukur.

Tes ARC AGI.Tes ARC AGI.

ARC AGI

Salah satunya adalah ARC-AGI, sebuah benchmark yang menguji kemampuan algoritme AI untuk melakukan intuisi dan belajar saat itu juga. Menurut pembuat tes tersebut, organisasi nirlaba ARC Prize, sistem AI yang berhasil mengalahkan ARC-AGI akan mewakili “tonggak penting menuju kecerdasan umum buatan”. Sejak debutnya pada tahun 2019, belum ada model AI yang bisa mengalahkan ARC-AGI. Tes ini terdiri dari pertanyaan input-output yang dapat dipecahkan secara intuitif oleh kebanyakan orang. Misalnya, pada contoh di atas, jawaban yang benar adalah membuat kotak dari empat poliomino menggunakan balok biru tua.

Pada pengaturan komputasi rendah, o3 mencetak skor 75,7 persen pada tes tersebut. Dengan tambahan kekuatan pemrosesan, model ini memperoleh rating 87,5 persen. “Performa manusia sebanding pada ambang batas 85 persen, jadi berada di atas ambang batas ini merupakan sebuah pencapaian besar,” menurut Greg Kamradt, presiden ARC Prize Foundation.

Grafik yang membandingkan performa o3-mini dengan o1, dan biaya performa tersebut. Grafik yang membandingkan performa o3-mini dengan o1, dan biaya performa tersebut.

OpenAI

OpenAI juga memamerkan o3-mini. Model baru ini menggunakan API Waktu Berpikir Adaptif OpenAI yang baru-baru ini diumumkan untuk menawarkan tiga mode penalaran berbeda: Rendah, Sedang, dan Tinggi. Dalam praktiknya, hal ini memungkinkan pengguna untuk menyesuaikan berapa lama perangkat lunak “berpikir” tentang suatu masalah sebelum memberikan jawaban. Seperti yang dapat Anda lihat dari grafik di atas, o3-mini dapat mencapai hasil yang sebanding dengan model penalaran o1 OpenAI saat ini, namun dengan biaya komputasi yang lebih murah. Seperti disebutkan, o3-mini akan hadir untuk penggunaan umum sebelum o3.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *