Infomalangraya.com –
OpenAI telah mulai mempratinjau alat baru yang disebut operator yang dapat menavigasi di dalam browser web. Menurut posting blog yang diterbitkan Kamis, perangkat lunak ini ditenagai oleh apa yang perusahaan sebut sebagai agen penggunaan komputer. “CUA dilatih untuk berinteraksi dengan antarmuka pengguna grafis (GUI) – tombol, menu, dan bidang teks yang dilihat orang di layar – seperti halnya manusia,” kata Openai dari model. “Ini memberikan fleksibilitas untuk melakukan tugas digital tanpa menggunakan API khusus OS atau web.“
Rilis operator saat ini dibangun di atas model GPT-4O Openai. Ini menggabungkan kemampuan penglihatan dari algoritma itu dengan “penalaran lanjutan” yang dilatih melalui pembelajaran penguatan. Operator memiliki kemampuan untuk “memecah tugas menjadi rencana multi-langkah dan secara adaptif mengoreksi diri ketika tantangan muncul.” Menurut Openai, kemampuan itu mewakili tahap selanjutnya dalam pengembangan AI.
Seperti halnya pratinjau penelitian sebelumnya, Openai memperingatkan bahwa operator “masih lebih awal dan memiliki keterbatasan,” dan bahwa itu belum akan “melakukan dengan andal dalam semua skenario dulu.” Misalnya, tergantung pada kompleksitas tugas dan antarmuka yang terlibat, agen sangat bermanfaat dari pengguna yang mengambil beberapa momen tambahan untuk menulis prompt yang lebih rinci. Per VergeOperator akan memberikan kontrol pengguna jika macet pada suatu tugas. Ini juga akan menyerahkan kontrol setiap kali situs web meminta informasi sensitif, termasuk kredensial login. Perusahaan mengatakan itu merancang alat untuk “menolak permintaan berbahaya dan memblokir konten yang tidak diizinkan.”
OpenAI membuat operator pertama tersedia untuk pengguna berlangganan ChatGPT Pro $ 200 per bulan. Ini juga bermitra dengan perusahaan seperti Instacart untuk menawarkan agen di platform mereka, meskipun di sana Anda membutuhkan langganan Chatgpt Pro untuk menguji integrasi.
Operator bergabung dengan daftar agen AI yang berkembang yang dapat menavigasi browser web atau seluruh sistem operasi. Antropik adalah yang pertama menawarkan kemampuan dengan rilis model Sonnet Claude 3.5 pada bulan Oktober, diikuti baru -baru ini oleh Google dengan model Gemini 2.0 dan Project Mariner.
Jika Anda membeli sesuatu melalui tautan di artikel ini, kami dapat memperoleh komisi.