Infomalangraya.com –
xAI, pesaing OpenAI yang didirikan oleh Elon Musk, telah memperkenalkan Grok versi pertama yang dapat memproses informasi visual. Grok-1.5V adalah model AI multimodal generasi pertama perusahaan, yang tidak hanya memproses teks, tetapi juga “dokumen, diagram, bagan, tangkapan layar, dan foto”. Dalam pengumuman xAI, ia memberikan beberapa contoh bagaimana kemampuannya dapat digunakan di dunia nyata. Anda dapat, misalnya, menunjukkan foto diagram alur dan meminta Grok menerjemahkannya ke dalam kode Python, memintanya menulis cerita berdasarkan gambar, dan bahkan menjelaskan meme yang tidak Anda pahami. Hei, tidak semua orang bisa mengikuti semua yang dilontarkan internet.
Versi baru ini hadir hanya beberapa minggu setelah perusahaan meluncurkan Grok-1.5. Model tersebut dirancang agar lebih baik dalam pengkodean dan matematika dibandingkan pendahulunya, serta mampu memproses konteks yang lebih panjang sehingga dapat memeriksa data dari lebih banyak sumber untuk lebih memahami pertanyaan tertentu. xAI mengatakan penguji awal dan pengguna lama akan segera dapat menikmati kemampuan Grok-1.5V, meskipun tidak memberikan waktu pasti peluncurannya.
Selain memperkenalkan Grok-1.5V, perusahaan juga telah merilis kumpulan data benchmark yang disebut RealWorldQA. Anda dapat menggunakan salah satu dari 700 gambar RealWorldQA untuk mengevaluasi model AI: Setiap item dilengkapi dengan pertanyaan dan jawaban yang dapat Anda verifikasi dengan mudah, tetapi mungkin membuat model multimodal seperti Grok bingung. xAI mengklaim teknologinya mendapat skor tertinggi ketika perusahaan mengujinya dengan RealWorldQA melawan pesaing, seperti GPT-4V OpenAI dan Google Gemini Pro 1.5.