Jakarta – Raksasa teknologi asal Tiongkok, Alibaba, kembali mengguncang dunia dengan peluncuran model bahasa besar teranyar yang dinamai QwQ-32B-Preview. Model kecerdasan buatan ini dikembangkan oleh tim AI Alibaba yang dikenal dengan nama Qwen, dan difokuskan pada peningkatan kemampuan penalaran logis serta pemecahan masalah yang lebih canggih.
QwQ-32B-Preview mengusung 32,5 miliar parameter dan mampu memproses hingga 32.000 kata. Parameter dalam model AI adalah variabel internal yang dipelajari selama pelatihan, dan jumlah parameter yang lebih tinggi biasanya menunjukkan tingkat akurasi yang lebih baik serta kemampuan untuk menangani tugas yang lebih kompleks.
Berdasarkan hasil pengujian, QwQ-32B-Preview menunjukkan performa yang lebih unggul dibandingkan model AI sejenis seperti o1-preview dan o1-mini dari OpenAI. Kedua model ini juga dikenal memiliki kemampuan penalaran yang baik.
Model AI ini diklaim mampu memecahkan teka-teki logika dan menjawab pertanyaan matematika yang rumit. Namun, meskipun memiliki keunggulan, QwQ-32B-Preview masih menghadapi beberapa tantangan. Menurut Alibaba, model ini dapat tiba-tiba beralih bahasa, mengalami kemacetan, dan menunjukkan kinerja yang kurang optimal saat menjalankan perintah yang memerlukan penalaran akal sehat.
Salah satu keunggulan QwQ-32B-Preview adalah kemampuannya untuk memeriksa fakta secara mandiri, sehingga dapat meminimalisasi kesalahan yang biasanya terjadi pada model AI lainnya. Proses ini mirip dengan yang dilakukan oleh o1-preview dan o1-mini, di mana model merencanakan jawaban terlebih dahulu dan kemudian memeriksa ulang hasilnya. Meskipun menambah waktu pemrosesan, langkah ini meningkatkan akurasi model.
QwQ-32B-Preview tersedia secara terbuka dan dapat diunduh melalui platform pengembangan AI, Hugging Face. Model ini dirilis dengan lisensi Apache 2.0, yang memungkinkan adopsi untuk aplikasi komersial. Namun, saat ini Alibaba baru merilis beberapa komponen dalam mode preview, sehingga pengembang belum dapat mengadopsinya secara penuh. Peluncuran versi stabilnya diperkirakan akan dilakukan pada akhir tahun ini.
Sementara itu, OpenAI, induk dari ChatGPT, juga telah merilis model AI baru bernama “o1” pada Kamis (12/9/2024). Model ini merupakan langkah maju OpenAI dalam mengembangkan kecerdasan buatan dengan kemampuan penalaran yang lebih manusiawi. Model o1 dan versi lebih ringannya, o1-mini, dirancang untuk menyempurnakan proses berpikir, mencoba berbagai strategi, dan mengenali kesalahan.
Model o1 dilatih menggunakan algoritma pengoptimalan baru dan kumpulan data pelatihan yang dirancang khusus. Berbeda dengan model GPT sebelumnya yang hanya memprediksi urutan kata, model o1 dilatih untuk memecahkan masalah secara mandiri menggunakan teknik “Reinforcement Learning”. Metode ini didasarkan pada penghargaan atas perilaku yang diinginkan dan/atau hukuman untuk yang tidak diinginkan.
Hasil pengujian menunjukkan bahwa model o1 lebih akurat dalam mengatasi masalah rumit, seperti pemrograman dan matematika, dibandingkan pendahulunya. Dalam ujian kualifikasi Olimpiade Matematika Internasional, model o1 memperoleh skor 83 persen, jauh lebih tinggi dibandingkan GPT4-o yang hanya menyelesaikan 13 persen soal dengan benar.
Dalam kompetisi pemrograman daring Codeforces, model o1 mencapai persentil ke-89, menunjukkan performa yang lebih baik dibandingkan 89 model AI lainnya dalam kelompok yang sama. OpenAI mengklaim bahwa pembaruan berikutnya dari model ini akan bekerja “mirip dengan mahasiswa PhD” dalam tugas-tugas menantang di bidang fisika, kimia, dan biologi.