Meta Luncurkan Model AI yang Bisa ‘Periksa’ AI Lainnya
Meta mengumumkan perilisan sejumlah model AI baru dari divisi risetnya.
REPUBLIKA.CO.ID, JAKARTA – Perusahaan induk Facebook, Meta, mengumumkan bahwa mereka telah merilis sejumlah model AI baru dari divisi risetnya, termasuk “Self-Taught Evaluator” yang berpotensi mengurangi keterlibatan manusia dalam proses pengembangan AI. Model ini diperkenalkan melalui makalah yang dirilis pada Agustus lalu, di mana perusahaan raksasa teknologi tersebut menjelaskan bahwa model terbarunya menggunakan teknik “chain of thought” yang serupa dengan model terbaru OpenAI.
Teknik itu dapat memecah masalah kompleks menjadi langkah-langkah kecil yang logis, sehingga meningkatkan akurasi respons terutama dalam bidang-bidang seperti sains, pemrograman, dan matematika. Yang menarik, model evaluator ini dilatih sepenuhnya menggunakan data yang dihasilkan oleh AI, tanpa campur tangan manusia.
Kemampuan AI untuk mengevaluasi AI lainnya secara mandiri menawarkan langkah awal menuju terciptanya agen AI otonom yang mampu belajar dari kesalahannya sendiri. Banyak pakar di bidang AI membayangkan agen tersebut sebagai asisten digital yang cukup cerdas untuk melakukan berbagai tugas tanpa campur tangan manusia.
Model yang mampu meningkatkan diri sendiri dapat mengurangi kebutuhan akan proses yang sering kali mahal dan tidak efisien yang digunakan saat ini, yakni Reinforcement Learning from Human Feedback. Proses itu membutuhkan masukan dari annotator manusia yang harus memiliki keahlian khusus untuk melabeli data secara akurat dan memverifikasi bahwa jawaban dari pertanyaan matematika dan penulisan yang rumit sudah benar.
“Kami berharap, seiring dengan semakin meningkatnya kemampuan AI menjadi super-human, AI akan menjadi semakin baik dalam memeriksa pekerjaannya, sehingga ia akan menjadi lebih baik daripada manusia pada umumnya,” ujar Jason Weston, salah satu peneliti, seperti dilansir Reuters, Ahad (20/10/2024).
“Gagasan tentang AI yang bisa otodidak dan mampu mengevaluasi diri sendiri pada dasarnya sangat penting bagi untuk mencapai level super-human,” ujar Weston.
Perusahaan lain termasuk Google dan Anthropic juga telah mempublikasikan penelitian tentang konsep RLAIF atau Reinforcement Learning from AI Feedback. Tidak seperti Meta, perusahaan-perusahaan tersebut cenderung tidak merilis model mereka untuk penggunaan publik.
Alat AI lainnya yang dirilis oleh Meta pada kesempatan ini termasuk pembaruan pada pada mod identifikasi gambar Segment Anything, sebuah alat yang mempercepat waktu pembuatan respons LLM dan dataset yang dapat digunakan untuk membantu menemukan material anorganik baru.