Resmi Luncurkan Fitur AI Chameleon, Apakah Sebanding Dengan Gemini Pro dan GPT-4V ?
- PYMNTS.com
VIVAJabar – Meta kembali menghebohkan dunia teknologi dengan menghadirkan fitur teknologi berbasis AI terbaru yang disebut dengan AI Chameleon.
Sebelumnya, Meta telah memperkenalkan fitur AI terbaru yaitu AI Gemini. Fitur AI Chameleon ini diketahui sebanding dengan alat komersial seperti Gemini Pro dan GPT-4V.
Sebuah makalah yang membahas berbagai teknologi AI atau kecerdasan buatan menunjukkan bahwa Chameleon hadir dengan versi parameter 7 miliar dan 34 miliar, sehingga mampu mendeteksi dan paham terhadap gambar dan teks.
Chameleon juga bisa membuat kombinasi teks dan gambar (yang mungkin terkait satu sama lain) dan menghasilkan suatu arti yang penuh makna dan dapat dipahami, dilansir Tom’s Guide, menurut Meta.
Hal sederhana yang dapat kita pahami tentang fitur AI Chameleon ini yaitu ia dapat memberi saran dan menjawab ketika Anda bertanya mengenai bahan masakan yang ada di kulkas dan kira-kita apa yang bisa Anda masak dengan bahan-bahan tersebut.
Hal ini tidak mungkin terjadi pada generasi AI model lama dan menghadirkan open source lebih dekat ke model visi mainstream yang lebih tinggi dari OpenAI dan Google.
Setelah makalah tersebut dipublikasikan, tim Fundamental AI Research (FAIR) di Meta kini telah meluncurkan secara resmi model tersebut di publik untuk tujuan penelitian, meskipun masih ada beberapa keterbatasan.
Penulis makalah ini mengatakan bahwa kunci kesuksesan Chameleon adalah arsitektur yang sepenuhnya berbasis token.
Model belajar biasanya bisa mempertimbangkan antara gambar dan teks secara bersamaan. Hal ini tidak mungkin dilakukan pada model yang menggunakan encoder terpisah untuk setiap masukan.
Sehingga hal ini menjadi tantangan tersendiri bagi Meta, termasuk tantangan stabilitas pengoptimalan dan penskalaan.
Menurut peneliti, evaluasi manusia menunjukkan bahwa Chameleon lebih baik dan melampaui kinerja model fitur AI Gemini Pro dan GPT-4V ketika datang sebuah perintah atau keluaran menyertakan rangkaian campuran gambar dan teks.
Namun, hingga saat ini belum termasuk evaluasi infografis dan interpretasi grafis.