Resmi Luncurkan Fitur AI Chameleon, Apakah Sebanding Dengan Gemini Pro dan GPT-4V ?

Meta Apple
Sumber :
  • PYMNTS.com

Penulis makalah ini mengatakan bahwa kunci kesuksesan Chameleon adalah arsitektur yang sepenuhnya berbasis token. 

Model belajar biasanya bisa mempertimbangkan antara gambar dan teks secara bersamaan. Hal ini tidak mungkin dilakukan pada model yang menggunakan encoder terpisah untuk setiap masukan.

Sehingga hal ini menjadi tantangan tersendiri bagi Meta, termasuk tantangan stabilitas pengoptimalan dan penskalaan. 

Menurut peneliti, evaluasi manusia menunjukkan bahwa Chameleon lebih baik dan melampaui kinerja model fitur AI Gemini Pro dan GPT-4V ketika datang sebuah perintah atau keluaran menyertakan rangkaian campuran gambar dan teks.

Namun, hingga saat ini belum termasuk evaluasi  infografis dan interpretasi grafis.