LLaVA est un modèle de reconnaissance développé par Microsoft et rendu Open Source depuis mai 2023.

  • Éditeur 👉 Microsoft
  • Modèle 👉 LLaVA
  • Date de sortie 👉 Mai 2023
  • Interface 👉 API ou en local

Une démo est disponible en ligne 👉 https://llava.hliu.cc/

C’est un bon compromis à GPT4-V si l’on a une grosse volumétrie car le modèle est déployable dans sa propre infrastructure.

Utilisation

À travers l’interface web de démo, il est possible d’envoyer des images et d’interroger le modèle.

LLaVA est capable de décrire très précisément une image.

Trending