LLaVA est un modèle de reconnaissance développé par Microsoft et rendu Open Source depuis mai 2023.
- Éditeur 👉 Microsoft
- Modèle 👉 LLaVA
- Date de sortie 👉 Mai 2023
- Interface 👉 API ou en local
Une démo est disponible en ligne 👉 https://llava.hliu.cc/
C’est un bon compromis à GPT4-V si l’on a une grosse volumétrie car le modèle est déployable dans sa propre infrastructure.
Utilisation
À travers l’interface web de démo, il est possible d’envoyer des images et d’interroger le modèle.
LLaVA est capable de décrire très précisément une image.