LLaVA est un modèle de reconnaissance développé par Microsoft et rendu Open Source depuis mai 2023.
Une démo est disponible en ligne 👉 https://llava.hliu.cc/
C'est un bon compromis à GPT4-V si l'on a une grosse volumétrie car le modèle est déployable dans sa propre infrastructure.
À travers l'interface web de démo, il est possible d'envoyer des images et d'interroger le modèle.
LLaVA est capable de décrire très précisément une image.
GenAI est un site français à propos des avancées technologiques dans le monde de l'intelligence artificielle.
© Copyright CC-BY-SA 2023-2024 gen-ai.fr