Plutôt que d’héberger soit-même les différents modèles de GenAI, il est possible de les utiliser depuis des plateformes cloud.

Ce type de plateforme héberge des modèles de tout types (texte, code, image, son, etc) et fournit l’infrastructure pour les utiliser dans des application au travers d’API.

Ces API sont généralement appelés « API d’inférence ».

Hugging Face

HuggingFace est la référence en terme de GenAI Open Source. (le « Github de l’IA »)

Leur plateforme héberge des centaines de modèles différents (publiquement ou non) utilisables pour tout types de tâches:

Il est également possible d’héberger des applications entières sur leur plateforme. Ces applications sont ensuite accessible à des utilisateurs.

Découvrir 👉 Notre guide Hugging Face

Replicate

Replicate propose des service d’hébergement de modèles et d’interrogation de ces derniers via une API d’inférence.

Ici encore il est possible d’héberger ses propres modèles publiquement ou de manière privée.

A noter que Replicate fournit aussi des outils pour entraîner des modèles existants qui le permettent comme LlaMa 2.

Découvrir 👉 Notre guide Replicate

Trending