Cette catégorie d'outils permet d'extraire un texte ou une conversation depuis un enregistrement audio.
Cette méthode se nomme le Speech-to-text
Cette catégorie d'outils est très utile pour récupérer un format texte afin de l'utiliser dans un outil de génération de texte par exemple.
Whisper est un modèle de Speech-to-text développé par OpenAI.
Il est capable de reconnaitre et d'extraire le texte depuis des dizaines de langues différentes.
Découvrir 👉 Notre guide Whisper
Deepgram est une plateforme spécialisée dans le Speech-to-text.
Ils développent notamment le modèle Nova qui est le plus rapide du marché, ce qui est très important pour réduire la latence dans les application temps réel type téléphonie.
Découvrir 👉 Notre guide Deepgram
GenAI est un site français à propos des avancées technologiques dans le monde de l'intelligence artificielle.
© Copyright CC-BY-SA 2023-2024 gen-ai.fr