Outils de reconnaissance audio - Generative AI France

gen-ai.fr

5 novembre 2023

Outils de reconnaissance audio

Cette catégorie d'outils permet d'extraire un texte ou une conversation depuis un enregistrement audio.

Cette méthode se nomme le Speech-to-text

Cette catégorie d'outils est très utile pour récupérer un format texte afin de l'utiliser dans un outil de génération de texte par exemple.

Whisper

Whisper est un modèle de Speech-to-text développé par OpenAI.

Il est capable de reconnaitre et d'extraire le texte depuis des dizaines de langues différentes.

Découvrir 👉 Notre guide Whisper

Deepgram

Deepgram est une plateforme spécialisée dans le Speech-to-text.

Ils développent notamment le modèle Nova qui est le plus rapide du marché, ce qui est très important pour réduire la latence dans les application temps réel type téléphonie.

Découvrir 👉 Notre guide Deepgram

CATEGORIES

DERNIERS POSTS DU BLOG

Chain of thought, the Swiss army knife of the Prompt Engineer

Lire

Chaine de pensée, le couteau suisse du Prompt Engineer

Lire

Le futur du métier d’UI Designer avec l’IA

Lire

TAGS

GenAI est un site français à propos des avancées technologiques dans le monde de l'intelligence artificielle.

Newsletter