Automatic Speech Recognition

Les meilleurs outils de transcription et de reconnaissance vocale
pour la Relation Client en français

Transcription
de haute qualité

Les outils de transcription développés par les ingénieurs de la Zaion AI & Data Factory sont basés sur des architectures neuronales complexes permettant une représentation précise des caractéristiques vocales et sémantiques de la parole, ce qui leur permet d’atteindre un taux d’erreur mot (WER) très faible et donc un niveau très haut de précision dépassant les outils du marché.

En temps réel
ou en asynchrone

Qui dit conversation, dit forcément instantanéité ! Notre outil de transcription est conçu pour répondre en temps réel, c’est-à-dire en moins de 200ms, permettant ainsi une conversation fluide avec un bot vocal. Ceci est également vrai pour les besoins d’assistance aux téléconseillers en temps réel.

Il est tout à fait possible de l’utiliser en mode asynchrone pour des applications non-instantanées. Le temps de réponse, dans ce cas, représenterait un tiers de la durée de l’enregistrement (en moyenne).

Formats spécifiques

Les interactions des services clients comportent souvent des formats de données spécifiques et très peu présents dans les jeux de données utilisés pour l’apprentissage des modèles : références alphanumériques, une épellation de noms/prénoms, adresses, etc. L’absence de ces formats dans la phase d’apprentissage des modèles large vocabulaire explique leur performance insatisfaisante.

Les modèles Zaion combinent une architecture technique performante et une forte expertise métier pour reconnaître ces patterns. Résultat ? L'ASR Zaion reconnaît du premier coup plus de 90% des références alphanumériques les plus complexes. Ce qui rend la phase d’identification du client fluide et naturelle.

Robustesse
face aux bruits

De la même manière qu’un signal téléphonique détérioré rend la parole inintelligible pour l’oreille humaine, la performance des outils de reconnaissance de la parole dépend fortement de la qualité du signal.

Notre méthodologie d’apprentissage contraint le système à reconnaitre la parole indépendamment des distorsions du signal.

Transcription ponctuée

Dans un système de reconnaissance de la parole, la ponctuation et la mise en forme automatique sont essentielles.

La ponctuation clarifie la structure du discours et facilite la compréhension, tandis que la mise en forme automatique assure une présentation cohérente et accessible du texte.
Ensemble, ces éléments garantissent une transcription précise et une meilleure lisibilité.

Speaker Diarization

Dans un système de reconnaissance de la parole, il est crucial de séparer les voix des différents locuteurs. Cela aide le système à produire des transcriptions plus précises et faciles à comprendre.

En distinguant qui dit quoi, on évite les confusions et on assure une meilleure compréhension du contenu.

PII Redaction

Notre algorithme unique d'anonymisation des données conversationnelles téléphoniques est indispensable pour protéger la confidentialité des informations personnelles échangées lors des appels.

En supprimant les données sensibles triées par classes telles que les noms et les numéros de téléphone, il garantit la conformité aux réglementations sur la protection des données conformément au RGPD.