Zaion Speech

Les outils de transcription propriétaires qui font progresser l'état de l'art mondial.

Transcription de haute qualité

Les outils de transcription développés par les ingénieurs du Zaion Lab sont basés  sur des architectures neuronales complexes permettant une représentation précise des caractéristiques vocales et sémantiques de la parole, ce qui leur permet d’atteindre un taux d’erreur mot (WER) très faible et donc un niveau de précision très haut, dépassant les outils du marché.

 

En temps réel ou en asynchrone

Qui dit conversation, dit forcément instantanéité ! Notre outil de transcription est conçu pour répondre en temps réel, c’est à dire en moins de 200ms  permettant ainsi une conversation fluide avec un bot vocal.

Il est tout à fait possible de l’utiliser en mode asynchrone pour des applications non instantanées. Le temps de réponse, dans ce cas, représenterait un tiers de la durée de l’enregistrement (en moyenne).

 

Reconnaissance des formats de données spécifiques

Les interactions des services clientèle comportent souvent des formats de données spécifiques (différents formats de numéro de client, plaque d’immatriculation…) et très peu présents dans les jeux de données utilisés pour l’apprentissage des modèles : des références alphanumériques, une épellation de noms et prénoms, des adresses, etc.. L’absence de ces formats dans la phase d’apprentissage des modèles large vocabulaire explique leur performance insatisfaisante.

Nous avons développé des modèles combinant une architecture technique performante et une forte expertise métier pour reconnaître ces patterns. Le résultat est bluffant : Zaion speech reconnaît plus de 87% des références alphanumériques les plus complexes et même les plaques d’immatriculation françaises ou belges… et du premier coup ! Ce qui rend la phase d’identification du client fluide et naturelle .

 

Technologie adaptée aux spécificités des conversations

« Nous tous qui pratiquons la conversation savons bien qu’il y a malgré tout des « ratés » dans le système : nos interlocuteurs n’ont pas nécessairement fini de parler au moment où nous le croyons, et ils n’attendent pas toujours que nous ayons nous-même fini pour prendre la parole. » Candace WEST, Genre, langage et conversation

Les conversations humaines sont souvent ponctuées par des dynamiques sociales de dialogue comme l’interruption ou le chevauchement. Bien que l’oreille humaine soit familière à ce type de comportement, il s’agit d’un réel challenge pour les outils de reconnaissance de la parole.

Zaion speech est pensé et conçu pour être robuste face à ces situations. La gestion des chevauchements, des onomatopées, des hésitations et autres comportements conversationnels est une fonctionnalité native de l’outil.

 

Robustesse face aux bruits et aux signaux téléphoniques de mauvaise qualité

De la même manière qu’un signal téléphonique détérioré rend la parole inintelligible pour l’oreille humaine, la performance des outils de reconnaissance de la parole dépend fortement de la qualité du signal.

Notre méthodologie d’apprentissage contraint le système à reconnaitre la parole indépendamment des distorsions du signal.