Dragon Naturally Speaking 10 : Le test impressionnant de la dictée vocale
Publié le 21 October 2008
L'idée de la reconnaissance vocale séduit, fait rêver ou fait peur. Les spécialistes de la question sont peu nombreux et Nuance qui publie le logiciel Dragon Naturally Speaking en fait partie. La 10ème évolution apporte un lot de nouveautés intéressantes, avec notamment une méthode d'apprentissage raccourcie, la possibilité de piloter (presque) tout un ordinateur à la voix et bien sûr de réels progrès sur la qualité de la reconnaissance. Un compte rendu écrit entièrement à la voix !
Par Bruno Orrù
Ce compte rendu n'aura pas été tapé au clavier mais dicté. Ce que vous lisez est donc uniquement le fruit d'une dictée vocale (un micro casque est fourni dans toutes les versions), avec ses corrections. En effet, il serait encore illusoire de croire que la dictée vocale ne débouche sur aucune faute de reconnaissance, quelque soit la cause. Pour autant, les corrections n'ont jamais été aussi aisées à corriger, il suffit de « lancer » l'ordre adéquat pour qu'une zone soit sélectionnée et effacée ou corrigée. Bien entendu une certaine habitude est nécessaire pour que l'exercice soit fluide et efficace. Néanmoins, la dictée vocale qui fut autrefois un vrai travail devient de plus en plus un exercice simple et abordable en quelques instants, y compris par des adolescents.
Mise en place raccourcie
L'un des éléments les plus épineux avec la reconnaissance vocale est l'étape de reconnaissance ; la première - mais pas l'unique - occasion pour que logiciel et humain fassent connaissance et apprennent à se reconnaître. En effet, si l'installation d'un logiciel de reconnaissance vocale passe immanquablement par une étape de lecture pour que le logiciel s'adapte au ton de voix, à l'accent, aux habitudes de locutions (l'argument marketing annonçant la disparition de cette étape est d'ailleurs limite mensonger car cette étape est cruciale pour une efficacité optimale), l'opposé est aussi vrai. Après une dictée d'une dizaine de minutes, c'est au tour de l'utilisateur de passer par une étape d'adaptation et pour apprendre les principales commandes.
De réels progrès de reconnaissance
La dictée vocale a longtemps nécessité de parler doucement, en ouvrant bien la bouche pour que les mots soient parfaitement reconnus. Avec la version 10, ces contraintes ont (presque) disparues. Nous avons lancé une session d'adaptation un soir, avec un testeur fatigué et légèrement enrhumé. Cela n'a pas été un problème particulier, les jours suivants la reconnaissance était optimale. Il faut dire que le logiciel propose également de scruter les documents présents dans l'ordinateur, notamment les fichiers Word mais aussi le contenu de votre messagerie. L'occasion de constater votre façon d'écrire et les tournures de phrases.
Autre point très important, il n'est plus nécessaire de parler en se forçant. Il suffit de parler normalement (un minimum distinctement quand même), à un rythme normal. Par contre, la mise en place d'un profil est réellement nécessaire si plusieurs personnes doivent utiliser le logiciel car une personne qui parle avec un profil qui n'est pas le sien n'aura vraiment pas de bons résultats.
Autre avancée notable, Dragon Naturally Speaking 10 gère nettement mieux qu'avant les bruits environnants. Plus besoin d'être recroquevillé, seul dans un coin en espérant qu'aucun oiseau lointain ne vienne polluer la quiétude de l'endroit. La démonstration opérée en conférence de presse dans un lieu réverbérant et passablement bruyant aura été une première démonstration éloquente. Mes tests domestiques auront apportés confirmation que la dictée est possible avec une famille continuant à vaquer à ses occupations sans trop d'interférences.
Un apprentissage nécessaire
La dictée en elle-même n'impose aucun ordre particulier hormis de placer une ponctuation ou de passer à la ligne. Par contre, la sélection d'un mot, d'un groupe de mot ou d'un paragraphe impose de connaître les ordres précis. Rassurez-vous, ces ordres sont d'une logique implacable. Voici un exemple.
Si vous voulez effacer un mot il faut d'abord le sélectionner et lancer l'ordre adéquat :
- Sélectionner Requis.
- Remplacer par Nécessaire
- Aller à adéquat (le dernier mot du paragraphe en cours)
Ou
- Sélectionne naturellement.
- Effacer
- Aller en bas (le bas de la page)
Les ordres sont des mots usuels et logiques. Il faut simplement les mémoriser pour que l'exercice soit rapide et efficace. Nuance précise d'ailleurs que la dictée vocale permet une accélération du travail d'écriture par trois, avec une dictée possible de 160 mots par minute. Il faut bien entendu rajouter le travail de correction ; mais celui-ci est également nécessaire en tapant sur le clavier (dans une proportion moindre pour ceux qui savent bien taper et qui connaissent leur grammaire et leur orthographe !).
Dictée, mail, messagerie instantanée, recherche Internet...
Les utilisations de Dragon Naturally Speaking peuvent être multiples. La dictée bien entendu, via un casque micro (ou un micro seul) mais aussi par l'intermédiaire d'un enregistreur vocale. D'ailleurs, pour les professionnels (les médecins et avocats surtout...) qui doivent prendre des notes durant une consultation, Nuance propose une version spécifique, Dragon Naturally Speaking 10 Preferred Mobile accompagnée d'un enregistreur numérique Philips 7630U. Une autre version « Wireless », destinée à d'autres catégories de professionnels est également disponible avec une oreillette bluetooth, permettant alors de retranscrire les conversations téléphoniques.
Il est également possible de donner l'ordre d'ouvrir l'application mail (tests réalisés avec Outlook), de donner l'identité du destinataire (nécessité ici de parler très distinctement pour la reconnaissance des noms propres) puis de dicter le mail... puis d'ordonner l'envoi.
Principe similaire avec la messagerie instantanée. Il est presque certain que vos interlocuteurs seront surpris par la rapidité de vos réponses (et la justesse de votre orthographe).
Enfin, signalons qu'il est également possible d'ordonner l'ouverture du navigateur, de citer un outils de recherche tel que Google ou Yahoo puis de lancer la recherche après énoncé du ou des mots clefs. Par contre, il faut être réaliste, le mode vocale trouve ici rapidement ses limites une fois arrivé sur la page recherchée. Bien qu'il soit possible de demander un glissement de page ou d'aller en bas / haut de page, il est alors bien plus efficace de reprendre la souris pour naviguer.
Relecture vocale
L'un des points les plus spectaculaires est de lancer la relecture d'un texte dicté. L'occasion de s'écouter parler car cette relecture lance un enregistrement sonore de la dictée ! Outre un travail possible sur la qualité de diction, c'est aussi l'occasion de constater les causes d'erreurs. Un bon moyen, certes un peu fastidieux, de s'auto corriger et éviter ainsi de reproduire des erreurs.
Dragon Naturally Speaking est proposé en trois versions principales.
La version de base s'adresse au grand public, aux étudiants... elle est proposée au prix de 99€
La version Preferred est proposée au prix de 199€.
La version Preferred Wireless est proposée au prix de 299€. Elle intègre en plus une oreillette Bluetooth Plantronics Calisto.
La version Preferred Mobile est proposée au prix de 299€. Elle intègre en plus un dictaphone numérique Philips.
Enfin, la version Professionnelle est proposée au prix de 956€ ; outre le dictionnaire général elle propose des dictionnaires spécialisés.
En conclusion
Dragon Naturally Speaking 10 est réellement bluffant par ses capacités d'adaptation et ses compétences d'interprétation du langage parlé (y compris sur des mots ou des phrases complexes), indépendamment du rythme de lecture, des intonations, des accents particuliers et, avec des limites, de la prise en compte de nuisances sonores. La généralisation de ce type de logiciel débouche immanquablement sur des questions de fond, notamment pour la sauvegarde de l'écriture, quelle soit manuscrite ou via un clavier. Quoi qu'il en soit Dragon Naturally Speaking 10 peut s'avérer d'une aide précieuse pour les personnes à handicap, pour accélérer des travaux de recopie, de dictée ou, pourquoi pas, d'accéder en grande partie, dès aujourd'hui, à ce rêve de piloter une machine à la voix.
Informations complémentaires :
http://www.nuance.fr/naturallyspeaking/products/whatsnew.asp