Lorsque Apple rachète la startup Siri en avril 2010, journalistes, experts en économie numérique et « fanboys » y voient un signe : le futur de l’informatique passera par la reconnaissance vocale. Le lancement, un an et demi plus tard, de l’iPhone 4S leur aura donné raison. L’assistant virtuel Siri attire alors tous les regards et semble, par son mélange de précision technique et d’humour geek, nous précipiter dans un futur de science fiction où les humains conversent naturellement avec les machines.
Cloud computing et reconnaissance vocale : deux révolutions pour le prix d’une
Le concept de reconnaissance vocale n’est pourtant pas nouveau : les chercheurs y travaillent depuis plus de 60 ans et les premières applications grand public sont apparues dès les années 80. La vraie nouveauté, outre l’apparition de machines toujours plus puissantes, vient de la généralisation de l’Internet et de l’explosion du cloud computing, qui permettent désormais d’analyser la voix à distance au travers de gigantesques serveurs. La reconnaissance vocale devient alors évolutive : chaque nouvelle requête disséquée par les algorithmes enrichit les bases de données, améliorant au passage l’intelligence artificielle du système.
L’autre apport du cloud computing, c’est la possibilité de décliner la reconnaissance vocale partout. Attendez-vous à voir se multiplier ces services, sur votre smartphone bien sûr, avec des applications comme Siri ou Dragon Go, mais aussi dans votre voiture (certains modèles de Ford reconnaissent jusqu’à 10.000 mots), votre cuisine ou encore sur votre télévision. Par ailleurs, nombreux sont les services client qui utilisent d’ores et déjà la reconnaissance vocale pour automatiser certaines demandes et le secteur médical y a, quant à lui, trouvé un précieux outil pour affiner les diagnostics.
Gros changements, gros enjeux
Reste que les questions autour de cette révolution en devenir ne manquent pas. A commencer par celui de l’accès à l’information. En effet, si la reconnaissance vocale devenait universelle, notre manière de chercher des renseignements changerait radicalement d’aujourd’hui, où elle repose en grande partie sur le texte. Utiliser un moteur de recherche sur Internet, c’est déjà être tributaire d’algorithmes et d’une certaine vision du monde — qu’en sera-t-il lorsque nous nous contenterons de parler sans réfléchir à notre télévision, qui interprétera librement nos requêtes ? Preuve qu’il s’agit là d’un enjeu primordial : Google a lancé la recherche vocale dès 2010 afin de préserver son hégémonie.
La guerre de la reconnaissance vocale qui se prépare ne doit pas occulter un autre combat tout aussi légitime : celui de la protection de la vie privée. Le stockage automatique de demandes parfois très intimes multiplie en effet les traces que nous laissons sur Internet. Si ces données restent anonymes, leur protection devra être la priorité numéro 1 des géants du secteur...
Une fois ces questions résolues, l’utilisation de systèmes de reconnaissance vocale pourrait être de plus en plus fluide, pour devenir un réflexe et accélérer notre entrée dans l’ère des interfaces naturelles...
Liens :
- Une brève histoire de la reconnaissance vocale (en Anglais)
- Le site de Nuance, pionnier et leader de la reconnaissance vocale
- Le site de Vlingo, autre assistant personnel disponible sur toutes les plateformes mobiles
Personnellement, je n'utilise pas la reconnaissance vocale, technologie que je considère encore comme immature. Elle est pour moi "un gadget pour amuser la galerie" simplement car de nos jours, elle est trop peu perfectionnée et même si nous verrons une reconnaissance vocale presque parfaite dans un avenir proche, je ne crois pas qu'elle aurait un succès total. Elle est trop peu discrète et donc ne convient pas dans tous les domaines. Pour moi, rien ne sera plus pratique que nos mouvement. En revanche, le contrôle par la pensée est très intéressant...
Bonjour Aina
Nous sommes bien d'accord avec l'immaturité de la reconnaissance vocale qui marche surement sur du matériel cher et couteux comme beaucoup d'autres apps qui servent à user les batteries très vite ainsi que les Mo.L'idée sur la pensé est intéressante mais demanderait une technologie qui puisse personnaliser le subjectif voir les sentiments,humeurs etc...Je ne suis pas sur facebook et c'est mon premier commentaire sur le collectif.J'aimerai ajouter ma photo pour personnaliser mon compte mais je n'y arrive pas.Si vous pouvez m'aider avant de communiquer par la pensée,merci !