Lecture : 4 min

Quand la voix reprend le dessus

L’engouement pour les applications de messagerie instantanée est peut-être bien le dernier triomphe de l’écrit sur la voix. Les progrès de la reconnaissance vocale, que tout un chacun peut expérimenter en interpellant Siri ou Cortana sur son smartphone ou en utilisant Google Now, redonnent de la crédibilité aux interfaces vocales qui n’ont jamais réussi à s’imposer dans l’univers du micro-ordinateur et dans les applications bureautiques. Combien de gens savent que leur PC ou leur Mac est par défaut équipé d’un système de reconnaissance vocale ? Et parmi ceux qui le savent, combien ont seulement essayé de l’activer ? Assurément très peu…

Des progrès très rapides

Il a fallu l’irruption du smartphone et des assistants personnels adossés à un début d’intelligence artificielle pour que l’idée d’interagir avec les machines par la voix prenne un coup de jeune et entre enfin dans notre quotidien. Pourquoi « enfin » ? Parce que, même si nous tapons nos SMS ou nos messages Whatsapp à la vitesse de l’éclair sur nos écrans tactiles, communiquer par la voix est encore plus simple ! A condition bien sûr que la reconnaissance vocale et les fonctions speech-to-text soient fiables. Il se trouve qu’elles le sont de plus en plus, sinon parfaitement. Par exemple, à la dernière AI Frontiers Conférence (janvier 2017), Google a annoncé que le taux d’erreur de son logiciel de reconnaissance vocale avait baissé de 30 % depuis 2012. Cela ne nous dit pas de combien il est aujourd’hui, mais on sait qu’il était de 8 % en 2015. En octobre 2016, Microsoft annonçait pour sa technologie de reconnaissance vocale un taux d’erreur de compréhension de seulement 5,9 %, comparable à celui d’un humain (mais seulement en anglais).

 

Le search fait sa mue vocale…

Comme le nombre de requêtes sur mobile explose et a dépassé en 2015 celles faites sur ordinateur, c’est assez logiquement dans le domaine du search que la commande vocale gagne du terrain. Au lieu de taper votre requête dans Google, vous dites maintenant OK Google pour réveiller Google Now et vous « lui » parlez – chose que vous pouvez faire sans risque en conduisant, en marchant dans la rue ou en éminçant des oignons dans votre cuisine. Le nombre de commandes/demandes vocales que comprend Google Now ne cesse de s’étendre (voir ici). Bien entendu, il sait appeler vos correspondants, ouvrir vos applications, convertir des devises et calculer à la volée, et encore plein d’autres choses que vous faisiez avant avec vos petits doigts (et accessoirement, avec votre cerveau…).

Tout cela ne paraît déjà plus très nouveau. Mais ce n’est qu’un début, vous vous en doutez. Avec des IA de plus en plus performantes couplées à la reconnaissance vocale, les requêtes pourront être de plus en plus sophistiquées. Voici les exemples donnés par Google lors de l’AI Frontiers Conference :

Google Queries.jpg

 

Quand nous ne ferons plus que donner des ordres…

Là, vous commencez à entrevoir ce qui dessine et ce qui se joue véritablement au niveau des assistants personnels de vos smartphones que vous piloterez à la voix : vous donnerez les ordres et ce sont eux qui interagiront à votre place avec vos objets connectés – système de chauffage, bouilloire, télé, réfrigérateur (depuis le temps qu’on en parle !!!), voiture et autres. Vu le nombre de machins et machines connectés et interconnectées qu’on nous annonce depuis quelques années, il est clair que nous aurons tous besoin d’un assistant général très-très dévoué – et totalement dénué de mouvements d’humeur – pour maîtriser cet écosystème. Bien sûr, cet assistant prendra des initiatives à notre place – sur nos achats, nos placements, l’organisation de soirée… – et nous demandera simplement si nous sommes d’accord. Pas besoin d’être grand clerc pour comprendre l’intérêt – pour Google, Amazon, Apple & Co – d’occuper cette position stratégique, au plus près du consommateur et au cœur de ses interactions.

Enfin, il va de soi que, connaissant nos petites affaires sur le bout des doigts, nos assistants dévoués se chargeront d’appeler les services clients à notre place et régleront les éventuels problèmes en dialoguant avec d’autres robots.

 

Qu’est-ce qui, dans les lignes qui précèdent, relève encore de la fiction ?

C’est difficile à dire. Ce n’est pas du côté des technologies de reconnaissance vocale, de speech-to-text et d’intelligence artificielle que le scénario est improbable. Il suffit d’avoir vu et écouté ces deux enceintes connectées (Google Home) dialoguer en direct pendant des heures les 6 et 7 janvier dernier pour prendre la mesure des progrès et de la grande convergence qui s’amorce. En les observant, on a eu des doutes sur leur capacité à apprendre puisque, régulièrement, elles se demandaient mutuellement leur nom… Mais elles se parlaient réellement !

Non, c’est plutôt du côté de la maison et des autres objets connectés que ça coince : les gadgets connectés ne trouvent pas preneur (plutôt une bonne nouvelle) et on a tendance à réfléchir un peu avant de transformer de fond en comble son petit chez soi et tout ce qu’il contient pour profiter des merveilleux bienfaits annoncés de la maison connectée et pilotable par IA…

Quandlavoixreprendledessus2.png

 

Patrice est Directeur Marketing chez Diabolocom. Ingénieur et marketeur, il couvre à la fois des sujet technique et métiers.