Maximiser les avantages de la voix

Les trois avantages dont on vous parlait dans notre précédent billet de blog – simplicité, densité informationnelle et intensité émotionnelle – font de la voix un canal de grande valeur pour toute marque voulant être proche et à l’écoute de ses clients. Mais c’est aussi un canal extrêmement exigeant, notamment en termes d’organisation : si vous voulez offrir un haut niveau de service, vous devez à tout moment avoir sur le pont suffisamment d’agents pour répondre au flux d’appels dans de bonnes conditions, tant pour les clients que pour les agents. L’analyse des données de trafic de votre solution de gestion d’appels doit vous permettre d’identifier les pics et les creux d’activité et vous aider à dimensionner vos équipes en conséquence, de la manière la plus fine possible. C’est la première condition pour éviter aussi bien le sur-staffing qui peut se révéler rapidement très onéreux, que le sous-staffing qui se traduit inévitablement par une augmentation des temps d’attente et une montée de l’insatisfaction chez vos clients.

 

La formation et l’outillage des agents

Sur le canal voix, tout se passe par définition en temps réel. Les conseillers doivent être capables d’apporter des réponses claires et précises à une grande diversité de demandes et de situations. Pour cela, il faut non seulement qu’ils maîtrisent les codes comportementaux de la communication « live », mais aussi que leur outil de travail leur fournisse toutes les informations dont ils peuvent avoir besoin pour comprendre la demande du client et y répondre de manière appropriée – c’est-à-dire personnalisée, rapide et complète. C’est impossible si les informations sont dispersées dans de multiples bases de données auxquelles ils n’ont pas directement accès. C’est tout l’enjeu de l’intégration du système de gestion des communications entrantes avec le CRM  de l’entreprise ou avec le back-office d’un site e-commerce.

 

De nouvelles avancées pour optimiser le canal voix

D’autre part, la dimension émotionnelle pouvant être très violente pour les conseillers, l’accompagnement de ces derniers par leur manager ou superviseur revêt beaucoup d’importance. Cet accompagnement ne se fait plus seulement a posteriori, lors des séances de débrief et de réécoute d’enregistrements. Typiquement, la fonction de soufflage permet au superviseur de guider en temps réel un conseiller aux prises avec un client particulièrement difficile.

Il est possible d’aller beaucoup plus loin dans l’accompagnement individuel et collectif grâce aux progrès phénoménaux des techniques de speech-to-text et d’analyse automatique de la voix et de ses intonations. La transcription et l’analyse automatiques des échanges vocaux permettent de mesurer de manière beaucoup plus fiable et fine la teneur et la qualité des échanges, ainsi que le niveau de tension générale associé à un call center ou à une équipe – non seulement a posteriori, mais aussi en temps réel. Par exemple, des moteurs logiciels peuvent désormais analyser la tonalité de la voix, le vocabulaire employé et les autres composantes d’un échange vocal pour détecter et quantifier le niveau de tension du client ou de l’agent. Il devient ainsi possible d’associer à chaque appel en cours un emojis attirant l’attention du superviseur sur les conversations où son assistance est requise.

 

De la voix humaine à la voix artificiellement humaine

Il n’a échappé à personne que les géants du digital sont actuellement engagés dans une bataille mondiale pour imposer leurs assistants vocaux et les installer au cœur de nos vies, en partant du principe que la voix est l’interface la plus naturelle et la plus évidente, non seulement pour interagir avec des machines et des objets, mais aussi pour interagir avec les personnes. Le caractère robotique des voix de ces assistants était jusqu’ici une des limites majeures à ce type d’applications. La démonstration faite par Google il y a quelques semaines montre que cette limite est en passe d’être dépassée :

 

 

L’introduction d’une dimension émotionnelle dans les voix artificielles (hésitations, tics de langage, onomatopées...) et les avancées de la compréhension du langage naturel, du deep learning et du text-to-speech annoncent l’arrivée de robots conversationnels capables de réussir le test de Turing. Si l’on y ajoute la possibilité de cloner la voix de n’importe quel individu, cela pose toute une série de questions troublantes et totalement inédites. Par exemple, un centre de contact devra se poser les questions suivantes : est-ce bien mon client qui me parle ou est-ce son assistant ? Si c’est son assistant, comment être sûr que c’est bien le client qui a demandé à ce dernier de contacter notre service client ? De son côté, le client se demandera : est-ce vraiment un conseiller qui me rappelle ou un robot conversationnel avec une voix plus vraie que nature ? Que puis-je dire à un robot que je ne dirais pas à un humain ? Dirai-je la même chose si je sais que c’est un humain et non une machine ? Ressentirai-je la même empathie si je sais que j’ai affaire à un robot ?

On n’en est pas encore tout à fait là, mais si ces questions sont aussi troublantes, pour ne pas dire dérangeantes, c’est bien parce que la voix a quelque chose de très spécifiquement humain, d’authentique et de sensible à quoi nous sommes foncièrement attachés. En attendant que ces questions se posent dans la vraie vie et obligent les acteurs de la relation client à rechercher un nouvel équilibre entre voix humaine et voix artificielle, les marques qui savent offrir un service d’exception par téléphone continueront à marquer des points dans le cœur de leurs clients.

 

Demander une demo