Une nouvelle étude de l'Université Queen Mary de Londres a démontré que les voix générées par l'IA ont atteint un niveau de réalisme impossible à distinguer des voix humaines, soulevant des questions importantes sur le rôle de la technologie dans la communication, la sécurité et l'éthique.
La technologie vocale de l'IA a franchi une étape remarquable. Une nouvelle étude de l'Université Queen Mary de Londres révèle que les voix synthétiques sont désormais indiscernables de celles des humains, marquant ainsi une avancée significative dans les capacités de l'intelligence artificielle.
Beaucoup ont longtemps considéré les discours générés par l'IA comme peu convaincants et facilement différenciables des voix humaines. Cependant, les dernières recherches démontrent que cette perception est de plus en plus dépassée.
Publié Dans la revue PLOS One, l'étude a comparé de vraies voix humaines avec deux types de voix générées par l'IA : celles clonées pour imiter une personne spécifique et celles créées à partir de grands modèles de voix sans homologue humain spécifique.
Les participants à l’étude ont évalué le réalisme, la dominance et la fiabilité des voix.
Les résultats ont révélé que les voix générées par l'IA pouvaient paraître aussi réelles que les voix humaines, ce qui rendait difficile leur distinction. Il est intéressant de noter que ces voix étaient souvent perçues comme plus dominantes et, dans certains cas, plus dignes de confiance que leurs homologues humaines.
« Les voix générées par l'IA sont désormais omniprésentes. Nous avons tous parlé à Alexa ou Siri, ou nos appels ont été pris en charge par des systèmes automatisés de service client », a déclaré Nadine Lavan, auteure correspondante et maître de conférences en psychologie à l'Université Queen Mary de Londres, co-directrice de l'étude, dans un communiqué de presse. « Ces voix ne ressemblent pas tout à fait à de vraies voix humaines, mais ce n'était qu'une question de temps avant que l'IA ne commence à produire des paroles naturelles, à consonance humaine. Notre étude montre que ce moment est venu, et il est urgent de comprendre comment les gens perçoivent ces voix réalistes. »
Lavan a souligné la facilité et la rapidité avec lesquelles l’équipe a pu créer des clones vocaux à l’aide de logiciels disponibles dans le commerce.
« Le processus a nécessité une expertise minimale, seulement quelques minutes d'enregistrement vocal et un budget quasi nul », a-t-elle ajouté. « Cela montre à quel point la technologie vocale par IA est devenue accessible et sophistiquée. »
L'amélioration rapide de la synthèse vocale par l'IA a de profondes implications en matière d'éthique, de droits d'auteur et de sécurité. Les préoccupations concernant la désinformation, la fraude et l'usurpation d'identité sont primordiales, d'autant plus que la génération de voix réalistes devient plus accessible et plus performante.
Toutefois, sur une note positive, Lavan a souligné le potentiel de la technologie vocale de l’IA pour offrir des opportunités passionnantes.
« Il pourrait y avoir des applications pour améliorer l’accessibilité, l’éducation et la communication, où des voix synthétiques sur mesure de haute qualité peuvent améliorer l’expérience utilisateur », a-t-elle déclaré.
Source: Queen Mary University of London

