Des chercheurs de l'Université de technologie de Kaunas (KTU) ont mis au point un modèle d'intelligence artificielle qui diagnostique la dépression avec une précision de 97.53 % en analysant la parole et l'activité neuronale cérébrale, marquant ainsi une avancée significative dans le diagnostic de santé mentale.
La dépression touche environ 280 millions de personnes dans le monde et son diagnostic précis a toujours été un défi de taille. Des chercheurs de l’Université de technologie de Kaunas (KTU) ont réalisé une avancée dans ce domaine en développant un modèle d’intelligence artificielle (IA) capable d’identifier la dépression avec une précision exceptionnelle en analysant à la fois les schémas de parole et l’activité neuronale du cerveau.
« La dépression est l’un des troubles mentaux les plus courants, avec des conséquences dévastatrices pour l’individu et la société. Nous développons donc une nouvelle méthode de diagnostic plus objective qui pourrait devenir accessible à tous à l’avenir », a déclaré dans un communiqué Rytis Maskeliūnas, co-auteur et professeur au département d’ingénierie multimédia de la KTU. communiqué de presse.
L'approche multimodale améliore la précision du diagnostic
Publié Dans la revue Brain Sciences, l'innovation découle d'une approche multimodale qui intègre deux types de données : la parole et l'activité électrique cérébrale (EEG).
Les chercheurs soutiennent que si la plupart des méthodes de diagnostic traditionnelles s’appuient sur un seul type de données, cette double approche offre une compréhension plus complète de l’état émotionnel d’une personne.
Cette analyse combinée a atteint une précision impressionnante de 97.53 % dans le diagnostic de la dépression, une amélioration significative par rapport aux méthodes existantes.
« C’est parce que la voix ajoute des données à l’étude que nous ne pouvons pas encore extraire du cerveau », a ajouté Maskeliūnas.
Données vocales et cérébrales : un puissant duo diagnostique
Le choix des sources de données a été soigneusement réfléchi, selon Musyyab Yousufi, un doctorant qui a contribué au projet. Il a noté que si les expressions faciales peuvent donner un aperçu de l'état psychologique d'une personne, elles peuvent être facilement manipulées.
« Nous avons choisi la voix parce qu'elle peut révéler subtilement un état émotionnel, le diagnostic affectant le rythme de la parole, l'intonation et l'énergie globale », a déclaré Yousufi dans le communiqué de presse.
La confidentialité des patients est un autre élément essentiel à prendre en compte. Les méthodes traditionnelles comme la reconnaissance faciale peuvent porter atteinte à la vie privée, alors que la parole et l'EEG offrent des données moins invasives mais tout aussi informatives.
« La collecte et la combinaison de données provenant de plusieurs sources sont plus prometteuses pour une utilisation ultérieure », a ajouté Maskeliūnas.
La voie à suivre : améliorer la transparence et la compréhension de l’IA
L'équipe de recherche de la KTU a utilisé le jeu de données ouvert multimodal pour l'analyse des troubles mentaux (MODMA) pour ses données EEG. Ces données ont été recueillies dans un environnement contrôlé, les participants étant au repos, les yeux fermés pendant cinq minutes. Parallèlement, le discours naturel des participants a été enregistré lors d'une séance de questions-réponses et pendant qu'ils décrivaient des images.
Pour traiter ces données, elles ont été transformées en spectrogrammes, des représentations visuelles des signaux. Des filtres de bruit avancés et un modèle d'apprentissage profond DenseNet-121 modifié ont été utilisés pour identifier les indicateurs de dépression dans ces images.
À l’avenir, ce modèle d’IA pourrait rendre le diagnostic de la dépression plus rapide et plus accessible, facilitant potentiellement les évaluations à distance et réduisant les biais subjectifs. Cependant, des défis subsistent.
« Le principal problème de ces études est le manque de données, car les gens ont tendance à rester discrets sur leurs problèmes de santé mentale », explique Maskeliūnas.
Une tâche future importante pour les chercheurs est d’améliorer la capacité de l’algorithme à expliquer clairement son processus de diagnostic.
« L’algorithme doit encore apprendre à expliquer le diagnostic de manière compréhensible », a ajouté Maskeliūnas.
Les implications plus larges : l’IA explicable dans les soins de santé
Alors que les solutions d'IA gagnent du terrain dans des domaines sensibles comme la santé, la finance et le droit, la demande d'intelligence artificielle explicable (XAI) augmente. L'XAI vise à rendre le processus décisionnel de l'IA transparent, instaurant ainsi la confiance et garantissant que ces systèmes peuvent être intégrés de manière fiable dans des domaines critiques.
Avec ce développement, KTU ouvre une voie prometteuse vers des diagnostics de dépression plus précis, objectifs et compréhensibles, révolutionnant potentiellement la manière dont les problèmes de santé mentale sont identifiés et traités.