Un modèle d'IA de Stanford analyse les données du sommeil pour prédire les risques de maladies

SleepFM, un nouveau modèle d'intelligence artificielle développé à Stanford, transforme une seule nuit de sommeil enregistrée en laboratoire en un puissant système d'alerte précoce pour les maladies futures. En apprenant le « langage » du sommeil, il peut prédire les risques de maladies allant des maladies cardiaques au cancer.

Une simple nuit passée dans un laboratoire du sommeil pourrait un jour apporter bien plus qu'un diagnostic de ronflement ou d'insomnie. Elle pourrait servir de système d'alerte précoce pour des maladies graves, des années avant l'apparition des symptômes.

Des chercheurs et collaborateurs de Stanford Medicine ont développé un modèle d'intelligence artificielle, appelé SleepFM, capable d'analyser une nuit d'enregistrements détaillés du sommeil et de prédire le risque pour une personne de développer plus de 100 problèmes de santé différents.

L'oeuvre, publié Dans la revue Nature Medicine, on exploite une ressource que les médecins du sommeil collectent depuis des décennies mais qu'ils n'utilisent que partiellement : la polysomnographie, le test de référence réalisé pendant la nuit, qui enregistre les ondes cérébrales, les rythmes cardiaques, la respiration, les mouvements oculaires, l'activité musculaire et bien plus encore.

La polysomnographie est déjà essentielle au diagnostic de l'apnée du sommeil et d'autres troubles du sommeil. Cependant, chaque examen génère des heures de données physiologiques riches et continues qui restent en grande partie inexploitées une fois le rapport rédigé.

« Lorsque nous étudions le sommeil, nous enregistrons une quantité impressionnante de signaux », a déclaré Emmanuel Mignot, professeur Craig Reynolds de médecine du sommeil à Stanford et co-auteur principal de l’étude, dans un communiqué de presse. « Il s’agit d’une forme de physiologie générale que nous étudions pendant huit heures chez un sujet totalement immobilisé. Les données recueillies sont extrêmement riches. »

SleepFM est conçu pour exploiter ces données.

Conçu comme un « modèle de base » — appartenant à la même vaste catégorie d'IA qui inclut les grands modèles de langage —, SleepFM a été entraîné sur près de 600 000 heures de données polysomnographiques provenant d'environ 65 000 personnes ayant subi des études du sommeil en clinique. Le groupe le plus important provenait du Stanford Sleep Medicine Center, qui collecte des enregistrements du sommeil depuis les années 1970 et les associe à des dossiers médicaux à long terme.

Du point de vue de l'IA, le sommeil a été un domaine négligé.

« Du point de vue de l'IA, le sommeil est relativement peu étudié. De nombreux travaux en IA portent sur la pathologie ou la cardiologie, mais relativement peu sur le sommeil, malgré son rôle essentiel dans la vie », a ajouté James Zou, co-auteur principal et professeur associé de science des données biomédicales à Stanford.

Pour entraîner SleepFM, l'équipe a découpé chaque étude nocturne en segments de cinq secondes, à l'instar des modèles de langage qui apprennent à partir de mots et de phrases isolés. Chaque segment comprenait plusieurs flux de données, tels que l'activité cérébrale (électroencéphalographie), l'activité cardiaque (électrocardiographie), l'activité musculaire (électromyographie), le débit respiratoire et le pouls.

« SleepFM apprend essentiellement le langage du sommeil », a ajouté Zou.

Les chercheurs ont également mis au point une nouvelle stratégie d'entraînement, appelée apprentissage contrastif « leave-one-out ». En termes simples, ils masquent un type de signal — par exemple, le rythme cardiaque — et demandent au modèle de le reconstituer à partir des signaux restants. Cela oblige l'IA à comprendre comment les différentes composantes de la physiologie nocturne du corps interagissent.

« L’une des avancées techniques que nous avons réalisées dans ce travail consiste à trouver comment harmoniser toutes ces différentes modalités de données afin qu’elles puissent se réunir pour apprendre le même langage », a ajouté Zou.

Après cette vaste phase de formation, l'équipe a peaufiné SleepFM pour des tâches spécifiques.

Dans un premier temps, on lui a demandé d'effectuer les tâches que les outils d'IA du sommeil existants tentent déjà de réaliser : classifier les stades du sommeil et évaluer la gravité de l'apnée du sommeil. Sur ces tests, SleepFM a égalé, voire surpassé, les modèles les plus performants du moment.

Les chercheurs ont ensuite poussé leurs investigations plus loin, en testant si les schémas cachés dans une seule nuit de sommeil pouvaient prédire de futures maladies.

Grâce aux décennies de dossiers médicaux électroniques liés aux études du sommeil menées par le Stanford Sleep Medicine Center, l'équipe a pu identifier les patients ayant développé ultérieurement diverses pathologies. Cela leur a permis de se demander si les données relatives au sommeil laissaient présager ces évolutions.

SleepFM a analysé plus de 1 000 catégories de maladies et en a identifié 130 qu'il pouvait prédire avec une précision raisonnable à partir des enregistrements du sommeil originaux. Les prédictions du modèle étaient particulièrement fiables pour les cancers, les complications de grossesse, les maladies circulatoires et les troubles de santé mentale.

Pour mesurer les performances, les chercheurs ont utilisé une mesure standard appelée indice de concordance, ou indice C, qui permet de déterminer dans quelle mesure un modèle peut classer les personnes susceptibles de tomber malades plus tôt.

« Pour toutes les paires d'individus possibles, le modèle établit un classement des personnes les plus susceptibles de subir un événement – ​​une crise cardiaque, par exemple – en premier. Un indice C de 0.8 signifie que dans 80 % des cas, la prédiction du modèle concorde avec la réalité », a ajouté Zou.

SleepFM a atteint ou dépassé ce niveau pour plusieurs affections graves, notamment la maladie de Parkinson, la démence, les cardiopathies hypertensives, les crises cardiaques, le cancer de la prostate, le cancer du sein et la mortalité globale.

« Nous avons été agréablement surpris de constater que, pour un ensemble de conditions assez diversifié, le modèle est capable de faire des prédictions instructives », a ajouté Zou.

Des modèles présentant des scores d'indice C légèrement inférieurs sont déjà utilisés en oncologie et dans d'autres spécialités pour orienter les décisions de traitement, ce qui suggère que les performances de SleepFM pourraient être cliniquement significatives si elles étaient validées et déployées avec soin.

L'étude offre également un aperçu de la manière dont l'IA pourrait transformer la médecine préventive. Si une étude du sommeil réalisée en routine pouvait détecter un risque accru de certains cancers ou de problèmes cardiovasculaires des années à l'avance, les médecins pourraient recommander des dépistages plus fréquents, des changements de mode de vie ou une surveillance plus étroite bien avant que la maladie ne se déclare.

Pour l'instant, SleepFM est un outil de recherche et non un dispositif que les patients utiliseront lors de leur prochaine consultation en clinique du sommeil. L'équipe travaille à affiner ses prédictions et à rendre le modèle plus interprétable.

« Le texte en anglais ne nous l’explique pas », a ajouté Zou. « Mais nous avons mis au point différentes techniques d’interprétation pour comprendre ce que le modèle analyse lorsqu’il effectue une prédiction spécifique d’une maladie. »

Ces techniques suggèrent que, même si certains signaux sont plus importants pour certaines maladies — le rythme cardiaque pour les maladies cardiaques, les ondes cérébrales pour les troubles mentaux —, le modèle fonctionne mieux lorsqu'il peut comparer plusieurs canaux simultanément.

« La meilleure source d’information pour prédire la maladie provenait de la comparaison des différents canaux », a ajouté Mignot.

Autrement dit, des problèmes peuvent survenir lorsque différentes parties du corps se désynchronisent pendant le sommeil — par exemple, lorsque l'activité cérébrale suggère un repos profond mais que le cœur semble anormalement actif.

Pour l'avenir, les chercheurs espèrent améliorer SleepFM en intégrant les données issues des objets connectés grand public, bien que moins précises que la polysomnographie, elles sont beaucoup plus faciles à collecter à grande échelle. Ils entrevoient également la possibilité d'adapter le modèle à différentes populations et systèmes de santé, et d'explorer comment l'évolution des habitudes de sommeil d'une personne au fil du temps est liée au risque de maladie.

Ce projet a réuni des scientifiques de Stanford, de l'Université technique du Danemark, de l'hôpital universitaire de Copenhague – Rigshospitalet, de BioSerenity, de l'Université de Copenhague et de la faculté de médecine de Harvard.

Pour les étudiants et les jeunes chercheurs, SleepFM constitue une étude de cas illustrant comment les pratiques cliniques établies peuvent être repensées grâce à l'IA moderne. Un test conçu pour diagnostiquer les troubles du sommeil pourrait également révéler des indices sur le cancer, les maladies cardiaques et la santé cérébrale, à condition d'apprendre à interpréter les signaux qu'il véhicule.

Source: Médecine de Stanford