Les collectifs homme-IA conduisent aux diagnostics médicaux les plus précis : nouvelle étude

Dans une étude historique, la combinaison de l’expertise humaine et de l’IA s’est avérée améliorer considérablement la précision du diagnostic en médecine, offrant une voie transformatrice pour les soins et la sécurité des patients.

Selon une étude internationale menée par l'Institut Max Planck pour le développement humain, les collectifs de diagnostic hybrides composés d'experts humains et de systèmes d'intelligence artificielle surpassent considérablement les méthodes de diagnostic traditionnelles.

Les erreurs de diagnostic restent un défi majeur dans la pratique médicale.

Bien que les systèmes d’IA, en particulier les grands modèles de langage (LLM) comme ChatGPT-4, Gemini et Claude 3, offrent un support de diagnostic innovant, ils génèrent parfois de fausses informations et reflètent les biais existants.

Une équipe de recherche de l'Institut Max Planck pour le développement humain, en collaboration avec le Human Diagnosis Project de San Francisco et l'Institut des sciences et technologies cognitives du Conseil national de la recherche italien, a étudié la collaboration optimale entre les humains et l'IA.

Les résultats de l’étude sont prometteurs : les collectifs de diagnostic hybrides, combinant les apports humains et IA, produisent une précision diagnostique nettement supérieure à celle des humains ou de l’IA seuls, en particulier dans les cas complexes et ouverts.

« Nos résultats montrent que la coopération entre les humains et les modèles d'IA a un grand potentiel pour améliorer la sécurité des patients », a déclaré l'auteur principal Nikolas Zöller, chercheur postdoctoral au Centre de rationalité adaptative de l'Institut Max Planck pour le développement humain, dans un communiqué de presse.

Simulations réalistes et analyses complètes

L’équipe de recherche a utilisé les données de plus de 2,100 XNUMX vignettes cliniques fournies par le Human Diagnosis Project.

Ces études de cas, associées à des diagnostics corrects, ont permis de comparer les diagnostics posés par les professionnels de la santé et ceux générés par cinq modèles d’IA de premier plan.

Les chercheurs ont simulé divers scénarios de diagnostic — individus, collectifs humains, modèles d’IA et collectifs mixtes humains-IA — ce qui a permis d’analyser plus de 40,000 XNUMX diagnostics.

L’étude a révélé que même si plusieurs modèles d’IA ont collectivement surpassé 85 % des diagnosticiens humains, les experts humains ont néanmoins excellé dans de nombreux cas.

Il est à noter que la combinaison des apports humains et de l'IA a permis d'obtenir une précision diagnostique optimale. Cette approche exploite la complémentarité des erreurs humaines et de l'IA : lorsque l'une échoue, l'autre réussit souvent, créant ainsi un puissant filet de sécurité.

« Il ne s'agit pas de remplacer les humains par des machines. Nous devrions plutôt considérer l'intelligence artificielle comme un outil complémentaire qui déploie tout son potentiel dans la prise de décision collective », a ajouté Stefan Herzog, co-auteur et chercheur principal à l'Institut Max Planck pour le développement humain.

Défis et orientations futures

Malgré des résultats prometteurs, les chercheurs soulignent que l'étude se limitait à des vignettes cliniques textuelles et ne portait pas sur des situations cliniques réelles. D'autres études sont nécessaires pour déterminer si ces résultats sont transposables à la pratique réelle.

De plus, la recherche s’est concentrée uniquement sur le diagnostic plutôt que sur le traitement, et l’exactitude d’un diagnostic ne garantit pas toujours des résultats de traitement optimaux.

La mise en œuvre pratique et l’acceptation des systèmes de soutien basés sur l’IA par le personnel médical et les patients, ainsi que les biais potentiels, restent des domaines de recherche future.

Applications plus larges et considérations éthiques

L'étude, qui fait partie du projet Hybrid Human Artificial Collective Intelligence in Open-Ended Decision Making (HACID) financé par Horizon Europe, vise à améliorer les systèmes d'aide à la décision clinique en intégrant l'intelligence humaine et l'intelligence artificielle.

Les applications potentielles s’étendent au-delà des soins de santé, y compris le système juridique, la réponse aux catastrophes et la politique climatique.

« Cette approche peut également être transposée à d'autres domaines critiques – tels que le système juridique, la réponse aux catastrophes ou la politique climatique – partout où des décisions complexes et à haut risque sont nécessaires. Par exemple, le projet HACID développe également des outils pour améliorer la prise de décision en matière d'adaptation au changement climatique », a ajouté Vito Trianni, coauteur et coordinateur du projet HACID.

Conclusion

Les collectifs hybrides humain-IA présentent un potentiel inégalé pour améliorer la précision des diagnostics et la sécurité des patients. À mesure que la recherche progresse, cette approche innovante pourrait révolutionner la prestation des soins de santé et, à terme, conduire à des soins plus équitables et plus efficaces pour les patients dans le monde entier.

Source: Institut Max Planck pour le développement humain