Une nouvelle technique d'IA permet de surmonter les corrélations erronées sans connaissance préalable

Des chercheurs de l’Université d’État de Caroline du Nord ont développé une nouvelle technique d’IA permettant de surmonter les corrélations erronées, même si elles sont inconnues. Cette avancée pourrait améliorer considérablement les performances et la fiabilité des modèles d’IA.

Des chercheurs de l’Université d’État de Caroline du Nord ont dévoilé une nouvelle technique pour résoudre l’un des problèmes les plus persistants dans la formation des modèles d’intelligence artificielle (IA) : les corrélations erronées. Ces corrélations conduisent souvent les systèmes d’IA à prendre des décisions basées sur des informations non pertinentes ou trompeuses, ce qui nuit à la précision et à la fiabilité de ces modèles.

« Cette technique est nouvelle dans la mesure où elle peut être utilisée même lorsque vous n'avez aucune idée des corrélations erronées sur lesquelles s'appuie l'IA », a déclaré l'auteur correspondant Jung-Eun Kim, professeur adjoint d'informatique à NC State, dans un communiqué de presse.

Les modèles d’IA, lors de leur phase d’entraînement, se concentrent parfois sur des caractéristiques sans importance en raison de ce que l’on appelle le biais de simplicité. Par exemple, une IA entraînée à identifier des chiens sur des photographies peut utiliser les colliers comme principale caractéristique d’identification si de nombreuses images d’entraînement représentent des chiens avec des colliers. Cela peut conduire à des résultats erronés, comme l’identification erronée de chats avec des colliers comme des chiens.

Les méthodes conventionnelles pour contrer ce problème consistent à identifier et à corriger les caractéristiques parasites dans les données d'apprentissage. Cependant, dans de nombreux cas, l'identification de ces caractéristiques parasites n'est ni simple ni même possible, ce qui rend les approches traditionnelles inefficaces.

« Notre objectif avec ce travail était de développer une technique qui nous permet de rompre les corrélations erronées même lorsque nous ne savons rien de ces caractéristiques erronées », a ajouté Kim.

La nouvelle méthode, appelée « élagage des données », consiste à supprimer un petit sous-ensemble des échantillons les plus difficiles des données d’entraînement. Ces échantillons obligent généralement le modèle d’IA à s’appuyer sur des informations non pertinentes qui conduisent à des corrélations erronées.

« Il peut y avoir des variations importantes dans les échantillons de données inclus dans les ensembles de données d'entraînement », a ajouté Kim. « Certains échantillons peuvent être très simples, tandis que d'autres peuvent être très complexes. Et nous pouvons mesurer la « difficulté » de chaque échantillon en fonction du comportement du modèle pendant l'entraînement. »

L’hypothèse sous-jacente à cette approche est que l’élimination d’une petite fraction des échantillons de données les plus difficiles supprime également ceux qui présentent des caractéristiques parasites, améliorant ainsi les performances du modèle sans provoquer d’effets indésirables significatifs.

Les chercheurs ont démontré que cette nouvelle technique produit des résultats de pointe, surpassant même les méthodes existantes qui nécessitent l’identification de caractéristiques parasites.

L'article évalué par des pairs, intitulé «Élimination des corrélations erronées grâce à l'élagage des données, » sera présenté lors de la Conférence internationale sur les représentations de l’apprentissage (ICLR) qui se tiendra à Singapour du 24 au 28 avril.

Cette avancée offre un potentiel considérable pour le domaine de l’IA, promettant une plus grande précision et une plus grande fiabilité dans les résultats des modèles d’IA sans avoir à identifier et à corriger individuellement les corrélations erronées.

Source: Université d'État de Caroline du Nord