Les données utilisées pour construire des algorithmes de détection des maladies de la peau sont trop blanches

Les ensembles de données d’images de peau publiques qui sont utilisés pour former des algorithmes pour détecter les problèmes de peau n’incluent pas suffisamment d’informations sur le teint de la peau, selon un nouvelle analyse. Et dans les ensembles de données où les informations sur le teint de la peau sont disponibles, seul un très petit nombre d’images sont de peau plus foncée. Les algorithmes construits à l’aide de ces ensembles de données peuvent donc ne pas être aussi précis pour les personnes qui ne sont pas blanches.

L’étude, publiée aujourd’hui dans Les Lancet Santé numérique, ont examiné 21 ensembles de données librement accessibles d’images d’affections cutanées. Ensemble, ils contenaient plus de 100 000 images. Un peu plus de 1 400 de ces images contenaient des informations sur l’origine ethnique du patient, et seulement 2 236 contenaient des informations sur la couleur de la peau. Ce manque de données limite la capacité des chercheurs à repérer les biais dans les algorithmes formés sur les images. Et de tels algorithmes pourraient très bien être biaisés : parmi les images contenant des informations sur le teint de la peau, seules 11 provenaient de patients appartenant aux deux catégories les plus sombres de l’échelle de Fitzpatrick, qui classe la couleur de la peau. Il n’y avait pas d’images de patients d’origine africaine, afro-caribéenne ou sud-asiatique.

Les conclusions sont similaires à celles d’une étude publié en septembre, lequel trouvé aussi que la plupart des ensembles de données utilisés pour la formation les algorithmes de dermatologie n’ont pas d’informations sur l’origine ethnique ou le teint de la peau. Cette étude a examiné les données sous-jacentes à 70 études qui ont développé ou testé des algorithmes et a constaté que seulement sept décrivaient les types de peau dans les images utilisées.

« Ce que nous voyons dans le petit nombre d’articles qui rendent compte de la distribution des tons de peau, c’est que ceux-ci montrent une sous-représentation des tons de peau plus foncés », explique Roxana Daneshjou, chercheuse clinique en dermatologie à l’Université de Stanford et auteur de l’article de septembre. Son article a analysé bon nombre des mêmes ensembles de données que le nouveau Lancette recherches et sont parvenus à des conclusions similaires.

Lorsque les images d’un ensemble de données sont accessibles au public, les chercheurs peuvent passer en revue et examiner les tons de peau qui semblent être présents. Mais cela peut être difficile, car les photos peuvent ne pas correspondre exactement à ce à quoi ressemble le teint de la peau dans la vraie vie. « La situation la plus idéale est que le teint de la peau soit noté au moment de la visite clinique », explique Daneshjou. Ensuite, l’image du problème de peau de ce patient pourrait être étiquetée avant d’être introduite dans une base de données.

Sans étiquettes sur les images, les chercheurs ne peuvent pas vérifier les algorithmes pour voir s’ils sont construits à l’aide d’ensembles de données avec suffisamment d’exemples de personnes ayant différents types de peau.

Il est important d’examiner ces ensembles d’images, car ils sont souvent utilisés pour créer des algorithmes qui aident les médecins à diagnostiquer les patients atteints d’affections cutanées, dont certaines – comme les cancers de la peau – sont plus dangereuses s’ils ne sont pas détectés tôt. Si les algorithmes n’ont été entraînés ou testés que sur une peau claire, ils ne seront pas aussi précis pour tout le monde. « La recherche a montré que les programmes formés sur des images prises uniquement sur des personnes ayant un type de peau plus claire pourraient ne pas être aussi précis pour les personnes ayant une peau plus foncée, et vice versa », déclare David Wen, co-auteur du nouvel article et chercheur au Université d’Oxford.

De nouvelles images peuvent toujours être ajoutées aux ensembles de données publics, et les chercheurs souhaitent voir plus d’exemples de conditions sur une peau plus foncée. Et l’amélioration de la transparence et de la clarté des ensembles de données aidera les chercheurs à suivre les progrès vers des ensembles d’images plus diversifiés qui pourraient conduire à des outils d’IA plus équitables. « J’aimerais voir plus de données ouvertes et plus de données bien étiquetées », déclare Daneshjou.

Source link

99 3 minutes de lecture

Lire le suivant

Les données utilisées pour construire des algorithmes de détection des maladies de la peau sont trop blanches

Lire le suivant

Dans quelle mesure les gestionnaires de mots de passe sont-ils sécurisés et devriez-vous en utiliser un ?

5 mois plus tard, Apple n’a pas encore corrigé le bug iOS qui envoie des appareils

VW fixe une date pour la révélation de son Microbus électrique prêt pour la production

Les meilleurs nouveaux ordinateurs portables et Chromebooks au CES 2022

Target a des consoles PlayStation 5 et Xbox Series X à vendre en ce moment

Snapdragon 8 Gen 1, capteur principal 50MP, et plus

Intel annonce un processeur de 12e génération capable de 5,5 GHz

120W de charge pour moins de 400 $

Le $ 300 Bev de Black + Decker aspire un trou en forme de Keurig dans l’espace du robot barman

Fossil promet qu’Alexa arrivera « bientôt » sur ses montres connectées

Dans quelle mesure les gestionnaires de mots de passe sont-ils sécurisés et devriez-vous en utiliser un ?

5 mois plus tard, Apple n’a pas encore corrigé le bug iOS qui envoie des appareils

VW fixe une date pour la révélation de son Microbus électrique prêt pour la production

Les meilleurs nouveaux ordinateurs portables et Chromebooks au CES 2022

Target a des consoles PlayStation 5 et Xbox Series X à vendre en ce moment

Snapdragon 8 Gen 1, capteur principal 50MP, et plus

Intel annonce un processeur de 12e génération capable de 5,5 GHz

120W de charge pour moins de 400 $

Le $ 300 Bev de Black + Decker aspire un trou en forme de Keurig dans l’espace du robot barman

Fossil promet qu’Alexa arrivera « bientôt » sur ses montres connectées

Envea analyse un fonds | CFNEWS

Les Ravens auraient signé Latavius Murray après Gus

Le réseau électrique irlandais défaillant bloque l’essor de

Dire « OK Google » peut devenir facultatif dans certains cas et c’est un peu inquiétant

Windows 11 arrive le 5 octobre, les applications Android viendront plus tard

La FAA enquête sur la descente hors-course du vol de Virgin Galactic avec Richard Branson

Une vidéo capture un SUV sortant ce robot de livraison autonome

Windows 11 : Microsoft coupe les accès des bêta-testeurs aux PC jugés « inéligibles »

Google travaille peut-être sur de meilleurs jeux basés sur le cloud, la version bêta de Chrome 94 teste des fonctionnalités avancées

Lire le suivant

Dans quelle mesure les gestionnaires de mots de passe sont-ils sécurisés et devriez-vous en utiliser un ?

5 mois plus tard, Apple n’a pas encore corrigé le bug iOS qui envoie des appareils

VW fixe une date pour la révélation de son Microbus électrique prêt pour la production

Les meilleurs nouveaux ordinateurs portables et Chromebooks au CES 2022

Target a des consoles PlayStation 5 et Xbox Series X à vendre en ce moment

Snapdragon 8 Gen 1, capteur principal 50MP, et plus

Intel annonce un processeur de 12e génération capable de 5,5 GHz

120W de charge pour moins de 400 $

Le $ 300 Bev de Black + Decker aspire un trou en forme de Keurig dans l’espace du robot barman

Fossil promet qu’Alexa arrivera « bientôt » sur ses montres connectées

ZD Tech : La cybersécurité va mettre le pied dans la porte

Le LPDDR5X de Samsung est la prochaine étape pour la RAM des smartphones

Articles similaires

Envea analyse un fonds | CFNEWS

Les Ravens auraient signé Latavius ​​Murray après Gus

Le réseau électrique irlandais défaillant bloque l’essor de

Les Ravens auraient signé Latavius Murray après Gus