‘De site was bedoeld voor academische doeleinden’

Eerder deze week heeft Microsoft een database met meer dan 10 miljoen gezichten verwijderd, deze waren bedoeld als een test- en voor trainingsgegevens set voor algoritmen voor gezichtsherkenning, dit meldt de Financial Times  in een rapport. Bekend als MS Celeb bevatte de database meer dan 10 miljoen afbeeldingen van ongeveer 100.000 mensen, grotendeels geschrapt uit openbare online bronnen. Hoewel geen afzonderlijke foto in de dataset moeilijk te vinden was, maakte het volume aan afbeeldingen en de bijbehorende gestructureerde gegevens, de dataset uiterst nuttig in trainingsprogramma’s om het gezicht van een persoon over verschillende foto’s te herkennen.

De ‘takedown’ kwam na een eerder onderzoek van de Financial Times, waarbij bleek dat veel van de mensen die in de dataset vertegenwoordigd waren zich er niet van bewust waren en er niet mee instemden hadden dat hun foto’s werden gebruikt. Een aantal experts speculeerden dat de dataset juridische problemen zou kunnen krijgen in het kader van de Algemene Verordening Gegevensbescherming, die belangrijke eisen stelt aan de opslag en overdracht van de persoonlijke gegevens van een onderwerp.


Microsoft heeft de verwijdering van de dataset niet aangekondigd en de betekenis daarvan in een opmerking, bij FT, gebagatelliseerd .

 “De site was bedoeld voor academische doeleinden”, aldus de woordvoerder. “Het werd gerund door een medewerker die niet langer bij Microsoft is en sindsdien is verwijderd.”

Twee vergelijkbare datasets van Duke Universiteit en Stanford Universiteit werden ook verwijderd naar aanleiding van de rapportage van de FT .

Pin It on Pinterest