Microsoft elimina base de datos masiva de reconocimiento facial; contenía 10 millones de registros

De manera inadvertida, Microsoft retiró de Internet una base de datos que almacenaba más de 10 millones de rostros que, acorde a expertos en servicios de seguridad informática, la compañía utilizaba para desarrollar sistemas de reconocimiento facial para posibles implementaciones militares y comerciales.

La base de datos, identificada como MS Celeb, fue puesta en línea en 2016 y, acorde a Microsoft, este era el grupo de datos de reconocimiento facial más grande del mundo, pues contenía más de 10 millones de imágenes pertenecientes a alrededor de 100 mil personas.

Los expertos en servicios de seguridad informática señalan que la compañía no pidió el consentimiento de las personas cuyos rostros estaban en la base de datos, pues las imágenes fueron obtenidas a través de buscadores de imágenes y videos en Internet bajo licencia Creative Commons, que permite el uso de las imágenes con fines académicos.

Hace algunos días la compañía eliminó la base de datos después de que algunos medios reportaran el supuesto uso de la base de datos por parte de terceros. Respecto al cierre, Microsoft declaró: “La base de datos era administrada por un empleado que ya no trabaja con nosotros, desde entonces el contenido fue eliminado”.

Además de la base de datos de Microsoft, otros dos conjuntos de datos fueron eliminados recientemente, incluyendo el conjunto de datos de vigilancia MTMC, desarrollado por investigadores de la Universidad de Duke, y Brainwash, el sistema de datos de la Universidad de Stanford. Este sistema empleaba imágenes de los clientes de una cafetería ubicada en California llamada Brainwash. La Universidad de Stanford afirma que este conjunto de datos fue eliminado a petición de uno de los desarrolladores del sistema. 

El experto en servicios de seguridad informática Adam Harvey fue el encargado de revelar el uso de estas bases de datos por parte de terceros. El experto afirma que la base de datos MS Celeb ha sido empleada por múltiples compañías, entre las que destacan Panasonic, Nvidia, IBM, Hitachi, entre otras. No obstante, los casos que más preocupan son los de las compañías Sensetime y Megvii, que son empresas chinas dedicadas al equipamiento para funcionarios en Xinjiang, donde los grupos minoritarios, como musulmanes, se encuentran bajo constante vigilancia, incluso se les envía a campos de concentración.

Aunque la base de datos ya ha sido removida de Internet, acorde a expertos del Instituto Internacional de Seguridad Cibernética (IICS) aún está disponible para las compañías que alguna vez tuvieron acceso a ésta; además, acorde a Adam Harvey, la base de datos aún se comparte en sitios web de desarrollos de código abierto.