• |
  • |

Por Cade Metz

SAN FRANCISCO — Docenas de bases de datos con rostros de personas están siendo reunidas sin su conocimiento por empresas e investigadores, con muchas de las imágenes siendo compartidas en todo el mundo, en lo que se ha convertido en un enorme ecosistema que fomenta la propagación de la tecnología de reconocimiento facial.

Las bases de datos se arman con imágenes de redes sociales, sitios en internet de fotografías, servicios de citas como OkCupid y cámaras colocadas en restaurantes y en patios de universidades. Aunque no hay un recuento preciso de los conjuntos de datos, los activistas en materia de privacidad han señalado a depósitos construidos por Microsoft, la Universidad de Stanford y otros.

En Microsoft, los investigadores afirmaron en el sitio en internet de la empresa que habían creado uno de los juegos de datos faciales más grandes del mundo. La colección, llamada MS Celeb, incluía más de 10 millones de imágenes de más de 100 mil personas.

Las recopilaciones faciales están siendo impulsadas por la carrera por crear sistemas de reconocimiento facial de avanzada. Esta tecnología aprende a identificar a la gente analizando la mayor cantidad posible de fotos digitales usando redes neurales, que son sistemas matemáticos complejos que requieren grandes cantidades de datos para generar el reconocimiento.

Los gigantes de la tecnología como Facebook y Google han amasado los conjuntos más grandes de datos faciales, los cuales no distribuyen, de acuerdo con artículos de investigación. Sin embargo, otras compañías y universidades han compartido de manera generalizada sus acervos de imágenes con investigadores, gobiernos y empresas privadas en Australia, China, India, Singapur y Suiza para entrenar sistemas de inteligencia artificial, de acuerdo con académicos, activistas y artículos públicos.

Las compañías y los laboratorios tienen más de una década de reunir imágenes faciales, pero la gente a menudo no tiene idea de que sus rostros forman parte. Y, aunque en general las imágenes no van acompañadas de nombres, los individuos pueden ser reconocidos porque cada rostro es único y corresponde a una persona.

Las dudas en torno a los conjuntos de datos están aumentando porque las tecnologías que han ayudado a impulsar ahora se están usando de maneras posiblemente invasivas. Documentos publicados a principios de julio revelaron que los funcionarios de la Oficina de Aduanas y Protección Fronteriza de EU empleaban tecnología de reconocimiento facial para escanear las fotografías de automovilistas con el fin de identificar a inmigrantes ilegales.

El FBI también pasó más de una década usando ese tipo de sistemas para comparar las licencias de conducir y las fotografías de visas con los rostros de presuntos delincuentes, de acuerdo con un informe de la Oficina de Rendición de Cuentas del Gobierno el mes pasado.

No hay supervisión de los conjuntos de datos. Los activistas y otros dijeron estar molestos ante la posibilidad de que las imágenes de la gente se hubieran usado para crear tecnología éticamente cuestionable, y porque las imágenes podían ser usadas de manera indebida. Por lo menos una base de datos faciales creada en Estados Unidos fue compartida con una compañíía en China que ha sido vinculada con el fichaje étnico de la minoría de uigures musulmanes del País

Algunas compañías y universidades, entre ellas Microsoft y Stanford, eliminaron sus conjuntos de datos faciales de internet debido a preocupaciones de privacidad. Sin embargo, dado que las imágenes ya se habían distribuido tanto, lo más probable es que aún estén usándose.

“Te das cuenta de que estas empresas no respetan la privacidad”, comentó Liz O’Sullivan, quien supervisó una de estas bases de datos en la empresa emergente de inteligencia artificial Clarifai. Dijo que en enero abandonó la empresa, con sede en Nueva York, en protesta contra de ese tipo de prácticas.

Google, Facebook y Microsoft rechazaron hacer comentarios.

Una base de datos, que data del 2014, fue reunida por investigadores en Stanford. Se llamaba Brainwash, en honor a un café homónimo en San Francisco, donde los investigadores utilizaron una cámara. A lo largo de tres días, la cámara tomó más de 10 mil imágenes, escribieron los investigadores en un artículo de 2015. El artículo no especificó si los comensales del café sabían que les estaban tomando fotografías para usarlas en la investigación. (El café ya cerró sus puertas).

Los investigadores de Stanford entonces compartieron Brainwash. Fue usada por académicos chinos asociados con la Universidad Nacional de Tecnología de Defensa y Megvii, una compañía de inteligencia artificial que, según reportajes anteriores de The New York Times, ha proporcionado tecnología de vigilancia para monitorear a los uigures.

El conjunto de datos de Brainwash fue eliminado de su sitio web original el mes pasado después de que Adam Harvey, un activista en Alemania que da seguimiento al uso de estos acervos, llamó la atención al respecto.

También se han eliminado vínculos entre Brainwash y artículos que describen trabajo realizado para la Universidad Nacional de Tecnología de Defensa en China, de acuerdo con documentos de Harvey.
Investigadores en la Universidad de Duke también iniciaron una base de datos en el 2014 usando ocho cámaras en el campus para recabar imágenes, según un artículo del 2016 publicado durante la Conferencia

Europea sobre Visión de Computadora. Las cámaras tenían señalización, dijo Carlo Tomasi, el profesor de Duke que ayudó a crear la base de datos. Los avisos tenían un teléfono y un correo electrónico para que las personas pudieran declinar participar.

Los investigadores de Duke recopilaron más de 2 millones de cuadros de video con imágenes de más de 2 mil 700 personas. Subieron en línea al conjunto de datos, llamado Duke -MTMC. Más tarde sería citado en infinidad de documentos que describían el trabajo de entrenamiento de inteligencia artificial en Estados Unidos, China, Japón y otros lugares.

Matt Zeiler, fundador y director ejecutivo de Clarifai, dijo que su empresa ha creado una base de datos faciales con imágenes de OkCupid.

Agregó que había firmado un acuerdo con una gran empresa de redes sociales para usar sus imágenes en el entrenamiento de modelos de reconocimiento facial. Los términos de servicio de la red social permiten este tipo de intercambio, señaló.

“Debe haber algún nivel de confianza con empresas tecnológicas como Clarifai para que hagan un buen uso de la tecnología poderosa”, comentó.

Clarifai utilizó las imágenes de OkCupid para construir un servicio que podía identificar la edad, el sexo y la raza de los rostros detectados, comentó Zeiler. La empresa de arranque también comenzó a trabajar en una herramienta para recolectar imágenes de un sitio web llamado Insecam —abreviatura de insecure camera (cámara insegura)— que obtiene información de cámaras de vigilancia en centros de ciudades y espacios privados sin autorización. El proyecto de Clarifai se canceló el año pasado después de que algunos de sus empleados protestaron y antes de que se reunieran imágenes, dijo.

The New York Times