Artículos

La combinación de las decisiones de reconocimiento facial de los seres humanos y los ordenadores puede evitar errores costosos.

por David White Traducción David Ormeño

Después de una serie de robos a bancos que tuvieron lugar en Estados Unidos en 2014, la policía arrestó a Steve Talley. Fue golpeado durante el arresto y mantenido en detención de máxima seguridad durante casi dos meses. Su ex-esposa lo identificó como el ladrón en las grabaciones de CCTV y un examinador facial del FBI más tarde respaldó sus afirmaciones.

Resultó que Talley no era el perpetrador. Desafortunadamente, su arresto lo dejó con lesiones extensas, y lo llevó a perder su trabajo y un período de desamparo. Talley se ha convertido ahora en un ejemplo de lo que puede salir mal con la identificación facial.

Estas decisiones críticas se basan en la capacidad de los seres humanos y las computadoras para decidir si dos imágenes son de la misma persona o de personas diferentes. El caso de Talley muestra cómo los errores pueden tener profundas consecuencias.

Mi investigación se centra en cómo mejorar la precisión de estas decisiones. Esto puede hacer que la sociedad sea más segura protegiéndola contra el terrorismo, el crimen organizado y el fraude de identidad. Y hacerlos más justos, asegurándose de que los errores en estas decisiones no lleven a que las personas sean acusadas erróneamente de delitos.

Identificar caras desconocidas

Entonces, ¿qué tan precisos son los humanos y las computadoras para identificar las caras?

La mayoría de las personas son extremadamente buenas reconociendo las caras de personas que conocen bien. Sin embargo, en todas las decisiones críticas esbozadas anteriormente, la tarea no es identificar un rostro familiar, sino más bien verificar la identidad de un rostro desconocido.

Para entender cuán desafiante puede ser esta tarea, pruébelo usted mismo: ¿son las imágenes de abajo de la misma persona o de diferentes personas?

Humanos contra máquinas

El par de imágenes de arriba es uno de los elementos de prueba que mis colegas y yo utilizamos para evaluar la precisión de los seres humanos y las computadoras en la identificación de las caras, en un artículo publicado la semana pasada en Proceedings of the National Academy of Science.

Se reclutaron dos grupos de expertos profesionales en identificación facial. Un grupo eran expertos internacionales que elaboran informes de análisis forenses para los tribunales (Examinadores). Otro grupo eran especialistas en identificación de rostros que tomaban decisiones más rápidas, por ejemplo al revisar la validez de las solicitudes de visa o en la investigación forense (revisores). También reclutamos un grupo de “superreconocedores” que tienen una habilidad natural para identificar rostros, similar a los grupos que han sido desplegados como especialistas en identificación de rostros en la Policía Metropolitana de Londres.

El desempeño de estos grupos en comparación con los estudiantes de pregrado y con los algoritmos se muestra en el siguiente gráfico.

Los puntos negros de este gráfico muestran la precisión de los participantes individuales, y los puntos rojos muestran el desempeño promedio del grupo.

Lo primero que hay que notar es que hay un claro orden de actuación entre los grupos de humanos. Los estudiantes se desempeñan relativamente mal en grupo – con un promedio de más del 30% de errores – demostrando cuán difícil es la tarea.

A los grupos profesionales les va mucho mejor en la tarea, con menos de un 10% de errores de media y nueve de 87 obteniendo la máxima puntuación posible en la prueba.

Curiosamente, los superreconocimientos también tuvieron un desempeño extremadamente bueno, con tres de 12 logrando la máxima puntuación posible. Estas personas no tenían formación o experiencia especializada en la toma de decisiones de identificación de rostros, lo que sugiere que la selección de personas basada en la capacidad natural también es una solución prometedora.

El rendimiento de los algoritmos se muestra mediante los puntos rojos a la derecha del gráfico. Probamos tres iteraciones del mismo algoritmo que el algoritmo fue mejorado en los últimos dos años. Hay una clara mejora de este algoritmo con cada iteración, demostrando los grandes avances que la tecnología de la Deep Convolutional Neural Network ha hecho en los últimos años.

La versión más reciente del algoritmo alcanzó la precisión que estaba en el rango de los mejores humanos.

La sabiduría de las multitudes

También observamos una gran variabilidad en todos los grupos. No importa a qué grupo miremos, el rendimiento de los individuos abarca toda la escala de medición, desde las adivinanzas aleatorias (50%) hasta la precisión perfecta (100%).

Esta variación es problemática, porque son los individuos los que proporcionan pruebas de identificación facial en los tribunales. Si el rendimiento varía tanto de un individuo a otro, ¿cómo podemos saber que sus decisiones son correctas?

Nuestro estudio ofrece una solución a este problema. Al promediar las respuestas de los grupos de humanos, usando lo que se conoce como un enfoque de “sabiduría de las multitudes“, pudimos alcanzar niveles casi perfectos de precisión. El desempeño del grupo también fue más predecible que la precisión individual.

Quizás el hallazgo más interesante fue cuando combinamos las decisiones de humanos y máquinas.

Combinando las respuestas de un solo examinador y el algoritmo principal, pudimos lograr una precisión perfecta en esta prueba, mejor que la de un solo examinador o la del mejor algoritmo trabajando solo.

Reconocimiento de rostros en Australia

Se trata de un resultado oportuno a medida que Australia pone en marcha el plan nacional de identificación de rostros, que permitirá a los organismos de policía buscar en grandes bases de datos de imágenes utilizando programas informáticos de reconocimiento de rostros.

Es importante destacar que esta aplicación de la tecnología de reconocimiento facial no es automática, como lo son los sistemas automatizados de control de fronteras. Más bien, la tecnología genera “listas de candidatos” como la que se muestra a continuación. Para que los sistemas sean útiles, los seres humanos deben revisar estas listas de candidatos para decidir si la identidad del objetivo está presente.

En un estudio realizado en 2015, mis colegas y yo encontramos que la persona promedio comete errores en una de cada dos decisiones al revisar las listas de candidatos, ¡y elige a la persona equivocada el 40% de las veces!

Falsos positivos como estos pueden hacer perder un tiempo precioso a la policía y tener un efecto potencialmente devastador en la vida de las personas.

El estudio que publicamos esta semana sugiere que la protección contra estos costosos errores requiere una cuidadosa consideración de los componentes humanos y mecánicos de los sistemas de reconocimiento facial.

Respuestas correcta: El par de imágenes son personas diferentes. La imagen coincidente en la lista de candidatos es la fila superior, la segunda desde la izquierda.