O reconhecimento facial moderno funciona em três etapas: detecção (encontrar rostos na imagem usando MTCNN ou RetinaFace), alinhamento (normalizar orientação e escala do rosto) e embedding (converter o rosto alinhado em um vetor de features usando uma CNN como ArcFace ou FaceNet). Dois rostos são comparados calculando a similaridade de cosseno entre seus embeddings — acima de um limiar significa correspondência. O embedding captura features específicas de identidade sendo robusto a mudanças de iluminação, expressão e idade.
Múltiplos estudos (notavelmente por Joy Buolamwini e Timnit Gebru) demonstraram que sistemas comerciais de reconhecimento facial tinham taxas de erro significativamente mais altas para mulheres e pessoas com tons de pele mais escuros. Um sistema com 99% de precisão para homens brancos mas 90% de precisão para mulheres negras cria resultados discriminatórios quando implantado na aplicação da lei. Essas descobertas levaram a maior diversidade nos dados de treinamento, auditoria de precisão entre demografias e, em alguns casos, proibições do uso governamental de reconhecimento facial.
O reconhecimento facial enfrenta mais regulação do que quase qualquer outra tecnologia de IA. A Lei de IA da UE proíbe identificação biométrica em tempo real em espaços públicos (com exceções estreitas). Várias cidades dos EUA proibiram o uso governamental. A BIPA de Illinois exige consentimento antes de coletar dados biométricos. A tecnologia em si é neutra, mas sua implantação em contextos de vigilância levanta questões fundamentais sobre privacidade, liberdades civis e o equilíbrio entre segurança e liberdade.