Como estimar a idade das pessoas usando redes neurais convolucionais

Nos últimos anos, os pesquisadores criaram um número crescente de técnicas de reconhecimento facial baseadas em aprendizado de máquina (ML), que podem ter inúmeras aplicações interessantes, por exemplo, aprimorando o monitoramento de vigilância, controle de segurança e arte potencialmente forense. Além do reconhecimento facial, os avanços no ML também permitiram o desenvolvimento de ferramentas para prever ou estimar qualidades específicas (por exemplo, sexo ou idade) de uma pessoa, analisando imagens de seus rostos.

Estimating people’s age using convolutional neural networks

Em um estudo recente, pesquisadores da Universidade de Kwazulu-Natal, na África do Sul, desenvolveram um modelo de machine learning para estimar a idade das pessoas analisando imagens de seus rostos tirados em ambientes aleatórios da vida real. Essa nova arquitetura foi introduzida em um artigo publicado no Springer e apresentado há alguns dias na Conferência Internacional sobre Inteligência Coletiva Computacional (ICCCI) 2019.

As abordagens mais tradicionais para classificação etária somente têm bom desempenho ao analisar imagens de rosto tiradas em ambientes controlados, por exemplo, no laboratório ou em estúdios de fotografia. Por outro lado, muito poucos deles são capazes de estimar a idade das pessoas em imagens tiradas em ambientes cotidianos reais.

“Os métodos de aprendizado profundo provaram ser eficazes na solução desse problema, especialmente com a disponibilidade de uma grande quantidade de dados para treinamento e máquinas de ponta”, escreveram os pesquisadores em seu artigo. “Em vista disso, propomos uma solução de aprendizado profundo para estimar a idade a partir de rostos da vida real”.

A equipe de pesquisadores da Universidade de Kwazulu-Natal desenvolveu uma arquitetura baseada em rede neural convolucional profunda (CNN) com seis camadas. Seu modelo foi treinado para estimar a idade dos indivíduos a partir de imagens de rostos tirados em ambientes não controlados. A arquitetura consegue isso aprendendo quais representações faciais são mais cruciais para a estimativa de idade e concentrando-se nesses recursos específicos.

Estimando a idade das pessoas usando redes neurais convolucionais
A fase de pré-processamento da imagem. Crédito: Agbo-Ajala e Viriri.

Para melhorar o desempenho de seu modelo baseado na CNN, os pesquisadores o treinaram em um grande conjunto de dados chamado IMDB-WIKI, que contém mais de meio milhão de imagens de rostos tirados do IMDB e da Wikipedia, rotulados com a idade de cada sujeito. este treino inicial permitiu-lhes conformar sua arquitetura para enfrentar o conteúdo da imagem.

Posteriormente, os pesquisadores ajustaram o modelo usando imagens de outros dois bancos de dados, MORPH-II e OUI-Adience, treinando-o para captar peculiaridades e diferenças. O MORPH-II contém aproximadamente 70.000 imagens rotuladas de rostos, enquanto o OUI-Adience contém 26.580 imagens de rostos tiradas em ambientes ideais da vida real.

Quando eles avaliaram seu modelo em imagens tiradas em ambientes não controlados, os pesquisadores descobriram que esse extenso treinamento levou a um desempenho notável. Seu modelo alcançou resultados de última geração, superando vários outros métodos baseados na CNN para estimativa de idade.

“Nossas experiências demonstram a eficácia do nosso método para estimativa de idade na natureza quando avaliadas no benchmark OUI-Adience, que é conhecido por conter imagens de rostos adquiridos em condições ideais e sem restrições “, escreveram os pesquisadores.” O método de classificação etária proposto alcança novos resultados de última geração, com uma melhoria na precisão de 8,6% (exato) e 3,4% (pontual) em relação ao melhor resultado relatado no conjunto de dados OUI-Adience “.

No futuro, a nova arquitetura baseada na CNN desenvolvida por esses pesquisadores poderá permitir implementações de estimativa de idade mais eficazes em uma variedade de configurações da vida real. A equipe também planeja adicionar camadas ao modelo e treiná-lo em outros conjuntos de dados de imagens de rosto tiradas em ambientes não controlados assim que estiverem disponíveis, a fim de melhorar ainda mais seu desempenho.

 

Mais Informações:
Olatunbosun Agbo-Ajala et al. Age Estimation of Real-Time Faces Using Convolutional Neural Network, Computational Collective Intelligence (2019). DOI: 10.1007/978-3-030-28377-3_26

Laboratório de Pesquisa em Ciência de Dados na Universidade Federal do Ceará