O que é ?
O DNA da Voz é um projeto de pesquisa de pós-graduação da Universidade Federal de Goiás (UFG) em parceria com a CyberLabs, envolvendo pesquisadores de mestrado em Ciência da Computação, na sub-área de Inteligência Artificial (Deep Learning).
Qual é o objetivo ?
O objetivo da pesquisa é construir um modelo para identificar uma pessoa pela sua voz. Assim como o DNA, a impressão digital e a íris, a voz também apresenta características únicas para cada pessoa. O uso de aprendizado profundo no problema de reconhecimento de voz permite uma otimização da extração destas características. Isso leva a um salto em precisão e robustez em comparação aos sistemas clássicos. Logo, um sistema que apresente uma maior confiabilidade na autenticação pessoal por voz poderá ser aplicado, em larga escala, em diversas áreas, como assistentes virtuais, carros autônomos, call centers, transações financeiras, controle de acesso, entre outras. .
Logo, um sistema que apresente uma maior confiabilidade na autenticação pessoal por voz poderá ser aplicado, em larga escala, em diversas áreas, como assistentes virtuais, carros autônomos, call centers, transações financeiras, controle de acesso, entre outras. .
Como funciona ?
O DNA da Voz funciona como um sistema de biometria ou autenticação pessoal. Inicialmente, o usuário grava alguns trechos de sua voz e estes áudios são armazenados. Quando o usuário necessitar se autenticar, ele grava alguns segundos de sua voz. Neste momento, o sistema processa este áudio, interpreta as características daquela voz, e compara a voz pré-armazenada.
Um importante detalhe é que tudo isso não depende do que o usuário fala em seus áudios coletados. Não há a necessidade de nenhuma palavra-chave ou frases específicas. O modelo de inteligência artificial foi desenvolvido para extrair as características presente na voz da pessoa. Logo, podemos concluir que a reprodução de um áudio indireto (por exemplo, tentar se passar por outra pessoa reproduzindo um áudio dela pelo celular) para tentar burlar o sistema é muito improvável, uma vez que a construção destes alto-falantes não assemelha com a anatomia fisiológica de cada pessoa, o que garanta uma voz única para cada um.