Na semana passada, uma das maiores empresas de tecnologia do mundo apresentou uma inovação que utiliza o que há de mais fino em Inteligência Artificial (IA). A Microsoft desenvolveu uma IA capaz de reproduzir e imitar qualquer voz de um ser humano em poucos segundos de análise. A nova tecnologia foi batizada pelo nome de VALL-E.
Veja também: Câncer de mama: Google cria Inteligência Artificial (I.A) que salvará vidas
Microsoft desenvolve inteligência artificial surpreendente
De acordo com os analistas da área de tecnologia, a nova inteligência artificial é capaz de fortalecer o uso de áudio para alimentar os algoritmos de text-to-sppech – que transformam textos em falas.
Conforme aponta a empresa, a nova IA precisa de apenas três segundos para ouvir e imitar a voz de uma pessoa em diferentes situações e vários contextos distintos. A própria Microsoft relatou que a novidade é um novo modelo de linguagem para sintetizar textos em falas de maneira digital e fiel.
Para alguns, esta é uma clara tentativa de desbancar a voz mecanizada presente no assistente do Google, como no traduzir, ou em outros aplicativos concorrentes.
Foram usadas mais de 60 mil horas de gravações
A inteligência artificial conta com um banco de dados que possui mais de 60 mil horas de gravações. Elas foram utilizadas como base de treino para adquirir tons, sotaques, entonações e várias outras características de cada tipo de vocalização.
A IA é capaz de identificar som de ambiente externo e até as diferenças de humor de quem está falando. Em outras palavras, essa inteligência artificial consegue imitar a voz de quem fala de forma fiel e bem próxima a realidade.
O resultado do desenvolvimento, segundo a empresa, possibilita a manutenção “da emoção do locutor e o ambiente acústico do prompt acústico na síntese”.
Inclusive, a novidade da Microsoft pode ser usada juntamente com outro tipo de inteligência artificial. Imagina usar essa IA com um gerador de textos, por exemplo. Seria como se uma máquina pudesse gerar tetos e produzir locuções ao mesmo tempo. Assustador, não é?