Chatbots estão fazendo muito sucesso. Contudo, esse não é o único caminho que Inteligência Artificial trilha quando o assunto é aprendizado de máquina e modelos de linguagem. Um exemplo disso é que rumores ressaltam que o Google pretende exibir mais de 20 produtos alimentados por Inteligência Artificial ainda este ano.
Leia mais: Criador do ChatGPT teme que a humanidade seja destruída por inteligência artificial
Um desses projetos é promissor: a gigante de tecnologia tem como objetivo construir um modelo de linguagem IA que suporte mil idiomas diferentes.
Universal Speech Model
Nesta semana, o Google compartilhou algumas informações sobre o Universal Speech Model (USM). A novidade é vista como o “primeiro passo crítico” para atingir os objetivos da marca.
Isso porque, no final do ano passado, o Google anunciou que tem em seus planos a criação de um modelo de idioma compatível com mil dos idiomas mais falados do mundo. Nesse sentido, a empresa coloca o USM como uma “família de modelos de fala de última geração”. No total, a ferramenta conta com dois bilhões de parâmetros treinados em 12 milhões de horas de fala e 28 bilhões de sentenças em mais de 300 idiomas.
Vale lembrar que o Universal Speech Model já é usado pelo YouTube na geração de legendas ocultas, assim como no suporte ao reconhecimento automático de fala (ASR). Na prática, o sistema detecta e traduz de forma automática diversos idiomas, inclusive mandarim, aramaico, assamês e tantos outros.
Cenário atual
Hoje o Universal Speech Model tem suporte para mais de 100 idiomas. Na prática, esse modelo será usado como base para a expansão do sistema.
Mas não é só o Google que está de olho nessa expansão tecnológica. A Meta, por exemplo, tem trabalhado em ferramentas de tradução a partir da Inteligência Artificial que são semelhantes às do Google. Contudo, os estudos ainda estão em estágios mais iniciais.
As possibilidades do USM são tantas que, por exemplo, um destino para a tecnologia pode ser os óculos de realidade aumentada. Desta forma, ele seria capaz de detectar e fornecer traduções em tempo real para o usuário do acessório.
Um destino para a tecnologia pode estar dentro de óculos de realidade aumentada, como o conceito que o Google exibiu durante seu evento I/O no ano passado, capaz de detectar e fornecer traduções em tempo real que aparecem bem diante de seus olhos.