Nesta segunda-feira, 25, a Nvidia anunciou a chegada do Fugatto, um modelo de inteligência artificial direcionado a criadores de música, cinema e jogos. A nova tecnologia é capaz de gerar trilhas sonoras, alterar vozes e criar sons originais. A Nvidia, que é a maior fornecedora de chips para inteligência artificial do mundo, ainda não definiu uma data para o lançamento público dessa ferramenta.
O nome Fugatto é uma abreviação para Foundational Generative Audio Transformer Opus 1 e se junta a outras iniciativas no mercado, como as da Meta, que também trabalham com geração de áudio a partir de textos. A IA da Nvidia se distingue por sua habilidade de criar músicas e efeitos sonoros a partir de descrições textuais, permitindo, por exemplo, a geração de sons como o latido de um cachorro.
Uma das inovações do Fugatto é a capacidade de modificar gravações de áudio já existentes, como transformar uma melodia tocada ao piano em uma versão cantada ou alterar o sotaque em uma gravação de fala. O modelo foi desenvolvido com dados de código aberto, e a Nvidia está avaliando as possibilidades de um lançamento futuro.
Bryan Catanzaro, vice-presidente de pesquisa de aprendizado profundo aplicado na Nvidia, enfatizou que essa tecnologia gerativa oferece novas oportunidades na música e nos jogos, mas também alertou sobre os riscos potenciais de seu uso indevido, motivo pelo qual a empresa está sendo cautelosa quanto ao seu lançamento.