Um modelo de IA generativa, Fugatto (Foundational Generative Audio Transformer Opus 1), desenvolvido por uma equipe de pesquisadores da NVIDIA, está redefinindo abrindo novas fronteiras na criação de áudio. Essa nova ferramenta permite que os usuários manipulem e criem sons—sejam músicas, vozes ou efeitos—usando uma simples combinação de comandos de texto e arquivos de áudio
A nova tecnologia pode compor trechos de música baseados em descrições de texto, modificar ou adicionar instrumentos a uma música existente, alterar a emoção ou o sotaque de uma voz e criar sons completamente novos e inéditos.
“Isso é incrível,” disse Ido Zmishlany, produtor musical multi-platina e cofundador da One Take Audio. Ele destacou o potencial transformador do Fugatto para as indústrias criativas: “A ideia de criar sons completamente novos instantaneamente no estúdio é incrível.”
Rafael Valle, gerente de pesquisa aplicada em áudio da NVIDIA, descreveu o Fugatto como o primeiro modelo de áudio gerativo fundamental com propriedades emergentes, permitindo que ele entenda e sintetize sons de maneira similar aos humanos.
“Fugatto é nosso primeiro passo em direção a um futuro onde a aprendizagem multitarefa não supervisionada em síntese e transformação de áudio surge a partir de dados e da escala do modelo,” explicou Valle.
Produtores podem rapidamente prototipar ideias, experimentar diferentes estilos ou refinar faixas existentes com efeitos únicos. Como Zmishlany destacou, “Com a IA, estamos escrevendo o próximo capítulo da música. Temos um novo instrumento, uma nova ferramenta para criar música—e isso é super empolgante.”
Campanhas publicitárias podem se adaptar facilmente, ajustando narrações para diferentes sotaques, idiomas ou emoções, garantindo maior precisão ao atingir públicos diversos.
Ferramentas de aprendizado de idiomas podem apresentar vozes personalizadas, como a de um familiar, promovendo maior conexão e engajamento para os usuários.
Desenvolvedores podem modificar ou criar ativos de áudio em tempo real, garantindo que trilhas sonoras e efeitos evoluam dinamicamente com a jogabilidade.
Assista ao vídeo abaixo que mostra um pouco dos detalhes sobre a tecnologia:
Receba em seu email um resumo semanal com notícias exclusivas e reportagens sobre o mercado de IA no Brasil e no mundo