Sotaque brasileiro

Parceria entre Venturus, USP e Data Stand AI quer tornar IA de voz mais inclusiva para brasileiros

Projeto aposta em fala espontânea e diversidade linguística para aumentar precisão de modelos de reconhecimento e síntese de voz

Tempo de leitura: 2 minutos


O centro de inovação Venturus, a Universidade de São Paulo (USP) e a startup suíça Data Stand AI firmaram uma parceria para desenvolver modelos de inteligência artificial voltados ao reconhecimento automático de fala (ASR) e à conversão de texto em fala (TTS), com foco na fala espontânea em português brasileiro.

A iniciativa pretende superar limitações presentes em sistemas atuais, que costumam ter desempenho inferior diante da variedade de sotaques, níveis de formalidade e prosódia encontrados no Brasil. Ao treinar os modelos com dados reais e diversos, os pesquisadores esperam criar soluções mais eficazes para contextos cotidianos e aplicações como transcrição de fala, assistentes virtuais e acessibilidade digital.

“Nosso objetivo com esta pesquisa é desenvolver modelos mais inclusivos para o português brasileiro, livres desses problemas e vieses, tornando a tecnologia mais eficaz em aplicações como transcrição de fala, acessibilidade e assistentes virtuais”, explica Frederico Gonçalves, diretor de tecnologia do Venturus.

O projeto reúne profissionais como Sidney Leal e Frederico Gonçalves, do Venturus, além de alunos e docentes do Instituto de Ciências Matemáticas e de Computação (ICMC-USP) e da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH-USP). A Data Stand AI fornecerá sua tecnologia e expertise na limpeza e anotação de dados, etapa fundamental para treinar os modelos com qualidade.

Nos próximos dois anos, a equipe trabalhará no desenvolvimento e treinamento de modelos com base em gravações de fala espontânea — e não apenas leitura de textos, como ocorre em muitos bancos de dados disponíveis. A expectativa é que a Unesp também se una ao projeto em uma etapa futura, ampliando a colaboração.

A meta é aumentar significativamente a acurácia dos sistemas ASR e TTS em cenários reais, contribuindo para ampliar a inclusão digital em áreas como educação, serviços automatizados e atendimento ao cliente. Além disso, o projeto busca seguir diretrizes de desenvolvimento ético e inclusivo de IA, refletindo melhor a diversidade linguística do Brasil.

Receba em seu email um resumo semanal com notícias exclusivas e reportagens sobre o mercado de IA no Brasil e no mundo