A NVIDIA está ampliando seu conjunto de modelos, bases de dados e ferramentas de código aberto. Durante o evento NeurIPS, na Califórnia, a empresa anunciou novos modelos e ferramentas de IA física, incluindo o Alpamayo-R1, apresentado como o primeiro modelo aberto de raciocínio do tipo visão-linguagem-ação (VLA) em escala industrial voltado à condução autônoma.
Segundo a companhia, a tecnologia combina cadeias de raciocínio com planejamento de trajetória — elemento essencial para elevar a segurança dos sistemas autônomos em cenários complexos e “avançar em direção ao nível 4 de autonomia”.
Os níveis de automação avançam do nível 1 (assistência ao motorista) ao nível 2 (automação parcial), nível 3 (automação condicional), nível 4 (alta automação) e nível 5 (automação completa).
A Nvidia alega que enquanto gerações anteriores de modelos para direção autônoma enfrentavam dificuldades em situações mais sensíveis — como cruzamentos com grande fluxo de pedestres, fechamento de faixas ou veículos parados em fila dupla próximos a ciclovias — a capacidade de raciocínio busca dar aos veículos uma espécie de “senso comum”, aproximando seu comportamento do padrão humano.
“O AR1 executa esse processo ao decompor os cenários e analisar cada etapa. O modelo considera trajetórias possíveis e depois utiliza informações de contexto para selecionar o percurso mais adequado”, explicou a Nvidia.
Construído sobre a base aberta do NVIDIA Cosmos Reason, o AR1 pode ser adaptado por pesquisadores para usos não comerciais, desde benchmarks até experimentos em aplicações de direção autônoma.
A empresa afirmou que nos testes após o treinamento inicial, o uso de técnicas de aprendizado por reforço mostrou ganhos relevantes: pesquisadores observaram melhora significativa na capacidade de raciocínio do AR1 em comparação com o modelo pré-treinado.
O NVIDIA DRIVE Alpamayo-R1 será disponibilizado no GitHub e no Hugging Face. Parte dos dados utilizados no treinamento e na avaliação do modelo já pode ser acessada no NVIDIA Physical AI Open Datasets. A empresa também lançou o AlpaSim, um framework de código aberto para avaliar o desempenho do AR1.






