A NVIDIA começou o ano com tudo. O CES foi o evento escolhido por Jensen Huang para apresentar todas as suas novidades. Além das novas RTX50, a NVIDIA destaca diversos projetos relacionados à tecnologia que a levou ao topo: a inteligência artificial.
Mas uma coisa é certa: isso é apenas o começo. E o melhor exemplo disso é o NVIDIA Cosmos, a primeira plataforma de IA que "compreende" a física do mundo real.
Os modelos do Cosmos são de código aberto e estão disponíveis em três tamanhos (Nano, Super e Ultra), tanto no catálogo da NVIDIA quanto no Hugging Face. De acordo com a própria NVIDIA, esses modelos são extremamente caros de desenvolver. Eles foram treinados com milhões de dados do mundo real (20 milhões de horas de vídeo), permitindo que a IA "observe" como o mundo se comporta.
"Cosmos acelerará drasticamente o tempo necessário para treinar robôs inteligentes e carros autônomos avançados", explica Jensen Huang. "O momento ChatGPT para a robótica está se aproximando", afirmou.
Entre as empresas que começarão a testar o Cosmos estão algumas das principais do setor de robótica e carros autônomos: 1X, Agile Robots, Agility, Figure AI, Foretellix, Fourier, Galbot, Hillbot, IntBot, Neura Robotics, Skild AI, Uber, Virtual Incision, Waabi e XPENG.
O que os modelos do Cosmos permitem? Por que ele é chamado de uma IA física? Entre os exemplos que explicam suas capacidades está a habilidade de compreender cenários de um vídeo. Por exemplo, é possível pedir à IA que "encontre uma estrada coberta de neve" ou que identifique "um armazém com pouco espaço disponível".
Essa abordagem também permitirá gerar vídeos com o uso correto da física. Um dos principais problemas de muitas IAs generativas é que alguns movimentos apresentados são fisicamente incorretos. Com o modelo do Cosmos, busca-se solucionar essa limitação.
Ver 0 Comentários