O Google apresentou o SIMA 2, um novo agente de inteligência artificial desenvolvido pela Google DeepMind, com a capacidade de navegar e resolver problemas em diversos mundos virtuais tridimensionais. Construído sobre a estrutura da IA chamada Gemini, o SIMA 2 representa um avanço significativo em relação à sua versão anterior, o SIMA, lançado em 2024.
Com a habilidade de jogar uma variedade de jogos, como Goat Simulator 3, o SIMA 2 se destaca por sua capacidade de realizar tarefas complexas, interagindo com usuários através de conversas e solucionando desafios de forma autônoma. De acordo com a MT Technology Review, esse novo agente visa aprimorar a usabilidade da inteligência artificial em ambientes sofisticados, com o objetivo final de operá-la em robôs no mundo real.
O funcionamento do SIMA 2 permite controle humano por meio de bate-papo, seja por texto ou voz, além de interpretações gráficas. O agente processa as informações dos jogos e decide como agir em cada situação. O uso da IA Gemini no SIMA 2 melhora sua capacidade de seguir instruções e permite que o agente identifique, de forma independente, as melhores estratégias para realizar tarefas complexas.
Para seu desenvolvimento, o SIMA 2 passou por um treinamento que utilizou gravações de humanos jogando oito jogos comerciais, como No Man’s Sky, e três mundos virtuais criados pela Google. Cada interação foi projetada pelo Genie 3, um modelo de IA que cria mundos em 3D, permitindo que o agente aprendesse a associar comandos de teclado e mouse com ações específicas.
No entanto, apesar dos resultados encorajadores, o SIMA 2 ainda é considerado um experimento. Ele enfrenta desafios em executar ações altamente complexas que requerem múltiplas etapas e possui limitações em sua memória, demandando evoluções adicionais para melhorar sua interação em mundos virtuais.

