Google presenta IA revolucionaria: Crea mundos fotorrealistas al borde de la superinteligencia

Por
Genie 3 es un modelo innovador que simula entornos interactivos prolongados para la formación de agentes de inteligencia artificial.

Google ha presentado Genie 3, una avanzada versión de modelo de lenguaje que simula entornos fotorrealistas y es considerado un paso adelante hacia la superinteligencia artificial. Creado por DeepMind, este modelo es capaz de generar simulaciones de larga duración que son útiles para el entrenamiento de agentes de IA de propósito general. La empresa afirma que estos entornos son coherentes y que Genie tiene la capacidad de recordar las secuencias que ha generado previamente.

Según una entrada en el blog de DeepMind, Genie 3 es una evolución de su antecesor combinado con Veo 3, un modelo diseñado para crear videos a partir de texto. Contrariamente a Genie 2, que solo podía generar entornos interactivos de pocos segundos, la nueva versión puede crear simulaciones que duran varios minutos con una resolución de 720p. Los usuarios tienen la posibilidad de explorar estos entornos utilizando el teclado o controles de dirección.

Una de las características destacadas de Genie 3 es su base en la generación autorregresiva, una técnica que le permite construir el entorno cuadro por cuadro mientras recuerda los anteriores. Esto facilita la consistencia física, permitiendo a los usuarios volver a escenas anteriores sin perder coherencia. A pesar de que la técnica autorregresiva puede introducir algunos errores, los entornos generados mantienen una coherencia sólida, con una memoria visual que alcanza hasta un minuto atrás.

Leer  Fallo global en TVs Samsung: Netflix, YouTube y más apps dejan de funcionar.

En cuanto a su desempeño, Genie 3 es capaz de generar escenarios con complejas propiedades físicas. Algunos ejemplos incluyen una moto acuática navegando por un lago a medianoche, un paseo por el bosque o un salto en paracaídas desde un acantilado.

Genie 3 crea mundos para capacitar a otros agentes de IA

Los videos incluyen controles para manipular la cámara o moverse a través del entorno, y también permiten programar interacciones. Esto es similar a lo que se vio en Black Mirror: Bandersnatch, donde el usuario puede elegir qué evento sucederá a continuación. Estos eventos se pueden programar mediante prompts basados en instrucciones de texto, que alteran elementos del mundo virtual.

Aunque Genie 2 fue posicionado como una herramienta para diseñar mundos para videojuegos, Genie 3 se ha elevado a otro nivel. Más allá de su uso en entretenimiento, Genie 3 se está empleando para entrenar agentes de IA en una variedad de entornos simulados. Google ha utilizado el nuevo modelo para enseñar a su agente SIMA a realizar diversas tareas dentro de estos escenarios virtuales.

Leer  ¡Descubre GPT-5 ahora! Sin esperas: prueba la tecnología de inmediato

«Creemos que los modelos de mundos son fundamentales en la ruta hacia la inteligencia artificial general, especialmente para agentes integrados, donde la simulación de escenarios del mundo real presenta grandes desafíos», expresó Jack Parker-Holder, investigador de DeepMind.

Aunque Genie 3 ha mostrado avances significativos, no es perfecto. La simulación de comportamientos físicos presenta algunos problemas y la IA no puede replicar ubicaciones del mundo real con exactitud geográfica. Además, no es posible que múltiples agentes interactúen en el mismo entorno ni realizar entrenamientos de larga duración.

Por ahora, Genie 3 no se ofrecerá al público, aunque la empresa ya está considerando su disponibilidad para investigadores y desarrolladores de IA. Google cree que esta IA podría tener un impacto significativo en el entrenamiento de robots y sistemas autónomos.

4.5/5 - (31 votos)

Deja un comentario

Partages