MAGI-1: La IA china que supera a Sora y Gemini y revoluciona la tecnología

Por
Sand AI ha introducido MAGI-1, una inteligencia artificial de código abierto que crea videos hiperrealistas, superando a modelos como Sora y Gemini.

La supremacía de OpenAI y Google en el campo de la IA es nuevamente desafiada por una innovación proveniente de China. Sand AI ha develado MAGI-1, un modelo autorregresivo de difusión diseñado específicamente para la generación de videos. Este modelo de código abierto puede producir videos de duración indefinida a partir de una sola imagen inicial.

Según Sand AI, MAGI-1 es un modelo de código abierto que consta de 24.000 millones de parámetros y produce videos por segmentos. A diferencia de otros modelos de difusión, MAGI-1 emplea una estrategia autorregresiva que asegura una consistencia temporal de izquierda a derecha entre segmentos consecutivos. Esta metodología no solo mejora su eficiencia, sino que también facilita su uso en aplicaciones en tiempo real.

MAGI-1 se beneficia de una arquitectura de transformador de difusión, la cual ha sido optimizada a través de diversas mejoras en el entrenamiento y la inferencia. El modelo también implementa una escalada progresiva del ruido a lo largo del tiempo durante el entrenamiento, incrementando los niveles de manera uniforme. Esta configuración prepara a MAGI-1 para manejar la causalidad y asegurar la continuidad entre los cuadros de manera más efectiva.

Leer  DeepSeek presenta Prover V2: Revoluciona los teoremas con su nueva IA de código abierto

Cada video se segmenta en trozos de 24 fotogramas de longitud fija, y el modelo depura el ruido de cada segmento antes de avanzar al próximo. Esta técnica permite el procesamiento de varios segmentos simultáneamente, potenciando la capacidad de rendimiento sin comprometer la coherencia visual. Como resultado, MAGI-1 ofrece una síntesis de video escalable y apta para streaming, con alta fidelidad temporal y transiciones fluidas.

El sistema de indicaciones por segmentos permite un control detallado sobre la composición y evolución de la escena. Esta característica posibilita que el usuario especifique elementos narrativos dentro de diferentes partes del video sin perder la coherencia visual. Además, MAGI-1 soporta transiciones suaves entre escenas y ediciones en tiempo real basadas en texto.

MAGI-1 supera a Sora y otras IA en la generación de video

En cuestiones de rendimiento, MAGI-1 sobresale notablemente frente a otras IAs en calidad de movimiento, seguimiento de instrucciones y coherencia semántica. Entre los modelos de código abierto, MAGI-1 ha superado a Wan-2.1 y HunyuanVideo en casi todos los parámetros de evaluación. También ha competido con modelos comerciales privativos como Hailuo (i2v-01), Kling y Sora, destacando en la síntesis de movimientos realistas y control detallado.

Leer  Increíble descubrimiento: El hielo puede generar electricidad al doblarse

Por otro lado, en la evaluación Physics-IQ, MAGI-1 demuestra una modelación precisa del comportamiento físico en tareas de continuación de video. Esta habilidad es crucial para aplicaciones que demandan realismo físico y consistencia en formatos prolongados.

Sand AI ha disponible MAGI-1 como código abierto en GitHub, incluyendo tanto el código de inferencia completo como los modelos ya entrenados. Según TechCrunch, este nuevo modelo chino está recibiendo elogios de diversas figuras destacadas de la industria, como Kai-Fu Lee, director de Microsoft Research Asia. Al igual que sucedió con DeepSeek, MAGI-1 podría establecer un nuevo estándar en la generación de video por IA.

4.8/5 - (31 votos)

Deja un comentario

Partages