Meta busca elevar la experiencia multimodal en Facebook, Instagram y WhatsApp con una vasta cantidad de datos de entrenamiento
La evolución de la inteligencia artificial no se detiene, avanzando a un ritmo impresionante y presentando innovaciones constantes de los gigantes tecnológicos. Incluso durante los fines de semana hay noticias, como la reciente presentación por parte de Meta el pasado sábado de Llama 4, su más reciente serie de modelos de inteligencia artificial de fuente abierta. No es uno, sino cuatro modelos distintos: Llama 4 Scout, Llama 4 Maverick y Llama 4 Behemoth.
Según lo detallado por Meta, estos modelos se han desarrollado utilizando «grandes volúmenes de datos no etiquetados de texto, imágenes y video». El objetivo es dotar a estos modelos de una comprensión visual extensa, lo cual se espera que se traduzca en experiencias de usuario mucho más personalizadas. Comparando con su modelo anterior, Llama 3, estos nuevos modelos ofrecen configuraciones significativamente más avanzadas y potentes.
La llegada de Llama 4 y sus impresionantes capacidades
Meta describe a Llama 4 como la primera generación de sus modelos que utiliza la arquitectura de ‘mixture of experts‘ (MoE), que es más eficiente desde el punto de vista computacional, tanto para el entrenamiento como para la ejecución de consultas. ¿Cómo funciona? Simplificando, este método divide las tareas de procesamiento en sub-tareas que son asignadas a modelos más pequeños y especializados.
Al examinar los parámetros y los expertos de estos modelos, se entienden los parámetros como las capacidades de razonamiento o habilidades de resolución del modelo. Por ejemplo, Maverick posee un total de 400,000 millones de parámetros, pero solo utiliza 17,000 millones de parámetros activos distribuidos entre 128 expertos.
- Llama 4 Behemoth es un modelo impresionante con casi dos billones de parámetros totales, 288,000 millones de parámetros activos y 16 expertos, siendo el más potente hasta la fecha y uno de los modelos de lenguaje más avanzados. Aún está en fase de entrenamiento.
- Llama 4 Maverick cuenta con 17,000 millones de parámetros activos repartidos entre 128 expertos.
- Llama 4 Scout también dispone de 17,000 millones de parámetros activos, pero distribuidos entre solo 16 expertos y maneja 10 millones de tokens de ventana de contexto.
Llama 4 Maverick, el equivalente a GPT-40 de Meta
Según las pruebas realizadas por Meta, Behemoth supera a modelos como GPT-4.5, Claude 3.7 Sonnet y Gemini 2.0 Pro (aunque no a Gemini 2.5 Pro) en pruebas enfocadas en campos científicos y técnicos STEM, como la resolución de problemas matemáticos.
Por su parte, Maverick está diseñado para funcionar como un asistente general o chat (incluyendo la escritura creativa), compitiendo directamente con GPT-4 de OpenAI y Gemini 2.0 de Google, superándolos en ciertos benchmarks de codificación, razonamiento, multilingüismo, contextos largos e interpretación de imágenes, aunque aún está detrás de modelos más recientes y potentes como Gemini 2.5 Pro, Claude 3.7 Sonnet de Anthropic y GPT-4.5 de OpenAI.
Scout se destaca en el resumen de documentos y el razonamiento sobre grandes bases de código. Gracias a su amplia ventana de contexto, tiene la capacidad de analizar imágenes y hasta millones de palabras, permitiéndole manejar documentos extremadamente largos.
En términos de hardware necesario, Scout puede operar con una sola GPU Nvidia H100, mientras que Maverick necesita un sistema DGX con H100 o equivalente. No se han proporcionado detalles sobre Behemoth, pero sin duda requerirá un hardware aún más potente.
Aunque Behemoth sigue en entrenamiento y no está disponible, los otros modelos de Llama 4 ya pueden ser probados. Puedes descargar los modelos Llama 4 Scout y Llama 4 Maverick en Llama.com y Hugging Face.
Además, el círculo azul de Meta AI, que incluye WhatsApp, Messenger e Instagram Direct, ya está utilizando Llama 4 en 40 países. Sin embargo, las funciones multimodales están limitadas a Estados Unidos y sólo en inglés.
Respecto a la Unión Europea, no está incluida dentro de esos 40 países donde los modelos pueden ser utilizados o distribuidos, debido a la legislación europea sobre IA y protección de datos. Además, las corporaciones que excedan los 700 millones de usuarios activos mensuales deberán solicitar una licencia especial de uso a Meta.

¡Hola! Soy Valentina, miembro del equipo de MuyMac. Mi pasión por la escritura y mi compromiso con la divulgación de noticias relacionadas con la sociedad y la naturaleza me han llevado a formar parte de este proyecto increíble.