OpenAI, en su reciente iniciativa, ha reintroducido la IA de código abierto al mercado con el lanzamiento de gpt-oss. Estos modelos, que son los primeros desde el GPT-2 de 2019, vienen en presentaciones de 20.000 millones y 120.000 millones de parámetros, conocidos respectivamente como gpt-oss-20b y gpt-oss-120b.
Según Sam Altman, estos nuevos modelos de IA abierta no solo igualan sino que superan en rendimiento a otros modelos de tamaño comparable. Además, han sido diseñados para funcionar eficientemente en hardware comercial, destacando la eficacia de su implementación.
El modelo de 20.000 millones de parámetros, gpt-oss, requiere tan solo 16 GB de memoria RAM para operar. Esto permite su uso en computadoras relativamente modernas, ofreciendo una solución accesible para aquellos que necesitan una IA competente en entornos locales sin necesidad de infraestructuras costosas. OpenAI compara su rendimiento con el del modelo o3-mini en pruebas estándar.
Por otro lado, el modelo de 120.000 millones de parámetros puede funcionar en una sola GPU con 80 GB de RAM, como una NVIDIA H100 SXM, proporcionando un desempeño similar al del modelo o4-mini. OpenAI ha anunciado que ambos modelos están disponibles en Hugging Face bajo una licencia Apache 2.0.
Conoce gpt-oss, la nueva propuesta de IA abierta de OpenAI
OpenAI ofrece con gpt-oss una alternativa prometedora para desarrolladores. Esta empresa con sede en California señala que sus nuevos modelos de peso abierto son perfectos para impulsar agentes de IA, destacando especialmente por sus capacidades de razonamiento. La versión de 20.000 millones de parámetros no solo se beneficia de la capacidad de ejecutarse en hardware menos potente, sino que también es ideal para aplicaciones que requieren baja latencia.
En cuanto a la versión de 120.000 millones de parámetros, está diseñada para tareas de propósito general que demandan capacidades de razonamiento más avanzadas. OpenAI ofrece tres niveles de razonamiento con este modelo:
- Bajo, para respuestas inmediatas;
- Medio, para un equilibrio entre velocidad y detalle en las respuestas;
- Alto, para proporcionar análisis detallados y exhaustivos.
Además, gpt-oss se destaca en la implementación con agentes de IA, útiles para navegar por internet o realizar tareas en un navegador. También son capaces de ejecutar código en Python y son compatibles con la API Responses de OpenAI.
Los creadores de ChatGPT también han presentado implementaciones para realizar inferencias con PyTorch y utilizando la plataforma Metal de Apple. Aunque los usuarios pueden personalizar los modelos gpt-oss para adaptarlos a sus necesidades específicas, sus creadores han tomado medidas especiales para evitar su uso malintencionado.
Es importante mencionar que, aunque gpt-oss marca un nuevo enfoque hacia la IA abierta por parte de OpenAI, no son modelos de código abierto. Aunque el término ‘open weight’ implica la liberación del código, los datos utilizados para su entrenamiento no se publican de la misma manera.
«Gracias a su escala, estos modelos ofrecen avances significativos en la capacidad de razonamiento y en seguridad. […] También reducen las barreras para mercados emergentes, sectores con recursos limitados y organizaciones pequeñas que pueden no tener el presupuesto o la flexibilidad para adoptar modelos propietarios», afirma OpenAI.

Hola, soy Carlos, parte del equipo de MuyMac. Me apasiona compartir las últimas novedades en entretenimiento y conectarte con el mundo del cine, la música y la cultura pop.