Recientemente Figure mostró en vídeo a dos humanoides trabajando juntos para ordenar una habitación sin intervención humana directa, un hito que plantea preguntas inmediatas sobre la escalabilidad de estos robots y su posible llegada a entornos reales. La demostración no solo exhibe destreza física, sino también un enfoque de coordinación emergente que podría acelerar la adopción industrial y doméstica de estos sistemas.
En la grabación se ven dos unidades Helix-02 completando en menos de dos minutos un conjunto de tareas domésticas: abrir y cerrar puertas, colgar ropa, recoger auriculares, cerrar un portátil, vaciar una papelera, recolocar una silla y tender una cama. Lo notable no es solo la velocidad, sino que, según la compañía, los robots actúan sin un plan compartido y sin intercambio directo de mensajes.
Figure atribuye este comportamiento a una única red que combina visión, lenguaje y acción —denominada por la empresa como Vision-Language-Action—. Cada robot interpreta la escena con sus propias cámaras y, en lugar de comunicarse explícitamente, infiere las intenciones del otro por el movimiento, de forma análoga a como lo harían dos personas coordinando una sábana.
El desafío de los objetos deformables
Más allá de los objetos rígidos del cuarto, el experimento pone de manifiesto la dificultad de manipular materiales que cambian de forma. El edredón, por ejemplo, no ofrece puntos de agarre prefijados ni una geometría estable: hay que levantar, estirar y alisar mientras cada gesto de un robot altera el problema para el otro.
Ese entrelazado de acciones convierte la tarea en un problema dinámico: la solución exige anticipación y ajuste continuo, no sólo fuerza ni planificación estática. Figure sostiene que su red entrenada puede traducir la información visual directamente en movimientos coordinados de locomoción y manipulación entre múltiples humanoides.
Control del cuerpo y percepción visual
El vídeo también destaca maniobras de control corporal completo. Un robot pulsa con el pie el pedal de una papelera manteniendo el equilibrio sobre una pierna; otro empuja una silla recurriendo a la postura del torso en lugar de depender únicamente de la fuerza de los brazos. Ambos realizan manipulación bimanual para trabajar la ropa de cama.
Para mejorar la navegación en entornos complejos, Figure ha incorporado procesamiento de imágenes RGB procedentes de cámaras estéreo, dejando atrás una dependencia exclusiva de la propiocepción. Además, la empresa explica que estos comportamientos se han aprendido mediante aprendizaje por refuerzo en simulación y se han transferido al mundo real sin calibraciones manuales adicionales.
¿Un paso hacia la producción masiva?
La demostración llega en un momento en que Figure pretende conectar avances de software con ambiciones de manufactura. En su planta BotQ, en California, la compañía ha manifestado su intención de aumentar la cadencia de producción desde una unidad por día hasta una por hora, si logra escalar los procesos.
Ese plan tiene implicaciones claras: más robots en operación significan más datos y, potencialmente, mayor robustez del sistema, pero también plantean retos regulatorios, de seguridad y de integración en espacios diseñados para personas.
Desde su fundación en 2022 por Brett Adcock, Figure ha recibido inversiones relevantes y ha movido sus robots fuera del laboratorio. En 2024 acordó pruebas con BMW en una planta real y cerró una ronda de financiación por 675 millones de dólares con participantes como Microsoft, Nvidia, OpenAI y Jeff Bezos. En septiembre de 2025 la compañía comunicó financiación adicional superior a 1.000 millones y una valoración reportada de 39.000 millones de dólares.
- Qué demostró: coordinación sin comunicación explícita entre humanoides; manipulación de objetos rígidos y deformables; control postural complejo.
- Tecnología clave: sistema Vision-Language-Action y transferencia de comportamientos desde simulación mediante aprendizaje por refuerzo.
- Limitaciones visibles: escena controlada, secuencia dirigida y tareas acotadas; el rendimiento en entornos desordenados o impredecibles sigue por comprobarse.
- Impacto potencial: aceleración de despliegues industriales, nuevos modelos de fabricación (BotQ) y debates sobre seguridad y regulación en espacios humanos.
Por ahora, la secuencia grabada funciona como prueba de concepto más que como evidencia de preparación para el día a día. El entorno elegido es minimalista y las acciones parecen orquestadas para la cámara; aun así, la capacidad de coordinar movimientos complejos sin un coordinador central constituye un avance técnico relevante.
Los próximos hitos a vigilar son la robustez de estos comportamientos fuera de condiciones controladas, la integración con protocolos de seguridad humana y la velocidad real a la que Figure podrá incrementar la producción sin sacrificar fiabilidad. Si la compañía cumple sus objetivos industriales, el debate sobre la convivencia entre humanoides y personas en fábricas y hogares dejará de ser teórico para convertirse en una cuestión práctica y cotidiana.

Hola, soy María, parte del equipo de MuyMac. Me dedico a analizar las tendencias que marcan nuestro día a día, desde innovaciones tecnológicas hasta nuevas modas, para mantenerte siempre actualizado.