Google ha publicado un nuevo punto de referencia de código abierto que, según dice, permitirá a los robots realizar tareas escribiendo su propio código en respuesta a instrucciones escritas por humanos.
La empresa ha puesto en marcha un nuevo sitio web para dar a conocer "Code as Policies (opens in new tab)" (CAP), mediante el cual las instrucciones escritas en inglés sencillo pueden interpretarse en programas generados por modelos de lenguaje (LMP) escritos en código Python.
CAP es el sucesor de PaLM-SayCan (opens in new tab), un proyecto que, de forma similar, permitía dirigir un robot ayudante físico mediante órdenes en inglés sencillo. CAP promete permitir la realización de tareas más complejas con mayor precisión, en parte gracias a que permite a las máquinas escribir su propio código.
Robots que se codifican solos
En una entrada de blog (opens in new tab) sobre el lanzamiento de CAP, Jacky Liang, becaria de investigación de Google, y Andy Zeng, investigador científico, describen la motivación de esta tecnología y lo que podría significar para el futuro.
"¿Qué pasaría si, cuando recibieran instrucciones de las personas, los robots pudieran escribir de forma autónoma su propio código para interactuar con el mundo? Dadas las instrucciones en lenguaje natural, los modelos lingüísticos actuales son muy competentes a la hora de escribir no sólo código genérico sino, como hemos descubierto, también código que puede controlar las acciones de los robots".
Pero quizá no sea el momento de tirar el portátil para programar todavía. En las pruebas, los investigadores de Google demostraron comandos sencillos con una estructura similar. Los robots de prueba fueron capaces de "dibujar un hexágono de 5cm en ll centro de la pizarra" y "poner los bloques en una línea horizontal cerca de la parte superior de un cuadrado".
> Ant-Man y la Avispa: Quantumanía: fecha de estreno, tráiler y más (opens in new tab)
> Deberías comprar el iPhone 14 Pro antes de que llegue el Black Friday - Te explico por qué (opens in new tab)
> ¿Valen la pena las freidoras de aire? (opens in new tab)
En el documento adjunto (opens in new tab), titulado "Code as Policies: Language Model Programs for Embodied Control", el equipo del proyecto admite que actualmente CAP no tiene capacidad para tratar órdenes especialmente abstractas o complejas ni para percibir descripciones de trayectoria. El enfoque del equipo tampoco tiene en cuenta las órdenes imposibles que se introducen en CAP.
En teoría, la naturaleza de código abierto de la implementación "centrada en el robot" de Google en Python podría dar lugar a una implementación mucho más rápida de las soluciones a estos problemas. El sitio web de CAP también contiene versiones a través de Github (opens in new tab), y una demostración interactiva a través de Google Colab (opens in new tab) para describir cómo los robots "escriben" código en respuesta a los comandos.