Los chatbots impactan a los robots

David Morán

3 semanas ago

Estamos dentro de una evolución muy importante. El campo de los robots ha tenido un progreso impresionante en el último año, en la medida que los investigadores en las universidades y en el sector de tecnología han aplicado Inteligencia Artificial Generativa (IAGen) a los robots.

Especial de Laszlo Beke

La misma tecnología que habilita a chatbots como ChatGPT a mantener conversaciones y también habilita a sistemas como DALL-E a crear imágenes que lucen-realistas partiendo de descripciones en texto, le pueden proveer a los robots todo tipo de mejora cerebral.

Existe coincidencia general en el hecho que la IAGen mejorará la productividad de la economía mundial. También es cierto, que las economías avanzadas necesitarán automatización, y desean mantener su estándar de vida. Corea del Sur, Japón y China están entre los cinco países con mayor número de robots por trabajador en el sector de manufactura. No es ninguna coincidencia que están también entre los países que están envejeciendo más rápidamente. Sin robots, más personas tendrán que trabajar por más años y retirarse más tarde. En los próximos años, las actitudes podrían cambiar radicalmente, de temer la llegada de los robots a desear que hubieran llegado antes. El futuro de los robots luce promisorio, potenciado por varias tendencias en la evolución de los robots: autonomía de los robots, robots humanoides y robots colaborativos (Cobots).

La integración de IAGen y robótica ha sido una sorpresa para muchos. Por ejemplo, OpenAI el creador de ChatGPT, había dejado de trabajar con robots hace varios años, ahora ha cambiado de idea y ha estado contratando personal para su equipo de robótica. La anteriormente incorpórea Inteligencia Artificial Generativa ahora parece tener enorme potencial en los corpóreos robots. Los chatbots han influenciado significativamente el desarrollo de los robots, particularmente en sus capacidades de comunicación. Algunas de las razones claves en la cual esta influencia se manifiesta son:

Procesamiento de lenguaje natural – Los chatbots utilizan técnicas avanzadas de NLP, permitiendo a los robots entender y responder al lenguaje humano en una forma más efectiva. Esta capacidad permite a los robots interactuar con los usuarios en una forma más intuitiva y por ello más amigable para el usuario.

Automatización de tareas – Al integrar los chatbots, los robots pueden automatizar tareas que requieren una conversación-tipo-humana, como aquella que ocurre en forma natural en servicio al cliente o asistencia en diferentes ambientes. Esta integración le permite a los robots manejar solicitudes, proveer información e incluso realizar acciones basadas en requerimientos del usuario,

Aprendizaje y adaptación – Los chatbots potenciados por los LLM pueden aprender de las interacciones, mejorando sus respuestas con el tiempo. Esta adaptabilidad es clave para los robots que necesitan operar en un ambiente dinámico, permitiéndoles refinar sus acciones, basado en la retroalimentación de los usuarios y de los cambios situacionales.

Interacciones potenciadas – La combinación de chatbots y robots lleva a interacciones más interesantes y atractivas, muy útiles en roles como en el turismo y el cuidado de la salud.

Multimodal – Los nuevos modelos de IA combinan el entendimiento del lenguaje y la visión con la data proveniente de sensores y actuadores robóticos. Ello facilita lidiar con robots utilizando palabras cotidianas. Se le puede preguntar a un robot si es capaz de ver o decirle “que recoja la fruta amarilla”. De alguna manera, le permite al robot un grado de sentido común, el saber que la banana cercana es un tipo de fruta amarilla. Al igual que con un chatbot, se le puede decir a un robot que puede modificar su comportamiento simplemente cambiando un prompt de texto. Este tipo de ajuste, anteriormente hubiera requerida reprogramación compleja.

Explicación del razonamiento de las acciones del robot – Esto es útil cuando actúan en formas inesperadas o indeseables. Mientras los cerebros de los robots no estén dentro de cajas negras inescrutable, su programación y debugging es relativamente simple. Los nuevos modelos también tenderán a “alucinar” con menos frecuencia, por cuanto su percepción está basada en observaciones del mundo y su objetivo es hacer coincidir las realidades cognitivas y físicas. Por ello, son más seguros y confiables.

Aplicación generalizada – Los robots están mejorando al aprender rápidamente a través de la imitación y de la generalización de una habilidad a otra. Esto abre la puerta para que los robots puedan salir de las fábricas y almacenes. Varias empresas y grupos de investigación están usando los modelos más recientes de IAGen para construir robots humanoides, sobre el entendimiento que el resto del mundo, a diferencia de las líneas de ensamblaje, ha sido diseñado para gente que se mueve. Los mercados laborales, en el mundo desarrollado, están ajustados. Además, los robots pueden mejorar la productividad y también son capaces de cocinar, de limpiar y de cuidar a personas mayores o necesitadas.

Difusión

Es un proceso que se asemeja al aprendizaje de un aparato, a través de la estrategia de desarmarlo y de tratar de volver a ensamblarlo. En el caso de la generación de imágenes, esto involucra agregar a la imagen “ruido” al azar, hasta que se vuelva irreconocible, y entonces revertir el proceso para aprender los pasos involucrados en la creación de una nueva imagen. Para el entrenamiento de robots, IA utiliza la acción que se le ha enseñado para generar al azar nuevos movimientos potenciales, los cuales son posteriormente refinados y convertidos en acciones que les permiten lidiar con nuevos ambientes. Esto pudiera ser, levantar un plato que está en un ángulo poco común o una ensaladera que tiene una forma extraña. El robot continuará intentado estas acciones hasta que tiene éxito con la tarea. Usando difusión, un robot puede ser entrenado en unas horas para cargar a un lavaplatos, cuando programarlo en forma convencional tomaría un año o más.

Ahora los investigadores están tratando de reunir cientos de tareas en un Modelo Grande de Comportamiento (Large Behaviour Model – LBM). Este sería análogo a un LLM, que potencia servicios como ChatGPT. En lugar de generar respuestas basadas en información, tal como ha sido entrenado un LLM, un LBM tendría conjuntos de comportamientos, que pueden ser usados para generar nuevos comportamientos. Una vez que estas nuevas habilidades son adquiridas, se pueden transferir en forma inalámbrica de un robot a otro, en lo que se denomina “aprendizaje de flota”. Esto también acelera el proceso de entrenamiento.

Se hace referencia a Three reasons why it’s good news that robots are getting smarter y Robots can learn new actions faster thanks to AI techniques. También aparece en mi Portal https://tinyurl.com/yj8dp4pb. La imagen es cortesía de Bing Image Creator.

Compártelo: