Una nueva plataforma permite a la inteligencia artificial aprender de la retroalimentación humana en tiempo real[embed]https://www.youtube.com/watch?v=sMlvE9wYxj0[/embed]

In Ciencia y Tecnología
diciembre 24, 2024

Una nueva forma de entrenar la inteligencia artificial: la retroalimentación humana en tiempo real

El entrenamiento de la inteligencia artificial (IA) ha avanzado considerablemente en los últimos años, permitiendo que tecnologías como los vehículos autónomos se conviertan en una realidad. Sin embargo, el método tradicional de enseñanza de la IA sigue siendo muy diferente al que se utiliza para capacitar a los seres humanos. Mientras que los conductores reciben orientación y correcciones en tiempo real, la IA ha dependido históricamente de grandes conjuntos de datos y simulaciones extensas para aprender. Investigadores de la Universidad de Duke y del Laboratorio de Investigación del Ejército de EE. UU. han desarrollado una plataforma innovadora llamada GUIDE, que permite a la IA aprender de una forma más parecida a la humana, incorporando retroalimentación continua y detallada de entrenadores humanos.

El funcionamiento de GUIDE se asemeja al de un instructor de conducción que ofrece consejos precisos y matizados durante el aprendizaje. En lugar de limitarse a dar instrucciones generales, el sistema permite que un entrenador humano observe las acciones de la IA en tiempo real y brinde comentarios adaptativos. En un estudio inicial, GUIDE fue utilizado para enseñar a la IA cómo jugar al escondite, donde un jugador controlado por IA debía buscar a otro. Durante este proceso, los entrenadores humanos no solo daban retroalimentación simple, sino que podían proporcionar evaluaciones detalladas a través de un sistema de escala, lo que resultó en una mejora significativa del rendimiento de la IA.

Los resultados del experimento fueron prometedores; solo diez minutos de retroalimentación humana lograron aumentar la tasa de éxito de la IA en un 30% en comparación con los métodos actuales de aprendizaje por refuerzo guiados por humanos. Además, los investigadores descubrieron que la intervención humana no tenía que ser prolongada. Se pudo crear un simulador de entrenador humano que, basado en las evaluaciones previas, continuó proporcionando retroalimentación a la IA, permitiendo que esta siguiera mejorando incluso después de que los humanos se retiraran del proceso de enseñanza. Este enfoque no solo optimiza el tiempo de los entrenadores, sino que también abre nuevas vías para investigar cómo las diferencias individuales entre los entrenadores pueden influir en la eficacia del aprendizaje de la IA.

/ Published posts: 2433

Diario obrero y republicano fundado el 14 de Abril de 2006.