Los modelos de lenguaje y su similitud con el procesamiento cerebral
Los modelos de lenguaje de gran tamaño (LLMs, por sus siglas en inglés), entre los que destaca ChatGPT, han mejorado significativamente en su capacidad para procesar y generar lenguaje humano en los últimos años. Sin embargo, la relación entre estos modelos y los procesos neuronales que respaldan la comprensión del lenguaje en el cerebro humano aún no se ha aclarado completamente. Investigadores de la Universidad de Columbia y los Institutos Feinstein para la Investigación Médica de Northwell Health han llevado a cabo un estudio que examina las similitudes entre las representaciones de los LLM y las respuestas neuronales, cuyos resultados se han publicado recientemente en la revista *Nature Machine Intelligence*.
El estudio se centró en determinar si los modelos de lenguaje más recientes mantienen similitudes con el cerebro humano en su respuesta al lenguaje. Para ello, se analizaron doce modelos de código abierto desarrollados en los últimos años, todos con arquitecturas casi idénticas y un número similar de parámetros. Al mismo tiempo, los investigadores registraron respuestas neuronales en pacientes neurológicos que escuchaban discursos, utilizando electrodos implantados en sus cerebros como parte de su tratamiento. Este procedimiento permitió extraer las representaciones internas que los diferentes niveles de un LLM utilizan para procesar el texto y, a su vez, predecir las respuestas neuronales asociadas.
Los hallazgos de este grupo de investigación indican que a medida que los LLMs se vuelven más potentes, sus representaciones internas se asemejan más a las respuestas neuronales del cerebro ante el lenguaje. Sorprendentemente, también se observó que la alineación con la jerarquía del procesamiento lingüístico del cerebro mejora con el rendimiento del modelo. Esto sugiere que tanto los sistemas naturales como los artificiales están convergiendo hacia principios similares en el análisis y la producción del lenguaje, lo que podría tener implicaciones significativas para el desarrollo futuro de LLMs que se alineen mejor con los procesos mentales humanos.