
Los sistemas de inteligencia artificial generativa, como los modelos de lenguaje y los generadores de imágenes, han demostrado ser capaces de superar rigurosos exámenes que se exigen a quienes desean convertirse en médicos o abogados. Estas tecnologías no solo pueden competir con el rendimiento humano en diversas disciplinas, incluidas las olimpiadas matemáticas, sino que también son capaces de crear poesía, obras de arte y música en un nivel que, aunque no siempre es óptimo, muestra un avance significativo en su desarrollo. Sin embargo, a pesar de estas capacidades impresionantes, estos modelos son propensos a generar información incorrecta con gran confianza, lo que ha llevado a muchos expertos a cuestionar su habilidad para razonar efectivamente.
La diferencia fundamental entre los modelos de lenguaje y los seres humanos radica en la forma en que aprenden. Mientras que los humanos adquieren conocimiento a través de experiencias sensoriales y la interacción constante con su entorno desde una edad temprana, los modelos de lenguaje son entrenados utilizando grandes volúmenes de datos, en su mayoría extraídos de internet. Este enfoque les permite imitar el lenguaje humano, pero no les otorga una comprensión real de su significado. Este aspecto se vuelve crucial al considerar su aplicación en tareas que requieren un entendimiento profundo y contextualizado del mundo.
Un reciente estudio se centró en evaluar la capacidad de estos modelos para comprender combinaciones simples de palabras. Se diseñó un test que medía la capacidad de los modelos para juzgar la significación de pares de sustantivos. Los resultados del estudio revelaron que los modelos de lenguaje, en general, sobrestiman la significación de combinaciones que carecen de sentido para los hablantes humanos. A pesar de realizar ajustes en las instrucciones y proporcionar ejemplos adicionales para ayudar a los modelos a mejorar su rendimiento, los resultados seguían siendo insatisfactorios en comparación con la evaluación humana. Este hallazgo subraya la necesidad de continuar desarrollando estos sistemas de inteligencia artificial para que puedan alinearse más estrechamente con la manera en que los humanos comprenden y dan sentido al mundo que les rodea.