
Un equipo de investigación de la Universidad Nacional de Seúl, liderado por el profesor Yousung Jung, ha desarrollado una innovadora tecnología que utiliza modelos de lenguaje de gran tamaño (LLMs) para predecir la sintetizabilidad de nuevos materiales y para interpretar las bases de dichas predicciones. Este avance, realizado en colaboración con la Universidad Fordham de Estados Unidos, promete transformar el proceso de diseño de materiales al permitir la selección anticipada de candidatos con baja capacidad de síntesis.
Los hallazgos de este estudio, publicado en dos revistas de química, el Journal of the American Chemical Society y Angewandte Chemie International Edition, son de gran relevancia para el sector de los materiales avanzados. La evaluación precisa de la viabilidad de sintetizar un material es crucial en el desarrollo de nuevos compuestos. Cuando el diseño de materiales no considera adecuadamente la sintetizabilidad, se corre el riesgo de realizar experimentos innecesarios sobre estructuras hipotéticas no verificadas, lo que conlleva un uso ineficiente de los recursos de investigación.
Las técnicas de predicción existentes se han limitado principalmente a evaluar la estabilidad termodinámica de los materiales, lo que ha resultado en una baja precisión y en discrepancias significativas entre las predicciones y las tasas de éxito en la síntesis experimental. Aunque se han desarrollado modelos de aprendizaje automático para abordar este problema, estos se han centrado principalmente en la clasificación, sin ofrecer explicaciones sobre el razonamiento detrás de sus predicciones, lo que genera dudas sobre su fiabilidad.
Un enfoque innovador con LLMs
Para superar estos desafíos, el equipo de Jung ha demostrado que los LLMs no solo pueden predecir con precisión la sintetizabilidad de polimorfos cristalinos inorgánicos, sino que también pueden proporcionar explicaciones interpretables sobre por qué un material particular es sintetizable. Este descubrimiento abre nuevas posibilidades para analizar las razones por las cuales ciertas estructuras cristalinas hipotéticas son difíciles de sintetizar y para identificar los factores que obstaculizan la sintetizabilidad.
El equipo comenzó afinando un LLM de uso general con conjuntos de datos de materiales cristalinos inorgánicos en un formato textual. El modelo fue entrenado para clasificar la sintetizabilidad de materiales hipotéticos específicos, predecir los compuestos precursoras necesarios para la síntesis y reconocer e interpretar los factores clave que influyen en la sintetizabilidad. Como resultado, el LLM logró un nivel de precisión predictiva superior al de los modelos de aprendizaje automático diseñados específicamente para esta tarea.
Además, se constató que los LLMs pueden ir más allá de las meras predicciones y ofrecer explicaciones interpretables sobre las razones de la sintetizabilidad de un material en particular. Esta tecnología innovadora se espera que contribuya significativamente a la industria de materiales avanzados en Corea del Sur, mejorando la competitividad en sectores como el de los semiconductores y las baterías secundarias. Los métodos tradicionales de descubrimiento de nuevos materiales suelen requerir numerosos experimentos de prueba y error, mientras que la tecnología predictiva basada en LLM puede acelerar el diseño de materiales y reducir el tiempo de desarrollo.
El profesor Jung ha declarado que este estudio es significativo porque demuestra que los LLMs pueden no solo predecir con precisión la sintetizabilidad de nuevos materiales, sino también interpretar el razonamiento detrás de esas predicciones y desvelar principios químicos subyacentes. A medida que las tecnologías basadas en LLM continúan evolucionando, se espera que proporcionen direcciones más eficientes e intuitivas para el diseño de nuevos materiales.