왼쪽부터 서울대학교 화학생물공학부 정유성 교수(교신저자), 서울대학교 화학공정신기술연구소 김성민 박사후연구원(제1저자)
서울--(뉴스와이어)--서울대학교 공과대학은 화학생물공학부 정유성 교수팀이 미국 포덤대학교(Fordham University)와의 공동 연구를 통해 대규모언어모델(Large Language Model, LLM)을 활용해 신소재의 합성 가능성을 예측하고, 그 예측 근거를 해석하는 기술을 개발하는 데 성공했다고 밝혔다.
이 연구성과는 신소재 설계 과정에서 합성 가능성(synthesizability)이 낮은 후보 물질을 사전에 걸러내거나 기존에 합성이 어려웠던 물질을 보다 합성 가능성이 높은 형태로 최적화하는 데 기여할 것으로 기대된다.
서울대 김성민 박사후연구원이 제1저자로 참여한 이번 연구논문은 화학 분야 국제 저명 학술지인 미국화학회지(Journal of the American Chemical Society, JACS), 독일응용화학회지(Angewandte Chemie International Edition)에 각각 2024년 7월 11일, 올해 2월 13일에 실린 바 있다.
신소재를 개발할 때 소재의 합성이 실제로 가능한지의 여부를 정확하게 평가하는 과정은 매우 중요하다. 합성 가능성을 충분히 반영하지 않은 채 소재가 설계될 경우 실험적으로 검증되지 않은 가상의 구조를 대상으로 한 불필요한 실험을 초래할 수 있으며, 이는 연구 자원과 시간을 비효율적으로 소모하는 주요 원인으로 작용하기 때문이다. 신소재의 합성 가능성을 예측하는 정교한 기술이 필요한 이유다.
하지만 기존의 예측 기술은 소재의 열역학적 안정성을 지표로 평가하는 수준에 머물렀기 때문에 그 정확도가 낮았다. 따라서 평가 결과가 실제 실험의 합성 성공률과 크게 차이 나는 경우가 많았다. 이 문제의 보완을 위해 개발된 기계학습 모델도 합성 가능성을 분류하는 데 그쳤으며 무엇보다 예측 근거를 명확하게 설명 못하는 약점, 즉 해석 가능성(explainability)을 확보하지 못해 신뢰도가 낮은 한계가 있었다.
이러한 도전 과제를 해결하기 위해 연구에 나선 정유성 교수팀은 LLM을 도구로 활용할 경우 무기 결정 구조(Inorganic Crystal Polymorphs)의 합성 가능성을 정확하게 예측할 수 있을 뿐 아니라 해석 가능성도 확보할 수 있다는 사실을 밝혀냈다.
정 교수팀은 먼저 사람이 이해할 수 있는 텍스트 형태의 무기 결정 소재 데이터를 범용 LLM에 학습시키는 미세 조정(fine-tuning) 과정을 거쳤다. 그리고 가상 특정 물질의 합성 가능 여부를 분류하고, 합성에 필요한 전구체를 예측하는 동시에 합성 가능성 판단에 필요한 인자들을 밝혀내고 해석할 수 있는 모델을 구축했다. 그 결과, LLM은 기존의 맞춤형 기계학습 모델을 뛰어넘는 수준의 예측 정확도를 달성할 수 있었다.
또한 연구진은 LLM이 단순한 예측 수행에 그치지 않고, 과학자에게 해석 가능한 방식으로 신소재 합성이 가능한 이유를 설명할 수 있다는 점을 발견했다. 아직 합성되지 않은 가상의 결정구조의 합성이 왜 어려운지, 어떤 요소가 합성 가능성을 저해하는지 등에 관해 분석할 수 있는 길이 드디어 열린 것이다. 또한 소재의 합성 가능성에 영향을 주지만, 기존에는 알려지지 않았던 복잡한 상관관계 및 요소들을 규명하는 데에도 성공했다.
이 획기적인 합성 가능성 예측 및 해석 기술은 국내 신소재 산업은 물론이고 반도체, 2차전지 산업의 경쟁력 강화에도 기여할 것으로 기대를 모은다. 기존의 신소재 개발 방식은 숱한 시행착오를 거치는 실험 과정을 수반했지만, LLM 기반 예측 기술을 활용하면 소재 설계를 가속화해 소요 시간을 단축할 수 있기 때문이다.
특히 이 기술은 신소재에 기반한 반도체 소자 및 고효율 배터리 소재 설계에도 적용할 수 있으므로 한국 주도의 첨단 소재 산업이 기술 우위를 계속 유지하고 시장 선점 효과를 누리는 데 이바지할 수 있다. 아울러 향후 상용화될 경우 연구소와 기업이 새로운 물질을 빠르게 발굴하고, 실제 양산 가능성을 평가하는 핵심 도구로 활용될 것으로 전망된다.
정유성 교수는 “LLM이 신소재 합성 가능성을 정교하게 예측할 수 있을 뿐 아니라 그 예측 근거를 해석하고, 합성 가능성에 영향을 주는 화학규칙을 밝혀내는 단초를 제공할 수 있다는 사실을 밝혀냈다는 점에 이번 연구의 의미가 있다”면서 “향후 LLM 기반 기술이 발전하면 보다 효율적이고 직관적인 신소재 설계 방향을 제공할 수 있을 것으로 기대된다”고 밝혔다.
서울대학교 화학공정신기술연구소에서 근무 중인 김성민 박사후연구원은 앞으로 신소재 개발의 패러다임 변화를 모색하는 방향으로 기계학습과 재료과학을 융합한 후속 연구를 수행할 계획이다.
참고자료
1. 2025/02/13 발표 논문
- 논문명/저널 : ‘Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models’, Angewandte Chemie International Edition
- DOI : https://onlinelibrary.wiley.com/doi/10.1002/anie.202423950
2. 2024/07/11 발표 논문
- 논문명/저널 : ‘Large Language Models for Inorganic Synthesis Predictions’, Journal of the American Chemical Society