서울대학교 공과대학 화학생물공학부 정유성 교수 연구팀이 미국 포덤대학교(Fordham University)와 공동 연구를 통해 대규모언어모델(LLM, Large Language Model)을 활용해 신소재의 합성 가능성을 예측하고 그 근거를 해석하는 기술을 개발했다고 밝혔다.

이번 연구 성과는 신소재 설계 과정에서 합성 가능성이 낮은 후보 물질을 사전에 걸러내거나, 기존에 합성이 어려웠던 물질을 보다 합성 가능성이 높은 형태로 최적화하는 데 기여할 것으로 기대된다.
서울대 김성민 박사후연구원이 제1저자로 참여한 연구 논문은 화학 분야 국제 저명 학술지인 미국화학회지(Journal of the American Chemical Society, JACS)와 독일응용화학회지(Angewandte Chemie International Edition)에 각각 2024년 7월 11일과 올해 2월 13일 게재됐다.
신소재 개발에서 중요한 과제 중 하나는 특정 소재가 실제로 합성이 가능한지를 평가하는 것이다. 기존 합성 가능성 예측 기술은 소재의 열역학적 안정성을 기반으로 평가하는 수준에 머물러 있었으며, 실험 성공률과의 차이가 컸다. 이를 보완하기 위해 개발된 기계학습 모델도 합성 가능성을 단순히 분류하는 데 그쳤으며, 예측의 근거를 명확히 설명하지 못하는 해석 가능성 부족 문제로 신뢰도가 낮았다.
정유성 교수 연구팀은 이러한 한계를 극복하기 위해 LLM을 활용해 무기 결정 구조(Inorganic Crystal Polymorphs)의 합성 가능성을 보다 정확하게 예측하고, 예측의 근거를 해석할 수 있는 기술을 개발했다.
연구팀은 먼저 사람이 이해할 수 있는 텍스트 형태의 무기 결정 소재 데이터를 범용 LLM에 학습시키는 미세 조정(fine-tuning) 과정을 진행했다. 이후 특정 물질의 합성 가능성을 분류하고, 합성에 필요한 전구체를 예측하는 동시에 합성 가능성 판단에 필요한 요소를 해석하는 모델을 구축했다. 그 결과, LLM은 기존 기계학습 모델보다 높은 예측 정확도를 기록하며 성능을 입증했다.
연구진은 LLM이 단순한 예측 수행을 넘어, 과학자들에게 합성 가능성과 관련된 요인을 분석하고 설명할 수 있는 능력을 갖추고 있음을 확인했다. 이에 따라 아직 합성되지 않은 가상의 결정구조가 왜 합성이 어려운지, 어떤 요소가 영향을 미치는지를 분석할 수 있는 길이 열렸다. 또한, 소재 합성 가능성에 영향을 미치지만 기존에는 밝혀지지 않았던 복잡한 상관관계와 요소들을 규명하는 데 성공했다.
이번 연구에서 개발된 기술은 신소재 산업뿐만 아니라 반도체 및 2차전지 산업의 경쟁력 강화에도 기여할 것으로 기대된다. 기존 신소재 개발 방식은 시행착오를 거치는 실험 과정이 필수적이었으나, LLM 기반 예측 기술을 활용하면 소재 설계를 가속화하고 연구에 소요되는 시간을 대폭 단축할 수 있다.
특히, 이 기술은 반도체 소자 및 고효율 배터리 소재 설계에도 적용될 수 있어, 한국 주도의 첨단 소재 산업이 기술 우위를 확보하고 시장 선점 효과를 누리는 데 기여할 것으로 전망된다. 향후 상용화될 경우 연구소 및 기업이 새로운 물질을 빠르게 발굴하고, 실제 양산 가능성을 평가하는 핵심 도구로 활용될 것으로 보인다.
정유성 교수는 “LLM이 신소재 합성 가능성을 정교하게 예측할 뿐만 아니라, 그 근거를 해석하고 합성 가능성에 영향을 미치는 화학적 규칙을 밝히는 데 도움을 줄 수 있다는 점에서 이번 연구의 의미가 크다”고 설명했다. 이어 “향후 LLM 기반 기술이 더욱 발전하면 보다 효율적이고 직관적인 신소재 설계 방향을 제공할 수 있을 것”이라고 덧붙였다.
한편, 서울대학교 화학공정신기술연구소에서 근무 중인 김성민 박사후연구원은 신소재 개발의 패러다임 변화를 모색하는 방향으로 기계학습과 재료과학을 융합한 후속 연구를 수행할 계획이다.