“문서 속 분자구조까지 읽는다”… LG 심층문서이해 모델 ‘MolMole’ 공개
||2025.05.16
||2025.05.16
LG 인공지능(AI)연구원이 문서 속 분자구조식까지 읽어내는 화학 분야 특화 심층문서이해(DDU·Deep Document Understanding) 모델 'MolMole'을 공개했다.
16일 LG AI 연구원 블로그에 따르면 MolMole은 실제 연구 현장의 니즈를 반영해 하나의 프레임워크로 구현했다. 기존 화학 분야 DDU 기술은 분자구조식 이미지를 모델에 입력하면 이를 변환하는 데 그쳤다. 실제 연구 현장에서 사용되는 특허나 논문 등의 자료는 대부분 PDF 문서 형태로 존재하며 PDF 문서 속 이미지를 일일이 잘라 입력해야 하는 번거로움이 있었다.
이러한 불편함을 개선하기 위해 MolMole은 PDF 문서를 그대로 모델이 입력할 수 있도록 구현됐다. MolMole에 PDF 문서를 입력하면 한 번에 분자구조 등 화학 데이터를 인식해 제공한다.
MolMole과 같은 화학 분야 특화 DDU 모델이 상용화되면 분자구조식에 대한 대규모 데이터 베이스 구축이 가능해진다. 이를 통해 화학자들은 원하는 구조식을 신속하게 검색하고 방대한 화학 데이터를 기반으로 새로운 물질을 설계하거나 연구를 더욱 체계적으로 확장할 수 있게 된다. 이는 단순한 연구 효율성 향상을 넘어 신약 개발, 신소재 탐색 등 화학 산업 전반의 혁신을 가속하는 데 핵심적인 역할을 할 전망이다.
그간 LG AI 연구원은 '세상의 모든 문서를 이해하는 AI'를 구현하는 것을 목표로 DDU 기술을 연구해 왔다. LG의 DDU 기술은 일반 문서의 텍스트, 그래프, 테이블을 이해하는 것은 물론 화학 논문과 특허 속 복잡한 분자구조식, 반응식까지도 해석해 낸다.
LG AI 연구원은 "DDU 기술을 통해 화학 분야 핵심 정보를 정밀하게 해석하고 구조화함으로써 차세대 고성능 추론 모델의 학습 기반을 마련하는 데 기여하고자 한다"며 "MolMole을 시작으로 LG는 세상의 모든 문서를 완벽히 이해하고 해석하는 DDU 기술을 선도해 나가겠다"고 밝혔다.
김광연 기자
fun3503@chosunbiz.com
고객님만을 위한 맞춤 차량