생명공학 영역 AI 활용 어디까지 왔나
||2024.11.09
||2024.11.09
올해 인공지능(AI) 전문가들이 노벨화학상을 수상하면서 생명공학분야에 AI를 접목시키고자 하는 움직임이 늘고 있다.
제약바이오 산업에서도 AI를 활용한 신약후보물질 탐색이 본격화되면서 이들의 활동범위가 어디까지 왔는지 관심이 집중된 가운데, 일각에서는 발전된 AI 알고리즘 만큼 양질의 데이터 관리에 관심을 기울여야 한다는 주장이 나온다.
관련 업계에 따르면 단백질 구조를 예측하고 새로운 단백질을 설계하는 AI의 개발자들이 2024년 노벨화학상을 수상하면서 생명공학 영역에 AI 도입이 가속화되고 있다. 수상자는 데이비드 베이커 미국 워싱턴대 교수와 데미스 허사비스 영국 구글 딥마인드 최고경영자(CEO), 존 점퍼 구글 딥마인드 수석연구원이다.
노벨상위원회는 이들이 AI를 활용해 생명의 기본 단위인 단백질의 구조를 이해하고 이를 이용해 새로운 단백질까지 만들어 내 생화학 분야에 혁신을 일으켰다고 평가했다.
단백질은 생체 분자 중에서도 특별한 기능을 하는 물질이다. 음식을 소화하는 효소부터 외부에서 들어 온 병원체와 싸우는 항체 등도 단백질에 해당한다.
이와 같은 이유로 특정 질병에 특화된 단백질을 생성할 수 있게 되면, 이전까지 불치병으로 간주된 질환을 치료할 수 있게 된다. 베이커 교수가 개발한 ‘로제타폴드(RoseTTAFold)’와 허사비스, 점퍼 연구원의 ‘알파폴드(AlphaFold)’는 단백질 구조를 분석하고 생성도 가능하게 만들었다.
실제 알파폴드의 경우 기존 수년이 걸리는 폐질환 신약후보물질 탐색을 단 46일만에 발굴하기도 했다. 로제타폴드의 초기 모델인 ‘로제타’는 2003년 세상에 없던 단백질을 설계하는 데 성공한 이후, 2022년 단백질 예측과 설계를 동시 수행가능한 ‘로제타폴드 디퓨전’으로 발전했다.
이를 활용해 3세대 항암제로 분류되는 면역 항암제를 만들 수 있다. 면역 항암제는 부작용을 최소화하면서도 효과를 극대화시켜 암 환자의 생존률을 크게 향상시킨다.
이에 따라 국내에서도 AI를 활용한 다양한 도전들이 이뤄지고 있다. 올해 조광현 한국과학기술원(KAIST) 바이오및뇌공학과 교수를 중심으로 구성된 연구팀은 암세포의 약물 반응을 높은 정확도로 예측하면서 예측 근거까지 제시하는 ‘그레이박스’ 기술을 공개했다.
그간 환자마다 유전자 변이가 달라 어떤 항암제를 써야 긍정적 효과에 도달할 수 있을지에 대한 예측이 어려운 상황이었다. 그레이박스는 여러 종류의 암 변이와 표적항암제 타깃 유전자 정보를 종합해 반응을 예측할 수 있다.
알파폴드처럼 단백질 구조를 예측해 신약개발에 활용하는 기술도 개발 중이다. 석차옥 서울대 화학과 교수가 창업한 신약 개발 기업 ‘갤럭스’는 세상에 없는 단백질을 만들어내 현존하는 의약품이 치료하지 못한 질병에 특화된 단백질을 만드는 연구를 진행 중이다.
일반적인 산업계에서는 신약후보물질 탐색 시간을 줄이기 위해 AI를 활용한다. 특히 AI를 활용하게 되면 기존 신약후보물질 탐색 비용을 50.5% 가량 절감시키는 효과가 있다는 연구도 존재한다.
JW중외제약은 올해 AI 기반 신약 연구개발(R&D) 통합 플랫폼 ‘제이웨이브’를 본격 가동했다. 제이웨이브는 기존에 운영하던 빅데이터 기반 약물 탐색 시스템인 ‘주얼리(JWELRY)’와 ‘클로버(CLOVER)’를 통합하고, AI 모델의 적용 범위를 대폭 확장한 것이 특징이다.
이 플랫폼은 JW중외제약 신약연구센터와 C&C신약연구소 연구진이 웹 포탈 환경에서 AI 기술을 활용해 질병을 일으키는 단백질에 작용하는 유효 약물을 신속하게 탐색하고 선도물질 최적화를 통한 신약후보물질 발굴에 이르기까지 전주기에 걸쳐 활용할 수 있도록 설계됐다.
대웅제약도 신약개발에 즉각 활용할 수 있는 주요 화합물 8억종의 분자 모델을 전처리를 거쳐 자체 데이터베이스화하고, 이를 바탕으로 신약 후보물질을 발굴해내는 독자적 AI신약개발 시스템을 개발했다.
대웅제약은 신약 후보물질 탐색의 첫 단계에 적용할 수 있는 ‘AIVS’ 툴을 개발, 이를 기반으로 지난해 AI 신약개발 시스템 ‘데이지(DAISY)’를 사내에 오픈하기도 했다. 데이지는 일종의 웹 기반 AI 신약개발 포털로, 대웅제약 연구원들은 데이지에 접속해 신규 화합물질을 발굴하고 약물성까지 빠르게 예측할 수 있다.
다만 일각에선 뛰어난 AI 기술과 함께 목표 탐색에 최적화된 양질의 생체 데이터 구축이 필요하다는 지적이 나온다.
이를 해결하기 위해 정부는 AI신약 후보물질 모델 구축 프로젝트를 출범했다. 신약 개발 연합체 사업 ‘K-멜로디(MELLODDY)’는 보건복지부와 과학기술정보통신부가 공동 추진하고 한국제약바이오협회가 주관하는 R&D 프로젝트다.
유럽(EU)의 ‘멜로디’ 프로젝트를 벤치마킹한 K-멜로디 사업은 2028년까지 5년간 사업비 총 348억원이 투입할 전망이다. 해당 프로젝트를 통해 협회는 ‘FAM(연합 약동학 모델)’ 솔루션을 제공하는 ‘FDD(연합 약물 탐색)’ 플랫폼을 구축할 계획이다.
기존 AI신약개발 모델은 데이터를 먼저 구축한 뒤 이를 응용할 과제를 찾는 방식이었다면, 연합학습 모델은 응용 목적을 정한 이후 기업·기관이 보유한 데이터로 모델을 학습시켜 목적에 맞는 데이터베이스를 사용 가능하도록 만드는 방식이다.
이는 무분별한 데이터 사용을 최소화시켜 개인정보 유출을 막고 상황에 맞는 최적의 데이터베이스를 활용할 수 있게 한다. 협회는 바이오벤처와 제약사를 비롯해 대학, 병원, 연구소 등의 데이터 종류를 파악해 2026년쯤 모델을 구체화할 방침이다.
제약바이오 업계 관계자는 “신약 탐색을 위해 AI 활용도가 꾸준히 증가하고 있는 것은 사실이지만 국내 산업계가 활용 중인 AI는 알파폴드와 로제타폴드에 비해 낮은 수준이다”면서도 “생체 데이터 활용에 대한 규제와 효과적인 데이터 구축이 이뤄진다면 국내에서도 AI를 활용한 블록버스터 신약이 탄생하는 날이 올 것이다”고 말했다.
김동명 기자 simalo@chosunbiz.com