[디투피플]"AI 고도화? 연합학습 활용 데이터 공유 활성화 주목해야"
||2025.08.11
||2025.08.11
[디지털투데이 황치규 기자]"AI를 고도화하려면 데이터 공유가 중요하지만 현실에서 기업과 기관들이 데이터를 공유하기는 만만치 않다. 공유에 대한 인식도 부족하다. 연합학습(Federated Learning)은 이같은 문제를 해결할 수 있는 솔루션이다. 물리적으로 데이터를 공유하지 않고도 공유하는 것과 같은 효과를 낼 수 있다."
김화종 한국제약바이오협회 K-멜로디(K-MELLODDY) 사업단장은 AI 고도화에 중요한 데이터 공유를 활성화할 카드로 연합학습이 현실적인 해법이라는 점을 분명히했다.
데이터는 다른 기관들끼리 결합했을 때 가치가 올라가고, 연합학습은 가명정보 결합이나 동형 암호 기술 등과 비교해 상대적으로 부담 없이 꺼낼 수 있는 카드란게 그의 설명이다.
김 단장은 데이터를 공유하기가 현실적으로 어려운 상황에서 대안을 고민하다 연합학습에 관심을 갖게 됐다. 2016년 구글이 연합학습 모델을 내놓으면서 실마리를 찾았고, AWS를 활용해 엔비디아 연합학습 플랫폼인 플레어(Flare) 프레임워크 기반 K-멜로디 프로젝트를 본격 추진한다.
K-멜로디 프로젝트는 국내 11개 대학, 9개 주요 제약회사, 8개 AI 개발사, 7개 연구기관, 3개 병원 등 총 38개 기관이 참여하는 R&D 이니셔티브로 아마존웹서비스(AWS)에서 신약 후보 물질 특성을 예측하는 학습 기반 AI 모델을 개발해 인체 대상 시험 이전 전임상 기간을 단축하는데 초점이 맞춰져 있다.
AWS 아시아 태평양(서울) 리전에서 실행되며, 연합학습을 지원하기 위해 아마존 버추얼 프라이빗 클라우드(Amazon Virtual Private Cloud, VPC)와 AWS 트랜짓 게이트웨이(AWS Transit Gateway)를 포함한 포괄적인 AWS 네트워킹 서비스 제품군을 활용해 참여 기관 간 안전한 통신을 지원한다.
김화종 단장에 띠르면 K-멜로디 프로젝트에 참여하는 국내 병원과 제약회사들은 각자 데이터로 AI 모델을 독립적으로 훈련하고 민간한 데이터가 아닌 결과 인사이트만 AWS에 있는 중앙 플랫폼에 공유한다. 예를 들어, 병원과 제약회사 같은 조직이 K-MELLODDY에서 협업할 때, 각자 민감한 데이터로 AI 모델을 학습시키고 모델 인사이트만 집계하는 방식으로 중앙에서 예측 모델을 향상시킬 수 있다. 연합학습 프로세스에서 중앙에서 여러 모델들을 합친 것은 글로벌 모델, 참여기관들 각각의 모델은 퍼스널라이즈드(Personalized) 모델로 불리운다.
김 단장은 "연합학습은 데이터를 공유하는게 아니라 데이터로 학습시킨 모델 가중치를 공유한다. 중앙에서 이들 모델들을 합친 후 이를 다시 참가자들에게 주고, 이런 과정을 반복하면서 모델을 발전시켜 나갈 수 있다"면서 "데이터 드리븐(Data Driven)이 아니라 모델 드리븐(Model Driven)이 핵심"이라고 강조했다.
그동안 한국에선 여러 조직들이 데이터를 공유해 AI 모델을 개발하는 사례들은 많지 않았다. 민감한 데이터 규제 이슈도 있었고, 조직들 사이에서 데이터 공유에 대한 문화도 뿌리를 내리지 못했다.
김 단장은 연합학습이 분위기 반전에 계기가 될 수 있을 것으로 기대하는 모습. 그는 "K-멜로디 프로젝트를 시작한 이후 예전에 비해 많은 이들이 연합학습을 통해 데이터를 공유하는 것에 대해 관심을 보이고 있다"면서 "신약 개발은 많은 시행착오들을 거쳐야 한다. AI를 활용하면 여기에 들어가는 에너지를 크게 줄일 수 있다"고 말했다.
연합학습을 활용한 K-멜로디 프로젝트는 신약 개발 외에 다양한 분야에 응용도 가능하다. 김화종 단장은 "제조업, 교육, 정부, 금융 등 다른 산업 분야에도 적용할 수 있다"면서 "스마트홈, 원격 유지보수, 엘리베이터, 교통 등에 적용하면 훨씬 시장이 커질 수 있다"고 말했다.
고객님만을 위한 맞춤 차량
