비싼 AI 서버 없이 인프라 성능 검증…KAIST, ‘가상 시험장’ 개발
||2026.05.29
||2026.05.29
[디지털투데이 이진호 기자] KAIST 연구진이 대규모 인공지능(AI) 서버를 구축하기 전 성능과 효율을 미리 검증할 수 있는 시뮬레이터를 개발했다. 값비싼 서버 장비를 실제로 구축하지 않고도 차세대 AI 반도체와 거대언어모델(LLM) 인프라를 미리 검증할 수 있는 '가상 실험장'이다.
KAIST는 박종세 전산학부 교수 연구팀이 개발한 LLM 서비스 인프라 시뮬레이터 'LLMServingSim 2.0' 연구가 컴퓨터 시스템 성능 분석 분야 학회 'ISPASS 2026'에서 최우수 논문상을 수상했다고 29일 밝혔다.
LLMServingSim 2.0은 다양한 하드웨어와 소프트웨어 조합을 컴퓨터 안에서 분석할 수 있는 시뮬레이션 플랫폼이다. 연구자와 개발자는 대규모 서버 인프라를 직접 구축하지 않고도 여러 설계안을 실험하고 성능을 검증할 수 있다.
이번 기술은 기존 그래픽처리장치(GPU) 중심 환경뿐 아니라 신경망처리장치(NPU), 프로세싱 인 메모리(PIM), CXL 기반 메모리 확장 장치 등 다양한 차세대 하드웨어 환경을 지원한다.
아직 상용화되지 않은 미래형 AI 반도체도 가상의 데이터센터 환경에서 미리 시험할 수 있다. 특정 반도체 적용 시 서비스 속도, 전력 소모, 대규모 서버 환경에서의 안정성 등을 사전에 분석할 수 있다는 게 연구팀 설명이다.
LLMServingSim 2.0은 실제 AI 서비스 운영 과정에서 발생하는 요청 처리, 배치 구성, 메모리 사용, 데이터 이동, 전력 소모 등을 시스템 수준에서 재현한다. 이를 통해 여러 요소가 맞물려 발생하는 병목과 효율 문제를 분석할 수 있다. 여러 서버 자원을 분리해 연결하는 분산형 인프라 환경까지 분석할 수 있어 차세대 AI 데이터센터 연구에도 활용이 가능하다.
이번 시뮬레이터는 LLM 서비스 기업과 AI 반도체 스타트업 등이 차세대 AI 인프라를 설계하고 최적화하는 데 활용될 전망이다. 연구팀은 LLMServingSim 2.0을 오픈소스로 공개했다.
박종세 교수는 "AI 서비스 경쟁력은 모델 자체뿐 아니라 이를 안정적이고 효율적으로 운영하는 인프라 기술에서 결정된다"며 "이번 시뮬레이터가 연구자와 산업계가 차세대 AI 인프라를 더욱 빠르고 효율적으로 개발하는 데 중요한 기반이 되길 기대한다"고 말했다.
전산학부 조재홍 석사과정 학생과 최현민 석사과정 학생이 공동 1저자로 주도한 이번 연구는 과학기술정보통신부, 정보통신기획평가원, 한국전자통신연구원, SK하이닉스 지원을 받아 수행됐다.
고객님만을 위한 맞춤 차량
