[AI 리더스] 이창선 교수 “제조 베테랑이라면 AI 모델 만들 수 있어야”
||2024.12.04
||2024.12.04
최근 AI 분야에서 산업 특화형 인공지능(AI)이 주목받고 있다. 특정 산업 분야에서 생성되는 데이터를 기반으로 만들어진 AI가 비용 절감, 공정 효율 향상 등의 실질적인 효과를 가져다주고 있어서다.
일반 사용자들을 대상으로 서비스를 제공하는 범용 AI 모델과는 확연히 다른 방향이다. AI 분야에서 세계 석학으로 불리는 인물 중 한 사람인 앤드류 응 교수(스탠퍼드대학교)는 산업 AI에 대해 “기업 환경에서는 수천 개의 고유한 문제가 존재하며 이를 해결하려면 수천 개의 맞춤형 솔루션이 필요하다”고 말한다.
실제 국내에서도 AI 기업들이 제조, 금융, 의료, 법률, 물류 등 여러 산업 분야에 적용할 수 있는 맞춤형 AI 솔루션을 출시하며 이 시장의 규모를 키우고 있다. 하지만 AI와 산업 간의 융합이 여전한 문제로 남아 있다. AI 전문가들은 산업의 특성을 모르고 산업 전문가들은 AI를 모른다는 것이다.
이에 대해 제조 환경의 AI 모델을 연구하는 이창선 교수(인하대학교)는 “산업 전문가들이 AI 모델을 구축할 수 있어야 한다”고 강조한다. 제조 환경에 적용되는 AI는 모델이나 기술보다 해당 산업에서 생성되는 데이터를 이해할 수 있어야 제대로 구현될 수 있다는 것이다.
이창선 교수는 이를 가능케 하기 위해 ‘AI 셰프’라는 개념을 만들었다. 산업 전문가도 쉽게 AI 모델을 만들 수 있는 개념이다. 그리고 이를 구현할 수 있는 모델도 개발했다. AI 셰프 그리고 직접 구축 가능하는 AI 모델에 대해 자세한 얘기를 들어봤다.
― 제조 AI 분야에서는 AI 전문가와 도메인(특정 산업 영역) 전문가의 융합 문제가 오랜 갈등이었다. 이를 해결하기 위해 도메인 전문가들이 AI 지식을 갖춰야 한다고 말하지만 말처럼 쉽지는 않은 것 같다.
“AI 전문가와 도메인 전문가의 지식 융합 필요성에 대해서는 이미 폭넓은 공감대가 형성돼 있다. 그러나 도메인 전문가가 AI를 학습해 직접 맞춤형 AI를 개발하는 사례는 매우 드물다. 이는 학습량이 지나치게 방대하기 때문이다.
일반적인 접근 방식은 AI 전문가가 도메인 전문가의 도움을 받아 맞춤형 AI를 개발하는 것이다. 하지만 이 과정에서 이질적인 지식의 충분한 융합이 이뤄지지 않는 문제가 자주 발생한다. 때문에 오히려 반대로 도메인 전문가가 AI 지식을 습득해 제조 현장에 적용하는 접근 방식이 더 효과적일 수 있다.”
― 하지만 도메인 전문가들이 AI 지식을 습득하기 쉽지 않은 것이 현실이다.
“그래서 AI 셰프라는 개념을 만들었다. 이 개념을 횟집으로 비교해보겠다. 수족관은 AI 엔진과 같은 인프라이고 물고기는 데이터다. 맛있는 회를 만들기 위해서는 생선을 잘 알고 잘 다루는 셰프가 있어야 한다. 마찬가지로 제조 현장에서도 수많은 데이터를 AI에 접목시켜 실질적인 효과를 줄 수 있는 특화된 AI 모델을 만드는 사람이 AI 셰프다.
앞서 AI 셰프가 AI 지식을 습득하기 어려운 현실을 언급했다. 그래서 누구나 쉽게 AI 모델을 만들 수 있는 모델 생성 AI ‘MG AI’를 개발했다.
구조는 이렇다. 먼저 엑셀에 제조 데이터를 입력한다. 그런 다음 이미 만들어진 AI 엔진을 거치면 그 현장에 맞춰진 AI 모델이 만들어진다. AI 셰프는 AI 모델을 보고 도메인 특성이 제대로 반영됐는지 확인한 다음 수정이 필요한 부분이 있으면 엑셀에 데이터 값을 바꿔가면서 최종적인 AI 모델을 만들어가면 된다.
쉽게 말해 건축물을 만들 때 설계사가 설계하듯 AI 셰프가 엑셀에 데이터를 입력하면 MG AI가 건축물을 만들어내는 역할을 하는 것이다. 이 과정에서 AI 셰프에 속하는 도메인 전문가는 코딩을 할 필요도 없고 AI에 전문 지식이 없어도 된다. 오직 해당 분야에 대한 전문성만 있으면 된다.”
― 문제는 할루시네이션일 것 같다. 어떤 제조 현장에서 제품을 생산하는데 환각 현상이 발생된다면 큰 문제를 야기할 것이다. 이를 해결할 수 있나.
“양질의 학습 데이터를 제공해야 대형언어모델(LLM)이 AI 할루시네이션(환각)을 일으키지 않는다.
이는 일반적인 AI와 제조 AI를 구분해서 봐야 한다. 일반적인 AI에서는 데이터와 결과값이 상관 관계에만 있으면 된다. 그러니까 어떤 이유에서 특정 결과값이 나왔는가를 굳이 알 필요 없다는 것이다. OTT 플랫폼인 넷플릭스를 예로 들면 시청자가 왜 스포츠 프로를 많이 보는지, SF 영화를 많이 보는지 알 필요 없이 시청 데이터값만으로 스포츠, SF 영화 프로를 추천해주면 된다.
반면 제조 AI는 인과 관계를 알아야 한다. 가령 제조 설비 중 하나에서 여러 데이터를 뽑았는데 특정 온도에서만 품질에 영향을 미친다는 결과가 나왔다면 왜 그런지를 알아야 한다는 것이다. 인과 관계를 알아야 설비 제어도 가능하다.
문제는 실제 제조 현장에서 생성되는 데이터는 항상 분포의 불균일성과 편향성을 포함하고 있다는 것이다. 다시 말해 데이터가 독립적이지 않고 종속성을 가지고 있다는 의미다. 앞서 온도 데이터를 예로 들면 온도가 변하더라도 습도, 압력 등의 다른 데이터가 변하지 않는다면 이는 독립적이며 온도에 따른 품질 변화를 파악할 수 있다. 하지만 실제로는 온도가 변하면서 습도, 압력 등 다른 데이터도 변하는 종속성을 가지고 있다는 것이다. 이 경우 도메인 전문가들은 그 이유를 잘 알지만 AI 모델은 인과 관계가 아닌 상관 관계를 학습하기 때문에 AI 환각을 유발할 수 있다.
결국 제조 도메인에 특화된 인과 관계로 구성된 도메인 지식을 활용하면 AI 환각을 인지하고 이를 최소화할 수 있다. 이를 통해 보다 신뢰할 수 있는 AI 모델을 개발하고 활용할 수 있다.”
― 도메인 전문가가 AI 셰프 과정을 통해 산업에 적용한 사례들이 있나.
“클래드 메탈 소재 기업인 한국클래드텍은 제조 데이터를 활용해 표면 불량 및 물성 불량을 예측하는 모델을 개발했다. 세아창원특수강은 소재 데이터와 신선사의 데이터를 병합해 소재 제조 조건과 신선 조건에 따른 단선 불량률을 예측하는 모델을 구축했다.
현재 현대자동차의 데이터를 기반으로 다이캐스팅 품질 예측 모델을 개발 중이다. 현대제철의 데이터를 활용해 물성 예측 모델을 개발하는 작업도 진행 중에 있다.”
― 실제 현장의 어려움이 있을 것 같다.
“데이터, AI, 그리고 AI 셰프는 디지털 전환을 위한 세 가지 핵심 요소다. 이 중 데이터 부족과 데이터 고립은 반드시 극복해야 할 중요한 과제다. 하지만 중소 제조기업들 상당수가 과거의 장비를 많이 사용하기 때문에 데이터 생성부터 어려움이 있다. 또 디지털 기반 데이터를 생성하는 현장이라도 하더라도 서로 다른 설비에서 나오는 데이터들이 연계돼 있어야 하는데 그렇지 못한 경우가 많다. 이럴 때는 데이터 연계 시스템부터 갖춰야 한다.”
― 어떻게 ‘MG AI’ 모델을 개발하게 됐나.
“포스코 재직 당시 후판 공정의 품질 향상을 담당했다. 이때 AI를 활용해 품질 향상에 대한 연구를 지속적으로 진행했다. 실제 다른 산업 현장을 보니 도메인 전문성은 있지만 AI를 활용하지 못하는 경우가 많다는 것을 알게 됐다.
인하대학교로 자리를 옮긴 후 제조 산업에서 쉽게 활용할 수 있는 AI 모델 개발에 전념하게 됐다.”
― 앞으로 어떤 부분에 더 중점을 두고 연구할 계획인가.
모델 생성 AI를 활용한 예측 모델을 통해 제조 기업에 실질적인 수익을 제공하는 사례를 확대할 계획이다. 이를 위해 모델 생성 AI의 사용자 친화성을 강화하고 새로운 기능을 추가하는 작업도 진행하고 있다.
사례 확대를 위해 제조 업종별로 고객에게 실질적인 도움을 줄 수 있는 고객 맞춤형 AI 행사(포럼, 콘퍼런스, 세미나, 워크숍)를 기획하고 있다. 제조 업종별로 요구되는 AI 기술과 활용 사례가 크게 다르기 때문에 이러한 행사를 통해 각 업종에 최적화된 AI 솔루션과 적용 사례를 소개할 예정이다.”
조상록 기자 jsrok@chosunbiz.com
고객님만을 위한 맞춤 차량