“AI 개발에 이용자 데이터 활용 불확실성 커...기준 필요”
||2025.03.24
||2025.03.24
[디지털투데이 황치규 기자]고학수 개인정보보호위원회(이하 ‘개인정보위’) 위원장은 24일 오후 서울 강남 스타트업얼라이언스 엔스페이스(&Space)에서 AI 스타트업 관계자들을 만나 현장 애로‧건의 사항을 청취하고, 오픈소스 기반 국내 AI 생태계 발전 방안을 논의했다.
개인정보위가 간담회에 앞서 진행한 간이 설문조사에 따르면, 설문에 참여한 10개 기업 중 6개 기업에서 오픈소스 모델에 기반한 응용 서비스를 출시한 바 있고, 오픈소스 모델을 자체 보유한 이용자 데이터 등으로 추가학습하거나, 검색증강생성(RAG)을 통해 보강해 성능 개선에 활용한다고 답했다.
이번 간담회에 참석한 국내 AI 스타트업 관계자들은 오픈소스 모델을 연구‧활용한 주요 성과와 사례 등을 공유했다.
먼저, 하주영 스캐터랩 변호사는 오픈소스 모델과 관련 기술을 연구해 장점을 흡수하기 위한 노력을 설명하고, 구글 젬마, 딥시크 등 글로벌 오픈소스 모델이 국내 AI 생태계에 미치는 파급력에 대해 발표했다. 임정환 모레 AI 사업 총괄이 한국어 답변 성능 강화에 초점을 맞춰 서비스 중인 자사 언어모델을 소개하며 오픈소스 장점과 이로 인해 발생할 수 있는 프라이버시 위협 등에 대해 발표했다. 이재원 엘리스그룹 CISO(정보보호 최고책임자)는 AI 클라우드 인프라 제공 과정에서 오픈소스 모델을 활용한 사례를 소개했다.
발표 이후 진행된 자유 토론에서는 간담회에 참석한 기업들이 생성형 AI 개발‧도입 과정에서 경험한 데이터 및 개인정보 관련 다양한 애로‧건의 사항을 제시했다.
다수 기업은 자사 또는 고객사가 보유한 이용자 데이터를 AI 개발에 활용하는 경우 발생하는 법적 불확실성 문제에 애로가 있다고 밝혔다. 이를 위해 적법한 이용자 데이터 활용을 위한 명확한 법적 기준 안내, 익명‧가명 데이터 처리를 위한 구체적 방법론과 비식별데이터에 대한 재식별 평가기준 마련 등 다양한 건의사항이 제기됐다.
이 자리에서 개인정보위는 AI 신산업 발전을 지원하고 현장 불확실성 해소를 위해, ‘원칙 기반 규율’ 하에서 구체적 데이터 처리 기준을 제시한 사례 등을 소개했다. 이어 데이터 활용 장벽 해소를 위해 최근 제3차 국가인공지능위원회를 통해 발표한 AI 데이터 확충 및 개방 확대방안 주요 내용도 설명했다.
개인정보위는 이번 간담회 논의 결과를 바탕으로 국내 AI 확산 추세에 맞추어, 중소‧스타트업 등에게 실질적인 도움이 될 수 있는 개인정보 관점에서의 맞춤형 ‘생성형 AI 도입‧활용 안내서’를 마련할 계획이다.
고학수 개인정보위 위원장은 “경쟁력 있는 AI 혁신 생태계 발전을 위해서는 오픈소스 이점을 최대한 활용할 필요가 있다”며, “국내 기관‧기업에서 오픈소스 AI를 도입‧활용하는 과정에서 AI‧데이터 처리와 관련된 리스크 요인이 최소화될 수 있도록 중소‧스타트업 업계와 긴밀히 협력해 나가겠다"고 말했다.
고객님만을 위한 맞춤 차량