설정 꺼도 소용 없다…챗GPT 클로드 등 AI, 데이터 자동 수집 논란
||2026.04.20
||2026.04.20
[디지털투데이 AI리포터] 주요 인공지능(AI) 애플리케이션(이하 앱)이 이용자의 대화와 입력 정보를 향후 모델 학습에 활용할 수 있어 개인정보 관리의 중요성이 커지고 있다.
18일(현지시간) IT 매체 나인투파이브맥에 따르면, 챗GPT, 클로드(Claude), 제미나이(Gemini), 알렉사(Alexa), 시리(Siri) 등 주요 서비스는 이용자가 데이터 수집 및 학습 활용 여부를 직접 끌 수 있는 설정 기능을 제공하고 있다
최근 한 연구에서는 AI 챗봇 이용자의 약 3분의 1이 매우 사적인 대화를 나누는 것으로 나타났다. 민감한 정보뿐 아니라 일반적인 질문과 대화 과정에서도 개인 정보가 포함될 가능성이 있다는 점이 문제로 지적됐다.
스탠퍼드대학교의 별도 연구에 따르면, 미국 주요 AI 기업 6곳은 이용자 입력 데이터를 향후 모델 학습에 재활용하고 있는 것으로 나타났다. 서비스 약관에 대화 데이터를 차기 모델 훈련에 사용할 수 있도록 명시된 경우가 많기 때문이다. 이로 인해 향후 유사한 질문 응답 과정에서 이용자 정보가 의도치 않게 노출될 가능성도 제기된다.
문서 업로드 기능 확산은 위험을 더 키우고 있다. 계약서, 이력서, 회의 자료 등 민감 정보가 포함된 문서가 AI 분석 대상으로 활용되면서, 해당 내용이 학습 데이터로 재사용될 가능성이 있다는 지적이다. 기본 설정 자체가 데이터 활용을 허용하는 경우가 많아 위험성이 구조적으로 존재한다.
이용자는 각 서비스 설정을 통해 데이터 활용을 제한할 수 있다. 챗GPT는 설정 메뉴에서 '모든 사용자 대상 모델 개선' 기능을 끌 수 있다. 클로드는 개인정보 보호 설정에서 '클로드 개선에 도움 주기' 항목을 비활성화하면 된다. 제미나이는 구글 활동 페이지에서 사용 설정과 음성 데이터 활용 항목을 끌 수 있다.
알렉사는 앱 내 개인정보 메뉴에서 음성 녹음 사용을 비활성화하면 되고, 시리는 iOS 설정의 개인정보 및 보안 항목에서 '시리 및 받아쓰기 향상'을 끌 수 있다.
메타 AI의 경우는 상황이 다르다. 메타는 데이터 수집 거부 옵션을 여러 단계 메뉴에 숨기거나 위치를 변경해왔고, 현재는 사실상 해당 선택지가 제한된 상태로 알려졌다. 이용자가 직접 요청해야 하는 구조로 바뀌면서 통제권 문제도 함께 제기되고 있다
다만 앱 내 설정을 변경하더라도 개인정보 노출 위험이 완전히 사라지는 것은 아니다. 데이터 브로커가 공개 정보를 수집해 재판매할 수 있으며, 이는 스팸, 사기, 신원 도용 등으로 이어질 수 있다. 삭제 요청도 가능하지만 대상이 분산돼 있고, 재수집 가능성도 있어 관리가 쉽지 않은 상황이다.
고객님만을 위한 맞춤 차량
