깃허브, AI 훈련에 사용자 데이터 활용…기본 설정 논란
||2026.03.27
||2026.03.27
[디지털투데이 AI리포터] 깃허브가 이용자 데이터를 AI 모델 학습에 활용하는 정책을 도입하며 기본적으로 데이터 수집에 자동 포함되는 옵트아웃 방식으로 운영하기로 했다.
26일(현지시간) IT매체 테크레이더에 따르면, 마리오 로드리게스 깃허브 최고제품책임자(CPO)는 플랫폼이 사용자 데이터를 AI 모델 학습에 활용할 것이라고 밝혔다. 이 정책은 무료 사용자뿐 아니라 프로와 프로+에도 적용되지만, 코파일럿 비즈니스와 엔터프라이즈 계정, 학생 및 교사 계정은 대상에서 제외된다.
깃허브 블로그에 따르면 AI 모델 학습에는 AI 생성 콘텐츠와 사용자 피드백, 상호작용 데이터 등이 포함된다. 또한 프롬프트와 코드 스니펫 같은 입력 데이터, 수락된 콘텐츠와 수정된 제안 등 출력 데이터, 코드 맥락, 주석과 문서, 파일 이름과 저장소 구조, 코파일럿 사용 과정에서의 상호작용, 추천에 대한 긍정·부정 피드백 등이 활용된다.
이와 함께 이슈나 토론, 또는 저장 상태의 개인 저장소 콘텐츠는 학습 대상에서 제외된다. 다만 사용자가 코파일럿을 적극적으로 사용하는 경우에는 개인 저장소도 활용될 수 있다고 회사 측은 설명했다.
깃허브는 실제 개발자의 상호작용 데이터가 모델 학습을 크게 개선한다고 강조하며 사용자들의 데이터 공유에 감사를 표했다. 다만 이용자에게 옵트아웃 선택권이 주어지지만 기본 설정이 데이터 수집 참여로 되어 있어 일부 사용자들의 불만도 제기되고 있다.
고객님만을 위한 맞춤 차량
