앤트로픽, 충격 전망…"2028년 AI가 AI 만들고 인간 개입 사라질 수도"

앤트로픽이 AI가 AI를 연구 개발할 가능성을 60%로 전망했다. [사진: 셔터스톡]

[디지털투데이 AI리포터] 앤트로픽(Anthropic) 공동창업자 잭 클라크(Jack Clark)는 2028년 말까지 인간 개입 없이 인공지능(AI)이 차세대 AI를 연구·개발할 가능성이 60% 이상이라고 전망했다.

7일(이하 현지시간) 온라인 매체 기가진 등 외신에 따르면, 잭 클라크는 뉴스레터 '임포트 AI'에서 AI의 코딩 능력과 자율 연구 능력 향상 속도를 근거로 AI 연구개발 자동화가 예상보다 빠르게 현실화할 수 있다고 주장했다.

그는 "AI 연구가 엔드투엔드(end-to-end)로 자동화되는 시대에 들어섰다"라며 이런 흐름이 지속될 경우 "되돌릴 수 없는 단계로 진입할 수 있다"라고 밝혔다.

근거 중 하나로 소프트웨어 개발 능력을 평가하는 SWE-벤치(SWE-bench) 성능이 제시됐다. 2023년 최고 점수는 클로드 2(Claude 2)의 약 2% 수준이었지만, 지난 4월 공개된 '클로드 미토스 프리뷰'(Claude Mythos Preview)는 93.9%를 기록했다. 다만 일부 벤치마크는 상위 점수 구분에 한계가 있다는 지적이 있지만, 전반적인 성능 향상 자체는 명확하다는 평가다.

AI가 인간 개입 없이 연속 작업을 수행하는 시간도 핵심 지표로 제시됐다. 연구기관 METR에 따르면 GPT-3.5는 약 30초 수준의 작업을 수행했으며, GPT-4 o1은 약 4분, GPT-5.2 하이는 약 6시간까지 확장됐다.

올해 2월 공개된 클로드 오퍼스 4.6(Opus 4.6)은 약 12시간 규모 작업 수행이 가능한 것으로 제시됐다. METR 연구자인 아제야 코트라(Ajeya Cotra)는 2026년 말까지 AI 처리 시간이 100시간을 넘을 수 있다고 전망했다.

잭 클라크는 AI 연구 업무 상당 부분이 창의적 통찰보다 데이터 정리, 문헌 검토, 실험 실행 등 반복 작업으로 구성된다고 설명했다. 이러한 영역이 자동화되면 연구 전반이 AI로 대체될 수 있다고 주장했다. 실제로 과학 논문 재현 능력을 평가하는 CORE-벤치(CORE-bench)에서는 최고 점수가 약 1년 사이 21.5%에서 95.5%로 상승했다. 머신러닝 과제 수행 능력을 평가하는 MLE-벤치(MLE-bench)에서도 유사한 개선이 나타났다고 클라크는 설명했다.

앤트로픽은 이미 AI가 AI 연구 일부를 자동화하기 시작했다고 보고 있다. 4월 공개된 자동 정렬 연구 개념검증에서는 AI가 다른 AI 응답 품질을 개선하는 실험이 진행됐다. 이 실험에서 인간 감독 점수는 0.23이었으며, 클로드 오퍼스 4.6은 0.97을 기록했다. 다만 앤트로픽은 "AI 점수 개선이 곧 AI 정렬 과학자 수준을 의미하는 것은 아니다"라고 설명했다.

잭 클라크는 AI가 스스로 연구개발을 반복 개선하는 재귀적 자기개선 단계에 진입할 경우 정확도 누적 저하가 발생할 수 있다고 경고했다. 그는 시스템 정확도가 세대가 반복될수록 하락할 수 있다고 분석했다. 그는 AI가 AI를 설계하는 구조가 확산될 경우 경제 및 사회 구조에 큰 영향을 미칠 수 있다고 지적했다.

다만 2027년까지 해당 기술이 구현될 가능성은 약 30%로 낮게 봤다. 현재 AI는 창의성과 비정형적 통찰 측면에서 아직 제한적이라고 설명했다. 그는 2028년 말까지도 자동화된 AI 연구개발이 실현되지 않는다면 현재 기술 패러다임에 구조적 한계가 있을 가능성이 있다고 덧붙였다.