생성형 AI, 인간 대체 아닌 ‘보조’로 자리 잡나
||2025.04.23
||2025.04.23
[디지털투데이 AI리포터] 신입사원의 업무는 단순했다. 클라이언트 예산과 팀 가용성을 고려해 웹 개발 프로젝트에 인력을 배정하면 끝이었다. 그러나 관련 파일에 접근을 제한하는 팝업창 하나를 닫지 못해 업무가 중단되는 문제가 발생했다. 신입사원은 팝업창의 'X' 버튼을 무시한 채로 HR 매니저에게 파일에 접근할 수 있도록 도와달라는 메시지를 보냈지만, 결국 IT 지원팀과 연결되지 못하고 업무는 미완료 상태로 남게 됐다.
다행히 이 직원은 실제 사람이 아니다. 카네기멜론대 연구진이 AI 에이전트의 실무 능력을 테스트하기 위해 만든 가상 시뮬레이션 속 직원이다. 이 실험은 인공지능(AI)이 실제 업무에서 얼마나 효과적으로 작동하는지 검증하기 위한 것이었다고 22일(현지시간) 비즈니스인사이더가 전했다.
구글, 아마존, 오픈AI 등 주요 기업들이 생성형 AI 에이전트 개발에 열을 올리고 있다. CEO들의 관심도 뜨겁다. 딜로이트 조사에 따르면, C레벨 리더의 25%가 자율 에이전트 도입을 적극 검토 중이다. 하지만 AI가 실제 업무를 얼마나 수행할 수 있는지는 여전히 미지수다.
카네기멜론대 연구진은 구글, 오픈AI, 안트로픽, 메타의 AI 모델을 대상으로 금융, 행정, 소프트웨어 엔지니어링 등 실제 업무 시나리오를 테스트했다. 결과는 기대에 못 미쳤다. 최고 성능을 보인 안트로픽(Anthropic)의 '클로드 3.5 소네트'(Claude 3.5 Sonnet)조차 전체 업무의 25%만 완료했다. 구글 '제미나이 2.0 플래시'(Gemini 2.0 Flash)와 챗GPT를 포함한 다른 모델들은 10%에 그쳤다. 연구진은 '어떤 분야에서도 AI가 대다수 업무를 수행하지 못했다'고 밝혔다.
AI 에이전트의 한계는 명확하다. 공감 능력, 사회적 기술, 복잡한 문제 해결 능력 등이 부족하다. 예를 들어, AI는 'answer.docx' 파일에 응답을 추가하라는 지시를 텍스트 파일로 인식해 제대로 작업을 수행하지 못했다. 또 동료와의 대화를 오해하거나 지시를 무시하는 경우도 빈번했다. 이는 AI가 다층적인 업무를 처리하는 데 한계가 있음을 보여 준다.
AI가 업무 효율을 높일 가능성은 있지만, 당장 인간을 대체할 수준은 아니다. 기업들은 AI를 완전한 대체보다는 보조 도구로 활용하는 방향으로 접근하고 있다. AI는 강력한 업무 보조 도구가 될 수는 있으나, 인간의 창의성과 사회적 기술을 대체하기에는 아직 갈 길이 멀다는 것이 이번 연구의 결론이라고 매체는 전했다.
고객님만을 위한 맞춤 차량