"AI 생성 소프트웨어 코드, 사람이 짠 것 보다 결함 많아"
||2025.12.18
||2025.12.18
[디지털투데이 황치규 기자]AI 기반 코드 생성 툴들이 코드 작성 효율은 높이지만, 치명적인 결함도 함께 증가시키는 것으로 나타났다.
17일(현지시간) 코드 리뷰 플랫폼 코드래빗(CodeRabbit) 보고서를 인용한 더레지스터 보도에 따르면 생성형 AI가 작성한 오픈소스 풀 리퀘스트(pull requests: PR) 470건을 분석한 결과, 사람보다 약 1.7배 더 많은 결함을 유발하는 것으로 나타났다.
PR은 소프트웨어 개발에서 협업 중인 개발자가 자신이 수정하거나 추가한 코드를 다른 사람에게 검토 요청할 때 사용하는 절차다.
보고서에 따르면 AI 작성 PR당 평균 10.83건 이슈가 발견된 반면, 사람이 작성한 PR은 평균 6.45건이었다. 코드에 포함된 결함에 대한 심각 수준도 AI가 더 컸다. AI 작성 코드는 주요 결함 기준에서 모두 인간보다 높은 수치를 보였으며, 심각한 오류(1.4배), 중대한 오류(1.7배) 비율이 높았다.
보안 측면에서는 AI가 짠 코드가 사람보다 더 취약했다. 비밀번호 처리 오류 발생률이 1.88배, 객체 참조 오류가 1.91배, XSS 취약점이 2.74배, 역직렬화 보안 문제는 1.82배 많았다. 성능 문제(1.42배), 유지보수성 문제(1.64배), 논리적 오류(1.75배) 등도 AI 코드에서 두드러졌다.
반면, 철자 오류는 사람이 작성한 코드에서 더 흔했다. 인간이 작성한 PR에서 철자 실수가 1.76배 많았고, 테스트 용이성 문제도 1.32배 많았다.
코드래빗 AI 책임자 데이비드 로커는 “AI 도구는 코드 생산성을 크게 높이지만, 예측 가능하고 측정 가능한 품질 저하도 동반한다”며, “조직은 이를 인식하고 적극적으로 통제할 필요가 있다”고 말했다.
고객님만을 위한 맞춤 차량
