AI 코딩, GPT-5.1·오푸스 4.5 이전과 이후로 나뉜다…하루 1만줄도 거뜬
||2026.04.07
||2026.04.07
[디지털투데이 홍진주 기자] 차세대 인공지능(AI) 모델 등장 이후 코딩 에이전트가 그럴듯한 코드 수준을 넘어 실제로 작동하는 애플리케이션(앱)을 만들어내기 시작하면서 개발 현장이 전환점을 맞고 있다는 평가가 나왔다.
6일(현지시간) 온라인 매체 기가진에 따르면, 소프트웨어 엔지니어 사이먼 윌리슨(Simon Willison)은 팟캐스트에서 "이전에는 출력된 코드를 매우 주의 깊게 검토해야 했지만, 최근 모델들은 지시대로 동작하는 결과를 내놓기 시작했다"고 말했다.
윌리슨은 특히 결과물의 신뢰도가 크게 달라졌다고 강조했다. 과거에는 실행조차 어려운 코드가 많았지만, 이제는 제대로 동작하는 앱이 생성되는 사례가 늘었다는 것이다. 이로 인해 코드 작성뿐 아니라 실행과 테스트의 일부까지 AI 에이전트가 맡는 흐름이 현실화되고 있다고 설명했다.
개발 생산성도 크게 높아졌다. 그는 AI의 도움을 받아 하루 최대 1만 줄 규모의 코드를 작성할 수 있게 됐다고 밝혔다. 코드의 경우 실행 여부로 품질을 비교적 명확하게 검증할 수 있다는 점도 장점으로 꼽았다. 반면 에세이 작성이나 법률 문서처럼 정답 판단이 어려운 영역은 AI 결과를 평가하기가 훨씬 까다롭다고 지적했다. 이어 실제로 변호사들이 AI의 허위를 걸러내지 못하는 사례도 적지 않다고 언급했다.
개발 속도가 빨라지면서 병목 구간도 이동하고 있다. 과거에는 사양 전달 이후 구현까지 수주가 걸렸지만, 이제는 몇 시간 내 결과를 받는 경우도 생겼다. 대신 다음 과제는 ‘테스트’로 옮겨가고 있으며, 빠르게 생성된 결과물을 검증하는 과정이 새로운 부담으로 떠오르고 있다.
프로토타입을 만드는 방식 역시 변화하고 있다. 윌리슨은 제품 개발에서 첫 아이디어는 반드시 틀린다는 전제 아래, 기능 하나를 설계할 때 서로 다른 동작 방식의 프로토타입을 여러 개 만들어 시험한다고 했다. 특히 사용자 인터페이스(UI) 설계에서는 챗GPT와 클로드 같은 도구가 설득력 있는 결과를 빠르게 제시한다고 평가했다. 다만 최적안을 가려내는 문제는 여전히 인간의 몫으로 남아 있으며, 전통적인 사용성 테스트가 여전히 중요하다고 덧붙였다.
다만 효율이 높아진 만큼 부담도 커졌다. 그는 여러 개의 코딩 에이전트를 동시에 운영할 경우 빠르게 피로가 누적될 수 있다고 설명하며, "AI 도구를 잘 쓰는 것은 생각보다 어렵고 많은 연습이 필요하다"고 강조했다. 특히 커리어 중간 단계의 엔지니어는 자동화에 따른 역할 변화 속에서 가장 큰 도전에 직면할 수 있다고 진단했다.
윌리슨은 마지막으로 인간과 AI를 가르는 요소로 '주체성'을 꼽았다. 그는 "조직력과 문제 해결 능력을 키우고, 새로운 기술을 적극 활용하는 태도가 중요하다"며, AI 시대에는 도구를 다루는 역량 자체가 경쟁력이 될 것이라고 강조했다.
고객님만을 위한 맞춤 차량
