GPT-o1 vs. 클로드 3.7…사고력 더 뛰어난 AI는?
||2025.02.27
||2025.02.27
[디지털투데이 김예슬 기자] 앤트로픽이 클로드 3.7 소네트라는 새로운 모델을 출시했다.
이번 모델에서 특히 주목할 만한 점은 새로운 '확장된 사고 모드'(extended thinking mode, 이하 확장 모드)로, 이는 오픈AI의 GPT-o1과 유사하다. 클로드 3.7 소네트의 확장 모드는 GPT-o1의 사고력과 어떻게 다를지 26일 IT매체 테크레이더가 알아봤다.
클로드 3.7의 확장 모드는 하이브리드 추론 도구로 설계돼 사용자에게 빠른 대화형 응답과 심층적 단계별 문제 해결 간의 전환 옵션을 제공한다. 답변을 제공하기 전 프롬프트를 분석하는 데 시간이 걸리기 때문에 수학, 코딩 및 논리에 적합하다.
응답에 대한 생각 시간을 제한해 속도와 깊이의 균형을 맞출 수도 있다. 앤트로픽은 이를 계층적이고 체계적인 문제 해결을 요구하는 실제 응용 프로그램에서 AI를 더 유용하게 만드는 방법으로 제시하고 있다.
앤트로픽은 클로드 3.7의 확장 모드를 평가하기 위해 '몬티 홀 문제'(Monty Hall Problem)라는 고전 확률 퍼즐을 분석하고 설명하도록 요청했다. 이는 수학에 능숙한 사람도 속기 쉬운 까다로운 문제다.
확장 모드를 활성화한 클로드 3.7은 문제를 설명하는 데 있어 신중하고 거의 학문적인 접근 방식을 취했다. 단순히 정답을 제시하는 대신, 여러 단계를 통해 기본 논리를 신중하게 설명하며, 확률이 왜 변하는지를 강조했다.
또한 건조한 수학 용어로만 설명하지 않고, 가상의 시나리오를 통해 반복적인 시도에서 확률이 어떻게 나타나는지 보여줬다. 클로드 3.7의 응답은 마치 교수가 오류가 많은 직관이 왜 잘못되었는지를 천천히 설명하듯이 느껴졌다는 평가다.
GPT-o1도 비슷한 수준의 분석을 제공해 문제를 잘 설명했다. 다만 여러 형태와 스타일로 설명했는데, 기본 확률 외에도 게임 이론, 서사적 관점, 심리적 경험, 심지어 경제적 분석까지 다뤘다.
그러나 클로드 3.7은 몬티 홀 문제를 창에서 바로 플레이할 수 있는 게임으로 만들 수도 있었다. 동일한 프롬프트를 GPT-o1으로 시도했을 때는 같은 결과가 나오지 않았지만, 대신 o1은 브라우저에서 저장하고 열 수 있는 문제의 HTML 스크립트를 작성했다.
어떤 종류의 코드나 수학을 다루느냐에 따라 품질에 약간의 차이가 있을 가능성이 높지만, 클로드의 확장 모드와 o1은 모두 논리적 문제에 대한 견고하고 분석적인 접근 방식을 제공했다. 특히 클로드는 사고의 시간과 깊이를 조정할 수 있고, GPT-o1은 아주 무거운 분석이 필요하지 않는 한 너무 많은 시간을 들이지 않고 상당한 양의 콘텐츠를 생성할 수 있었다.
고객님만을 위한 맞춤 차량