"자 이제 누가 진짜지?" 사람보다 캡차 정확도 높은 AI 등장
||2024.12.03
||2024.12.03
[디지털투데이 AI리포터] '캡차'(CAPTCHA)를 인간보다 더 정확하게 입력하는 인공지능(AI)이 등장했다.
2일(현지시간) 온라인 매체 기가진에 따르면 풀스택 소프트웨어 개발자 블랙잭은 머신러닝을 이용해 캡차를 돌파하는 프로젝트를 진행했다.
그는 스크립트를 작성해 세계 최대 규모의 이미지 게시판 '4chan'의 캡차 이미지 수백 개를 스크래핑하고, 이를 통해 모델 학습을 위한 데이터를 얻었다. 그는 캡차 이미지에서 글자를 제거하고 노이즈만 남기는 방법을 통해 캡차 이미지에 포함된 문자의 구성 요소인 '큰 윤곽선'만 제거하는 것에 성공했다. 이후 스크립트로 문자를 추출하고, 마이크로소프트(MS)의 오픈소스 소프트웨어인 VoTT를 이용해 수동으로 태그를 붙여 각 문자마다 50~150개의 이미지를 수집했다.
훈련용 데이터 셋에는 수작업으로 생성된 약 500개의 정답 캡차 이미지와 약 5만 개의 합성 생성 이미지가 포함됐다. 이후 3개의 컨볼루션 층을 가진 컨볼루션 신경망(CNN)과 2개의 장단기 기억(LSTM) 층을 결합한 LSTM CNN 아키텍처의 모델을 구축해 데이터 셋으로 훈련했다.
이렇게 개발된 AI 모델은 4chan의 캡차를 90% 이상의 정확도로 돌파할 수 있었다. 이는 사람이 직접 캡차를 푸는 80%의 정확도보다 높은 수치다. 블랙잭은 이 프로젝트를 통해 머신러닝과 컴퓨터 비전에 대해 배울 수 있었다고 전했다.
고객님만을 위한 맞춤 차량