애플 AI 필터 뚫렸다…76% 성공률 보인 프롬프트 인젝션 취약점 발견
||2026.04.10
||2026.04.10
[디지털투데이 AI리포터] 애플이 온디바이스 인공지능(AI)의 내부 제한을 우회해 공격자의 명령을 강제 실행할 수 있는 보안 취약점을 발견하고, 최근 iOS 26.4 등 최신 OS 업데이트를 통해 관련 시스템의 방어막을 강화하며 문제를 해결했다.
9일(현지시간) IT 매체 나인투파이브맥에 따르면, 보안 연구진은 프롬프트 인젝션 기술을 결합해 애플 인텔리전스의 보안망을 뚫고 공격자가 의도한 동작을 수행하도록 유도하는 데 성공했다. 특히 연구진은 애플이 모델의 세부 작동 방식을 보안상의 이유로 비공개했음에도 불구하고, 입력과 출력 단계의 필터를 동시에 속이는 정교한 방식으로 보안 체계를 무너뜨렸으며 실험 과정에서 76%라는 높은 공격 성공률을 기록했다.
이러한 우회 공격이 가능했던 것은 두 가지 기술을 체인 형태로 연결해 사용했기 때문이다. 우선 연구진은 유해 문구를 역순으로 작성한 뒤 유니코드 우회 기술을 적용해, 화면에는 정상적으로 보이지만 데이터 검사 필터는 이를 인식하지 못하게 교란했다. 동시에 뉴럴 이그젝(Neural Exec)이라 불리는 기법으로 모델 고유의 안전 지침을 덮어씌워 공격자가 원하는 악성 명령을 실행하도록 만들었다.
이 과정에서 연구진은 애플 인텔리전스의 이중 보호 구조를 효과적으로 무력화했다. 일반적인 애플 AI 시스템은 입력 단계에서 유해성을 검사하고 결과물 생성 후 출력 필터가 재차 확인하는 구조를 갖추고 있으나, 연구진은 유니코드 조작과 행동 제어 기술을 동시에 구사해 이 모든 검문소를 통과했다. 이는 내부 로직을 블랙박스 형태로 유지하는 애플의 폐쇄적 보안 전략에도 불구하고 잠재적인 공격 경로가 존재할 수 있음을 입증한 사례로 평가받는다.
다행히 연구진은 지난 2025년 10월 해당 취약점을 애플 측에 제보했으며, 애플은 이를 바탕으로 보안 시스템을 즉각 고도화했다. 현재 관련 방어 패치는 iOS 26.4 및 맥OS 26.4 버전에 반영되어 전 세계 사용자들에게 배포를 마친 상태다. 이번 사례는 온디바이스 AI 시대에 걸맞은 더욱 강력한 보안 대책의 필요성을 시사하는 동시에, 제조사와 보안 전문가 간의 긴밀한 협력이 사용자 안전 확보에 얼마나 결정적인 역할을 하는지 다시 한번 각인시켰다.
고객님만을 위한 맞춤 차량
