빅데이터 너무 맹신했나... 계엄 징후 포착 어려워
||2024.12.04
||2024.12.04
빅데이터는 방대한 데이터를 분석해 사회적 현상을 이해하고 미래를 예측하는 강력한 도구로 여겨져 왔다. 하지만 3일 밤 발생한 윤석열 대통령의 비상계엄 선포 상황은 빅데이터의 한계를 적나라하게 드러냈다. 은밀하게 계획된 사건은 데이터로 드러나는 조짐을 포착하지 못하는 경우가 많다는 점에서 빅데이터의 맹신이 위험할 수 있다는 지적이 나온다.
빅데이터 분석은 일반적으로 웹 크롤링, 키워드 검색, 소셜 미디어 감정 분석 등을 통해 데이터를 수집하고 패턴을 찾아내는 방식으로 진행된다. 하지만 이는 ‘데이터의 가시성’에 크게 의존한다. 즉 데이터가 외부로 드러나야 분석이 가능하다는 것이다.
한 빅데이터 업계 관계자는 “계엄과 같은 정치적 사건은 정보가 극도로 제한적이며 비공개 채널에서 주로 논의된다. 관련 키워드가 외부에 나타나지 않기 때문에 데이터 수집 자체가 어렵다”고 설명했다.
실제 웹 및 소셜 환경의 빅데이터 분석 플랫폼 ‘썸트렌드’에서 지난 11월 한 달 간 ‘계엄’ 검색 결과 137건이 검색됐으나 이는 뉴스와 블로그 등 이미 외부에 노출된 데이터에 한정된다. 이 가운데 가장 큰 비중을 차지한 내용은 한강 작가의 소설 ‘소년이 온다’에서 소재가 된 5.18 민주화항쟁 때 선포된 ‘비상계엄령’이었다.
물론 빅데이터는 금융 시장의 이상 징후나 전염병 같은 점진적으로 전개되는 사건에 대해서는 어느 정도 예측이 가능하다. 예를 들어 금융 위기 전에는 시장 데이터의 비정상적 움직임을 통해 위기를 조기에 감지할 수 있었다. 코로나19의 경우 구글 트렌드에서 감염 증상과 관련된 검색량 급증으로 초기 징후를 파악한 사례도 있다.
하지만 계엄처럼 급작스럽고 은밀한 사건은 데이터의 부재와 짧은 시간적 제약으로 인해 예측이 거의 불가능하다. 이는 빅데이터의 태생적 한계를 드러내는 대표적 사례라고 전문가들은 지적한다.
세계적인 빅데이터 전문가 필 사이먼(Phil Simon)은 “빅데이터는 분석과 예측에 강력한 도구지만 모든 문제를 해결하는 만능 열쇠는 아니다. 데이터의 접근성과 가공 가능성에 따라 한계가 존재한다”고 말했다.
조상록 기자 jsrok@chosunbiz.com