AI가 볼 수 없는 문서, 마지막 문제는 ‘사람’ [줌인IT]
||2026.05.20
||2026.05.20
한국형 문서를 상징하는, 한컴의 ‘한글’ 파일 형식이 다시금 논란의 중심에 섰다. 이번에는 최신 인공지능(AI) 기술이 한글 문서를 제대로 읽을 수 없다는 이유다. 사실 이번과 같은, 한글 이외의 시스템에서 문서를 읽을 수 없는 폐쇄성에 대한 문제는 이미 길게는 수십 년째 이어져 오는 한국 IT 생태계의 해묵은 숙제 중 하나로 꼽힐 정도다.
공공 문서의 실질적 표준인 한컴의 ‘한글’은 전 세계적으로도 찾기 힘든 로컬 시장의 강자다. 이미 전 세계 오피스 스위트 시장은 마이크로소프트 오피스가 사실상의 글로벌 표준이 된 지 오래다. 윈도 생태계의 강력한 영향력에도 이 ‘오피스’는 핵심 요소로 꼽힌다. 이렇게 전 세계를 휩쓴 오피스지만, 한국에서는 유독 ‘한글’에 밀렸다. 이는 한글의 특수성도 있지만, ‘한글’을 쓰는 한국 시장의 특수성도 고려할 필요가 있다.
국내 공공기관이 예전부터 ‘한글’을 기반으로 업무 시스템을 구성한 데는 여러 가지 이유가 있을 것이다. 오랜 역사로 검증된 국내 소프트웨어기도 하지만, 개인적으로는 ‘한글’만이 표현할 수 있는 국내 문서 시장의 독특한 요구 사항 때문이라고도 본다. 이는 언어의 문제를 넘어 업무 ‘문화’의 특징까지 생각해야 한다. 이러한 독특한 요구사항들을 만족시킬 수 있는 것은 예나 지금이나 ‘한글’ 뿐이라는 게 현실이 아닌가 싶다.
이미 ‘한글’을 둘러싼 논쟁은 오랫동안 이어져 왔다. 본지 역시 지난해 8월 ‘공공DB의 과제’ 기획에서 이러한 부분을 다뤘다. 하지만 앞으로도 우리는 ‘한글’을 쉽게 포기할 수 없을 것이다. 단지 국산이기 때문이 아니라, 우리가 지금 필요한 문서를 제대로 만들 수 있는 유일한 도구가 ‘한글’이기 때문이다.
여기에는 한국 시장에서만 사용되는 집요할 정도의 ‘서식’이 있다. 시장의 요구에 따라 발전해 온 ‘한글’의 편집과 조판 기능은 전문 DTP 프로그램에 근접할 정도에 이른 상황이다. 문서의 중심에 ‘표’가 있고, 구조를 맞추기 위해 ‘표 안의 표’와 밀리미터 단위의 배치를 불사하며, 눈에 보이는 자간을 맞추기 위해 눈에 보이지 않는 공백을 넣어 종이로 출력했을 때 깔끔하게 보이게 하는 것이 우리의 문서다. 이런 문서를 XML로 만들어 AI가 온전히 읽었다 해도 개체간 맥락과 의미를 제대로 파악할 수 있을지는 의문이다.
현재 우리의 당면 과제는 단지 파일 형식의 문제로 보면 해결하기 어렵다. 최근 정부는 시스템에서의 기본 저장 형식을 ‘HWP’가 아닌 XML 기반의 ‘HWPX’로 전환하겠다 했지만, 이것만으로는 문제가 해결되지 않을 것이다. ‘HWPX’는 도입된 지 10년 이상 지났지만, 아직도 제대로 사용되지 않는다. 표준 문서 형식으로 지정된 ODT(OpenDocument Text)가 제대로 활용되지 않은 점도 짚어봐야 한다.
최근 생성형 AI 서비스들의 HWP 파일 인식이나 오픈소스 HWP 파서 ‘rhwp’ 등장도 이 문제를 쉽게 넘어서지 못했다. 공개된 스펙을 기준으로 한 이러한 도구들도 모든 한글 문서를 제대로 열지는 못한다. 이는 현재 한글 문서 형식의 복잡성과 폐쇄성이 함께 작용한 사례다. 이미 수십년 전부터 한글 문서는 한글에서만 온전히 열리는 경우가 많았다. 이는 폐쇄적 문서 생태계의 상징처럼 받아들여져 왔고, 그 핵심에는 한글에서만 가능한 복잡한 문서 구조가 있다.
AI 시대로의 전환에서 빠지지 않는 조언으로 ‘조직 문화 변화’가 있다. 기술의 잠재력을 극대화하려면 기술과 문화 양 쪽이 타협해서 최적점을 찾아야 한다. 하지만 지금까지는 기술이 문화에 맞춰 왔다. 지금이라도 문서에 녹아든 문화를 바꾸지 않으면 근본적인 문제는 해결되지 않고 점점 커져만 갈 것이다. 지금부터라도 문화의 ‘원점’을 다시 생각해야 한다. 늦었다 생각할 때가 가장 빠를 때일 수도 있다.
권용만 기자
yongman.kwon@chosunbiz.com
고객님만을 위한 맞춤 차량
