한컴, 독일 ‘2025 PDF Days Europe’ 참여...‘오픈데이터로더 PDF’ 소개
||2025.09.19
||2025.09.19
[디지털투데이 황치규 기자]한글과컴퓨터(이하 한컴)는 PDF 문서에서 AI 학습 데이터를 추출하는 ‘오픈데이터로더 PDF’를 유럽 PDF 기술 컨퍼런스인 '2025 PDF 데이즈 유럽(2025 PDF Days Europe)에서 선보였다고 19일 밝혔다. ‘PDF Days’는 PDF 기술 표준을 제정하는 PDF 협회(PDF Association)가 주최하는 기술 포럼이다.
이번 행사에서 한컴 기술 파트너사인 듀얼랩(Dual Lab) 보리스 두브로프(Boris Doubrov) CEO는 직접 발표도 진행했다.
회사 측에 따르면 최근 깃허브(GitHub)를 통해 한컴이 오픈소스로 공개한 ‘오픈데이터로더 PDF’는 PDF 데이터 추출 엔진으로 AI가 문서를 더 잘 이해하고 활용할 수 있도록 JSON, 마크다운(Markdown), HTML 등 최적화된 형태로 데이터를 변환하며, 경량화된 SDK(소프트웨어 개발 키트) 형태로 제공된다. 이를 통해 다양한 AI 서비스에 연동할 수 있다.
정지환 한컴 CTO는 “최근 깃허브에 ‘오픈데이터로더 PDF’를 공개한 데 이어 이번 PDF Days에서 기술 비전을 발표한 것은, 한컴 문서 기술을 전 세계 개발자들과 공유하고 함께 성장하기 위한 상징적인 첫걸음”이라며 “앞으로 라마인덱스(Llamaindex), 제미나이 등 주요 AI 프레임워크와 호환성을 강화하고 글로벌 커뮤니티와 협력을 통해 기술을 고도화해 나갈 것”이라고 말했다.
고객님만을 위한 맞춤 차량
