펜타시스템, 한국은행 데이터 레이크 사업서 데이터 파이프라인 구축 완료
||2025.01.22
||2025.01.22
[디지털투데이 황치규 기자]기업용 솔루션 공급 및 IT 서비스 컨설팅 전문기업인 펜타시스템테크놀러지는 한국은행 ‘데이터 레이크 구축사업’에서 데이터 파이프라인 구축을 완료했다고 22일 밝혔다.
펜타시스템은 이번 구축사업에서 데이터이쿠(Dataiku)를 활용해 다양한 외부 원천(Source) 데이터로부터 내부 시스템으로 데이터를 입수, 정제, 전처리, 중계, 적재하는 데이터 파이프라인을 완성했다.
이 데이터 파이프라인은 외부망에서 웹 API 호출, 크롤링, 실시간 데이터 입수 등을 수행해 데이터를 중계기로 전달하고, 내부망에서는 중계기 데이터를 다시 입수해 정제 후 데이터 레이크 데이터베이스 및 스토리지에 저장하는 방식으로 설계됐다고 회사측은 설명했다.
데이터이쿠(Dataiku)는 SQL데이터베이스(Snowflake, Oracle, MS SQL Server 등), 클라우드 스토리지(Amazon S3, Google Cloud Storage 등), 하둡, NoSQL(MongoDB, Cassandra, ElasticSearch) 등을 지원한다.
장종준 펜타시스템 대표는 “이번 사업을 통해 빅데이터와 AI 분석 분야에서 기술력을 입증했으며, 앞으로도 생성형 AI 애플리케이션과 같은 다양한 디지털 혁신 프로젝트를 통해 고객들에게 새로운 가치를 제공할 계획이다”고 말했다.