데이터ㆍ분석

“기업 데이터 생태계의 전면적 혁신 시점, 바로 지금” 논리적 데이터 전략이 중요한 이유

허은애 기자 | ITWorld 2023.04.12
모든 기업의 우선순위는 디지털 트랜스포메이션이다. 디지털 트랜스포메이션에는 다양한 의제가 포함되지만, 최종적인 목표는 데이터를 적시에 혁신 기술 프로젝트에 활용하는 역량을 배양하는 것이다. 결코 쉽지 않은 과제인 만큼 레거시 데이터를 두고 고민하는 많은 기업이 주목하는 주제다.
 
클라우드 & AI 이노베이션 2023(Cloud & AI Innovation 2023) 연사로 나선 디노도 코리아의 APAC 데이터 아키텍처 디렉터 샨무가 순다르 ⓒ Foundry

지난 3월 한국IDG가 주최한 ‘클라우드 & AI 이노베이션 2023(Cloud & AI Innovation 2023)’에서 디노도 코리아의 APAC 데이터 아키텍처 디렉터 샨무가 순다르는 기업 데이터 생태계의 사일로화를 지적하며 기업 데이터 전략의 혁신 필요성을 강조했다. 

통상적으로 기업은 데이터를 다룰 때 복제라는 쉬운 방법을 선택한다. 그러나 그때 그때의 편의에 따라 만들어진 여러 개의 데이터 웨어하우스와 데이터 레이크는 데이터 중복이라는 문제를 발생시키고, 거대하고 복잡한 수천 개의 사일로 집합으로 번져 나간다. 데이터가 정렬되지도, 정돈되지도 않아 공유와 액세스를 통한 가치와 통찰력 구축이 불가능한 구조다. 그 결과가 거대한 사일로 집합 형태의 현재 기업 데이터 아키텍처다.
 
ⓒ Dinodo Korea


순다르는 이제 기업이 모놀리식 구조를 벗어나 논리적 데이터 아키텍처로 진화할 때라고 강조했다. 논리적 데이터 아키텍처는 데이터 추상화 계층을 만들어 모든 데이터를 통합하는 아키텍처로, AI, 모바일 애플리케이션, 고객 경험, 보안 등 다양한 분야에 활용할 수 있다.
 

추상화를 통한 논리적 데이터 통합 전략의 필요성

ⓒ Dinodo Korea

순다르는 우선 복제가 아닌, 메타 데이터로 시맨틱 모델을 구축하고 통합하는 데이터 추상화 방식을 설명했다. 새로운 도구를 도입하거나 학습을 유도하지 않아도 된다는 것이 가장 큰 장점이다. 데이터 소비자가 직접 셀프 서비스로 엑셀, 파워BI, SaaS 등 익숙한 애플리케이션과 서비스를 활용하고, 실시간 통합이 필요한 모바일 애플리케이션에서도 REST API 등으로 가상 레이어를 매끄럽게 애플리케이션에 연결할 수 있다. 

순다르는 “디노도는 사용자가 데이터를 검색하고 확대하고 큐레이션하며 또 AI/ML 애플리케이션 활용이 가능하도록 지원하는 데이터 카탈로그를 해답으로 제시했다”라며, 운영체제, 데이터 웨어하우스, 데이터 레이크 등 다양한 시스템을 통합한 디노도의 기업 데이터 관리 플랫폼 통합 사용례를 소개했다. 

영국 국가보건의료서비스인 NHS(National Health Service)는 영국 전역에 14개의 지역 NHS 위원회를 두고 다양한 공적 영역에서 1만 명 이상의 민감한 의료 데이터를 다루는 기관이다. NHS는 환자를 이해하고 데이터를 공유해 더 나은 서비스를 제공하기 위해 공적 영역 전반의 모든 사일로 데이터를 통합하는 민첩함, 데이터 지연 개선, 의료 서비스 시야 확대를 목표로 했다. 

NHS는 디노도와 함께 논리적 데이터 웨어하우스(Logical Data Warehouse)를 구축해 하나의 단일하고 안전한 통합 데이터 레이어를 만들었다. 데이터를 복제하지 않고도, 프로젝트에 가장 좋은 방식을 선택해 데이터를 연결하고 공유할 수 있도록 통합한 것이다. 견고한 데이터 거버넌스, 보안, 보호 정책을 구현한 것도 장점이다.

결과적으로 NHS는 더 빠르고 효율적이며 애자일한 데이터 아키텍처로 디지털 트랜스포메이션을 수행할 수 있었다. 특히 팬데믹 기간 동안에는 유럽과 영국의 다른 연구소에 데이터를 개방해 감염병의 전염을 예방하는 통찰력을 적시에 공유하고 확보하기도 했다.
 

전사적 데이터를 논리적으로 통합하는 데이터 패브릭

ⓒ Dinodo Korea


논리적 데이터 전략에서는 데이터 패브릭과 데이터 메시를 중요하게 고려한다. 두 정책의 공통점은 복제, 추출이 아니라 추상화를 통한 방식이라는 점이다. 

데이터 패브릭은 기업 전체 데이터 오브젝트의 설계, 통합, 배포를 자동화하고 안내하는 아키텍처 패턴을 말한다. 단일 데이터 뷰를 안전하게 구축하고 배포해 기업 데이터 혁신을 이끌 수 있고, 기업의 메타데이터 자산 전반에 AI/ML을 적용해 실행 가능한 통찰력을 이끌어내며 데이터 관리 제안을 제공할 수 있다. 기업은 데이터의 액세스와 배포를 빠르고 안전하게 자동화하는 결과를 얻을 수 있다.

순다르는 통합 추상화 레이어, 통합 데이터 모델, 통합 보안 및 거버넌스 정책을 통한 객체 중심적 데이터 패브릭 전략을 구축하면 기업 애플리케이션, 데이터 과학, 머신러닝, BI, 데이터 공유 등 다양한 부문에서 사용자의 필요에 따라 데이터를 하나의 서비스로 활용할 수 있다고 설명했다.

전 세계에서 광물 등 원자재를 채굴하는 호주에 본사를 둔 BHP는 여러 지역에 분산된 전사 데이터를 통합해 위험 관리에 활용해야 한다는 과제를 안고 있었다. 순다르는 “디노도의 논리적 데이터 패브릭 전략을 채택해 BHP는 재사용 가능한 데이터 자산을 확보하고, 사용자와 애플리케이션의 데이터 적시 활용성을 높였다”라며 논리적 데이터 아키텍처 전략의 효용을 강조했다.
 

비즈니스 도메인의 자율성을 극대화하는 데이터 메시

ⓒ Dinodo Korea

데이터 메시는 데이터 패브릭과 유사하지만, 비즈니스 도메인을 통해 관리한다는 점에서 큰 차이가 있다. 마케팅 데이터의 경우에는 고객과 제품을 가장 잘 알고 있는 마케팅 부서가 관리하고, 사기 공격 방지를 위해서는 보안 도메인에서 관련 데이터를 관리하는 것이다. 관리 주체인 비즈니스 도메인은 데이터를 소유하고 원하는 방식대로 데이터를 제품으로 구축한다. 비즈니스 도메인은 자율성과 소유권을 가지고 원하는 속도나 기술 수준에 맞춰 데이터를 개발한다. 

순다르는 다양한 소스에서 온 데이터를 조합해 통합하고 인터페이스로 구축해 최종적으로 소스 도메인의 데이터 제품 캠페인으로 구축하는 디노도의 데이터 메시 전략을 소개했다. 마케팅 도메인에서 발행한 캠페인 데이터 제품은 다른 도메인에서도 확인하고 실행하며 자체 데이터 제품을 정의할 때 활용할 수도 있다. 이때도 역시 데이터는 복제되지 않고, 사용자나 애플리케이션이 데이터 제품에서 실시간으로 데이터를 요청하고 결합하며 서비스된다.

아이슬란드 최대 은행인 란즈방킨(Landsbankinn)은 디노도의 데이터 패브릭을 도입해 레거시 데이터 문제를 해결했다. 데이터 레이어 위에 데이터 제품을 만들고, 다양한 데이터 플랫폼에 데이터 보안과 관리, 논리 정책을 적용하고 간소화한 것이다. 디노도의 데이터 카탈로그를 전사적으로 도입해 보급한 결과, 란즈방킨은 신뢰할 수 있는 통합 데이터를 제공하는 시간을 획기적으로 단축하고, 데이터 공유 프로그램을 통해 도메인 개발자의 데이터 배포 속도를 개선할 수 있었다.
 
ⓒ Dinodo Korea

이렇듯 논리적 데이터 아키텍처 전략의 이점은 다양하다. 데이터 복제, 복사, 추출이 필요하지 않으므로 민첩하게 데이터를 활용, 배포, 관리할 수 있고, 더 나은 통찰력을 이끌어낼 수 있다. 순다르는 기존의 데이터 아키텍처와 비교해 디노도의 논리적 데이터 아키텍처를 적용할 때 데이터 배포 소요 시간을 65% 단축하고 데이터 준비 노력을 67%을 절감하며, ROI가 408%에 달한다는 포레스트 연구 결과를 소개하며 발표를 마무리했다.
editor@itworld.co.kr 
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.