"디지털 퍼스트 시대, 효과적인 데이터 활용 전략은?" 한국IDG, 비즈니스 임팩트 & 데이터 플러스 2022 성료
코로나19로 디지털 트랜스포메이션이 가속화되면서 많은 기업이 디지털 우선 접근 방식에 투자하고 있다. IDC는 다양한 산업에 걸쳐 더 많은 데이터를 확보하고 활용하려는 수요가 커질 것으로 전망했다. 이른바 '디지털 퍼스트(digital first)' 시대다.
프루덴셜 파이낸셜(Prudential Financial)의 데이터 품질 디렉터 로라 세바스찬 콜먼은 '디지털 시대의 데이터 리더십'을 주제로 오프닝 기조연설을 시작했다. 콜먼은 많은 기업이 디지털 우선 접근 방식에 투자하고 있으나 단순히 기술만 우선하는 경우가 많다며, 데이터 우선 접근 방식을 채택해야 한다고 지적했다. 데이터는 고객 만족과 신뢰 구축에 중추적인 역할을 한다.
콜먼에 따르면, 데이터 품질 문제로 인한 기업의 손실은 최대 30%로 추산된다. 이런 손실을 최소화하기 위한 방법은 무엇일까? 콜먼은 "디지털로 전환하려면 사고방식의 변화가 필요하듯 고품질 데이터 생성도 마찬가지다. 데이터의 중요성을 인식하고 데이터 생산 프로세스와 라이프 사이클 전반에 걸쳐 적절한 책임을 설정해야 한다. 기업의 의지와 리더십, 데이터를 최우선으로 하는 용기가 필요하다"라고 조언했다.
전문가 세션에서는 본격적으로 기술 트렌드와 활용 전략이 소개됐다. 가장 먼저 EDB 코리아 이강일 지사장은 오픈소스 DBMS 시장 지형을 살폈다. 그에 따르면, 현재 오픈소스 DBMS는 클라우드와 함께 빠르게 성장하며 기존의 상용 DBMS를 대체하고 있다. 특히 비즈니스에 필수적인 OLTP/OLAP에는 오픈소스 DB가 크게 자리 잡았다.
이강일 지사장은 "오픈소스 DBMS 적용 영역은 다양하다. 공간 데이터 처리, 시계열 데이터 처리, 문서 처리 영역을 필두로 상용 DB에서 처리하는 영역을 빠르게 잠식하고 있다"라고 말했다. 오픈소스 DBMS는 라이선스 비용이 없고 솔루션 업체 종속성을 탈피할 수 있으며, 필요시에는 구독 형태의 기술 지원 서비스를 부분적으로 선택할 수 있다는 이점이 있다.
전 세계 개발자를 대상으로 한 설문 결과, 개발자들이 가장 선호하는 오픈소스 DBMS는 포스트그레SQL(PostgreSQL)이다. 포스트그레SQL에 33.1%의 기여도를 보유한 EDB코리아는 상용 제품에서 제공하지 못하거나 제공하더라도 기능이 약한 성능과 보안, 관리 용이성 측면에 초점을 맞춰 다양한 서비스 유형에 적합한 제품을 개발하고 있다. 이강일 지사장은 "이를 통해 기업은 비용 부담 없이 상호 운용성을 통해 기존의 인프라를 활용하면서 비즈니스 연속성을 확보할 수 있을 것"이라고 설명했다.
한편 디지털 서비스가 증가하면서 다양한 소스에서 발생하는 데이터의 규모 역시 방대해지고 있다. 인시던트의 수도 마찬가지다. 이어진 세션에서 서비스나우 오희정 매니저는 "인적 리소스를 추가하는 것만으로는 많게는 20배 이상 증가하는 조직 내 인시던트에 대응하기 어렵다"라고 설명했다.
이에 대한 해법으로 오희정 매니저는 사전 대응적 AI 기반 서비스 운영 자동화를 제안했다. 인시던트가 발생하기 전에 문제 상황을 탐지/예측/자동 조치하는 자가 복구(self-healing) 기능을 통해 기업은 디지털 트랜스포메이션을 가속화하고 성숙시킬 수 있다.
오희정 매니저는 "하이퍼 AI옵스 도입 후 딜로이트는 중복된 워크플로우를 최적화해 ROI 및 생산성을 4~5배 이상 높였고 단스케 은행은 장애 후 서비스 복구 시간을 6배 이상, 트랜스알타(TransAlta)는 서비스 운영 중단 케이스를 80%까지 줄였다"라고 덧붙였다.
효성인포메이션시스템의 김형섭 컨설턴트도 AI의 가치에 주목했다. 김형섭 컨설턴트에 따르면 데이터를 활용하는 가장 효율적인 방법은 AI를 활용하는 것이지만, AI 운영에 필요한 구성요소를 개별적으로 도입하는 것은 비효율적이다. 통합 AI 플랫폼이 필요한 이유다.
통합 AI 플랫폼 도입을 고려 중인 기업은 AI 플랫폼의 3가지 요소인 성능, 운영, 비용 측면에서 검토하는 것이 좋다. 가령 효성 AI 플랫폼은 GPU서버, 고성능 병렬 파일 스토리지, 네트워크, 컨테이너, GPU가상화 기술을 통합했으며, 고객이 쉽게 구축/운영할 수 있도록 아키텍처를 단순화했다. 또 고성능 병렬 파일 시스템과 오브젝트 스토리지가 통합된 스토리지 솔루션 HSCF를 통해 경제적인 운영을 지원하고 텐서플로우 및 파이토치 같은 사전정의 개발환경과 직관적인 UI로 시작 및 활용이 용이하다.
김형섭 컨설턴트는 "기술과 비용, 역량 문제를 해결할 수 있는 플랫폼을 통해 신규 도입 고객부터 기존에 다른 솔루션을 운영 중인 고객, 대규모 사업을 추진하는 고객까지 고객 유형별로 다양한 AI 도입 제안을 할 수 있다"라고 덧붙였다.
데이터베이스 인프라의 비용을 절감하는 구체적인 전략도 소개됐다. 퀘스트소프트웨어 코리아 유광일 차장은 실시간 데이터 복제를 통한 비용 절감 전략을 공유했다. 유광일 차장은 "많은 기업이 비용 절감과 확장성 등을 위해 오픈소스 DB와 클라우드 환경으로 전환하고 있지만, 그 과정은 간단하지 않다. 특히 기업 입장에서는 정확하게 데이터를 마이그레이션하고 다운타임을 줄이는 것이 가장 중요하다. 그리고 이 다운타임을 줄이는 대표적인 방법이 실시간 데이터베이스 복제 기술"이라고 강조했다.
실시간 데이터베이스 복제 방법은 크게 4가지로 나뉜다. 과거에는 트리거(Trigger)와 타임스탬프(Timestamp) 같이 DB 내의 오브젝트를 활용해 발생한 DML을 복제했으나, DB 리소스를 많이 사용하게 되면서 성능 저하가 발생하는 문제가 있었다. 오라클 로그마이너(LogMiner)를 사용하는 방법도 있지만, 이 역시 DB 엔진 자원을 사용하므로 추출 및 DB 성능을 모두 확보하지 못하는 방법이다.
퀘스트의 쉐어플렉스(SharePlex)는 다이렉트 로그 액세스(Direct Log Access) 방식으로 리두 로그(Redo Log)에 직접 접근해 변경분을 추출하는 방법을 사용한다. DB 자원을 사용하지 않기에 DB 성능 저하가 발생하지 않으며, 다른 방법보다 훨씬 안정적으로 빠르게 변경분을 추출한다. 여기에 더해 데이터 정합성을 점검하고 보장하는 기능을 통해 데이터의 무결성을 확보하며, 복제 구성이 유연해 고객의 요구사항에 맞춰 다양한 목적으로 활용할 수 있다.
유광일 차장은 "전통적인 마이그레이션은 데이터 이관에 앞서 서비스를 중지하고 전체 데이터를 이관하므로 다운타임이 길어진다. 반면 실시간 데이터베이스 복제를 이용하면 초기 데이터와 복제 도중 발생한 변경을 서비스 중단 없이 옮긴다. 이 부분이 가장 큰 차이점이고 중요한 부분"이라고 덧붙였다.
데이터베이스의 관리 방법론에 대한 논의도 있었다. 디노도(Denodo) 남궁명선 지사장은 데이터 가상화를 기반으로 한 논리적 아키텍처(Logical Architecture)를 소개했다. "논리적 아키텍처는 소비자가 데이터 위치 및 물리적 스키마에서 분리된 의미의 모델을 통해 데이터에 액세스하게 함으로써 기존의 (시간, 비용, 데이터 품질) 문제를 해결하려는 접근 방식"이라고 말했다.
남궁명선 지사장에 따르면, 논리적 데이터 패브릭 환경을 마련하기 위해 데이터 가상화 레이어를 두고 데이터를 의미적으로 연결하면 결과적으로 고객은 모든 데이터에 접근할 수 있고 데이터를 필요한 형태로 쉽게 결합할 수 있으며, 기존에 사용하던 툴로 데이터를 볼 수 있다. 남궁명선 지사장은 "디노도는 데이터 가상화를 통해 이런 모든 작업을 데이터 복제 없이 이뤄지도록 하고자 한다"이라고 덧붙였다.
마지막 전문가 세션에서는 SAS 코리아 고준형 이사가 '기업의 골든타임을 지켜주는 셀프 분석 플랫폼'을 주제로 발표했다. 고준형 이사는 접근 및 활용이 쉬운 인사이트를 확보하는 것이 기업의 골든타임을 지키는 핵심이라고 봤다.
데이터 분석은 더 이상 통계학을 전공한 애널리스트만 하는 일이 아니다. 일반 사용자도 할 수 있다는 의미로 시티즌 데이터 사이언티스트(citizen data scientist)라는 용어까지 등장한 것처럼, 고준형 이사는 "셀프 분석 플랫폼을 활용하면서 실무자와 애널리스트의 역할 장벽이 허물어지고 모두가 실무자가 되고 모두가 분석가가 되어 분석할 수 있는 환경이 됐다"라고 말했다.
고준형 이사는 "코딩 방식에서 프로세스 플로우 방식으로 현대화한 실제 사례를 살펴보면 분석 처리 속도가 3~5배 빨라졌고 분석 처리 로직 공유와 재활용을 통해 일관적인 인사이트 확보할 수 있고, 사용자가 직업 원천 데이터에 접근해 데이터를 분석하고 보고서를 제작하는 역량을 확보할 수 있다"라고 덧붙였다.
데이터는 기업의 의사결정으로 연결되고, 그에 따라 비즈니스 성패가 좌우된다. 클로징 기조연설에서는 P&G의 IT 디렉터 줄리오 본타디니가 실질적인 비즈니스 문제를 해결하는 데이터 전략을 공유했다. 본타디니는 "기업은 접근 독점성 확보와 파급 효과를 통해 경쟁 우위를 확보할 수 있다. 독점성은 올바른 데이터 소싱으로 확보할 수 있으며, 데이터 모델을 단일 방식으로 통합해 파급 효과를 만들어낼 수 있다"라고 말했다.
의사결정을 내리는 과정에서는 데이터와 직관 중 한쪽만 선택하지 않도록 주의해야 한다. 본타디니는 "혁신을 저해하고 심지어 이미 내린 결정을 정당화하고자 분석하는 무의미한 일이 발생할 수 있다. 데이터와 직관을 함께 활용해 논쟁하지 말아야 한다"라고 조언했다.
editor@itworld.co.kr