개발자

글로벌 칼럼 | 사전예방적 데이터 거버넌스의 시작은 '시민 데이터 과학자 지원'

Isaac Sacolick | CIO 2022.07.14
‘현업에 데이터 및 시각화 도구를 제공하는 것’과 ‘보고서를 실행하는 업무에서 IT를 제외하는 것’은 완전히 별개의 문제다. 

CIO가 기업의 데이터 전략에 불만을 토로할 수 있는 방법이 있을까? 

비즈니스 사용자가 스프레드시트에서 데이터 시각화 및 기타 셀프서비스 비즈니스 인텔리전스 플랫폼으로 마이그레이션하는 데 얼마나 성공적이었는지 물어보면 된다. 그다음 최고 데이터 책임자(CDO)에게 증가하는 데이터세트에서 인사이트를 통합, 준비, 분석, 공유하려는 ‘시민 데이터 과학자’ 지원을 포함한 데이터 거버넌스 프로그램을 이끄는 게 얼마나 어려운지 질문하라.  
 
ⓒGetty Images Bank

최근 필자는 CIO닷컴의 ‘일의 미래 서밋(Future of Work Summit)’에서 노코드 및 로우코드 플랫폼을 활용하는 시민 개발 프로그램 관리 워크샵을 진행했다. 시민 데이터 과학을 주제로 한 이유는 많은 CIO와 CDO가 이러한 프로그램의 데이터 거버넌스를 구축하는 방법에 관해 조언을 구하고 있다는 사실을 알았기 때문이다. 

게다가 지난 3월과 4월 각각 (1) 스프레드시트가 비즈니스를 어떻게 망치는지(‘스프레드시트가 비즈니스를 망친다?··· 5가지 위험성(5 ways spreadsheets kill your business)’) 그리고 (2) 스프레드시트를 비즈니스 워크플로우로 대체하는 방법(‘망치기 전에 바로잡자··· 스프레드시트 개선 방안 5가지(5 ways to improve on spreadsheets for business workflows)’)에 관해 기사를 쓴 이후였기 때문에, 서밋에 참석한 IT 및 데이터 리더에게 실제로 직면하고 있는 어려움이 무엇인지 너무나 들어보고 싶었다. 

필자는 시민 데이터 과학 전문가 조직(CoE)을 개발하는 것에 관해 잘 알고 있으며, 10여 년 전 CIO로서 첫 번째 프로그램을 선보이기도 했다. 여기서는 필자의 신간 ‘디지털 트레일블레이저(Digital Trailblazer)’의 ‘나쁜 데이터에 파묻혀 있다(Buried in bad data)’ 챕터를 바탕으로 업계 현황과 교훈을 살펴본다. 

설문조사 결과에 따르면…
시민 데이터 과학에 관한 IT 및 데이터 리더의 인식과 과제를 파악하기 위해 워크샵 중에 간단한 설문조사를 실시했다. 물론 표본 크기, 즉 응답자 수가 60명으로 너무 작아서 어떤 결론을 뒷받침하긴 어렵지만 이번 설문조사는 IT 및 데이터 리더가 여전히 시민 데이터 과학 프로그램을 시작하는 초기 단계에 있다는 사실을 보여줬다. 

• 현업 부서가 일반적으로 데이터를 보는 2가지 방법을 선택하라는 질문에 응답자는 ‘자체 개발한 스프레드시트’(53%)와 ‘IT 및 데이터 팀에서 관리하는 자동 보고서’(43%)를 꼽았다. 아울러 43%는 현업 부서가 데이터를 보는 가장 좋은 방법으로 ‘셀프서비스 BI’를 지목했지만 이 중 13%만이 셀프서비스 BI가 강력한 거버넌스를 갖추고 있다고 답했다. 

• 데이터 애널리틱스에서 가장 유용한 기능과 가장 부족한 기능은 각각 고객 경험(35%), 제품 개발(28%)인 것으로 조사됐다. 

• 데이터 중심 관행과 관련해 비즈니스, 데이터 전문가, 기술 전문가 간의 협업을 이끌어내는 데 있어 직면하는 어려움을 질문한 결과, 비즈니스 리더가 IT로 하여금 데이터를 수정하고 보고서를 제공하기만을 원한다는 응답(40%)이 가장 많았다. 

데이터 시각화 및 준비 도구는 (무려) 10년 전에 주류가 됐기 때문에, 이렇게 분명한 발전이 없었다는 사실은 고무적이지 못하다. IT 및 데이터 리더는 올바른 방향으로 나아가기 위해 시민 데이터 과학을 지원하는 데이터 거버넌스 프로그램을 강화해야 한다.

컴플라이언스 위험, 시민 데이터 과학의 힘을 증폭하는 요소로 전환하라
스프레드시트의 문제는 데이터 거버넌스 관행이 있기 훨씬 전에 비즈니스 사용자에게 배포됐다는 점이다. 비즈니스 애널리스트는 데이터세트를 다운로드하고 여러 스프레드시트를 생성한 다음 (이를) 동료에게 이메일로 보냈다. 이제는 스프레드시트를 데이터 시각화 도구로 바꿔야 한다. 관리하지 않고 방치하면 더 큰 문제에 직면할 수 있다. 이를테면 다음의 문제가 발생할 수 있다.

• 개인정보/기밀정보 공유 및 컴플라이언스 위험 

• 기업 외부의 권한 없는 사용자에게 정보 유출

• 데이터 정의에 관한 잘못된 이해와 가정을 기반으로 한 잘못된 의사결정

• 알고리즘 테스트 및 결과 검증 없이 애널리틱스와 인사이트 공유

• 표준이나 스타일 지침 없이 시각화를 구축하여 이해하기 어려운 결과 


게다가 오늘날 대부분의 기업들이 빅데이터 세트를 분석하고, 여러 애널리틱스 도구를 사용하며, 독점적인 머신러닝 모델을 위한 맞춤형 코드를 개발하기 때문에 위험은 더욱더 커진다. 분석 모델은 수익 창출 활동과 운영 효율성을 위해 전사적으로 사용되며, (이에 따라) 실수로 인한 비용이 많이 들 수 있다. 

데이터 거버넌스는 시민 데이터 과학 프로그램에서 ‘위험’을 ‘가속력’으로 바꿀 수 있는 컴플라이언스 요건, 지식 격차, 데이터 품질 목표를 해결하는 데 목적이 있다.

사전예방적 데이터 거버넌스의 시작점
많은 데이터 거버넌스 프로그램의 주요 동인은 컴플라이언스 및 보안 요건이지만 ‘사전예방적(proactive)’ 데이터 거버넌스는 이러한 목표를 달성하는 동시에 데이터 중심 조직을 활성화하는 것을 목표로 한다. 이 프로그램은 투명한 데이터 액세스 및 사용 정책을 정의하여 누가 분석에 어떤 데이터세트를 사용할 수 있는지 명확하게 한다. 

데이터 카탈로그는 분석 또는 시각화에 새로운 공식, 세그먼트 및 기타 매개변수화가 포함될 때마다 업데이트된다. 아울러 지속적으로 데이터 부채를 줄이고, 데이터 품질을 개선하며, 데이터 통합을 자동화한다. 대시보드, 애널리틱스 및 머신러닝 모델이 버전화되고, 지원 라이프사이클도 정의된다.

이러한 데이터 거버넌스 관행과 시민 데이터 과학 애널리틱스를 만드는 데 실패하거나 뒤처지면 지난 10년 간 쌓인 메가 스프레드시트만큼이나 골치 아픈 문제가 될 것이다.

* Isaac Sacolick은 InfoWorld의 기고 편집자다.
ciokr@idg.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.