2021.06.25

“분석가 가운데 스토리텔러” 시민 데이터 과학자의 부상

Ulrich Hatzinger | COMPUTERWOCHE
하버드 비즈니스 리뷰(Harvard Business Review)에 따르면, 데이터 과학자는 현 세기의 “가장 섹시한 직업”이다. 방대한 데이터 소스에서 지식을 만들어내는 역량은 기업의 디지털 트랜스포메이션에서 필수적이며, 데이터 과학자라는 직업군이 인기를 얻는 이유도 여기에 있다. 데이터 과학자는 데이터 소스를 열고 개선하고 나아가 이를 돈으로 바꾼다. 그러나 기업에서 필요한 이상적인 조건을 갖춘 데이터 과학자를 찾기는 쉽지 않은 일이다. 
 
ⓒ Getty Images Bank
 

시민 데이터 과학자 : 정의 

시민 데이터 과학자는 이 분야에서 필요한 인력의 탐색 범위를 넓혀준다. ‘데이터 과학자’라는 역할 앞에 ‘시민’이라는 단어를 붙여 놓으니 언뜻 혼란스럽게 보일 수 있다. 구체적으로 시민이라는 용어는 기술적이고 고도로 전문화된 데이터 과학자와 달리 특정한 과학적 훈련을 받지 않은 사람들을 의미한다. 
가트너에 따르면 “고급 분석 기법 또는 예측 특성을 사용해서 모델을 만들지만, 원래의 직능은 통계학과 분석 영역 바깥에 있는” 사람들이다. 시민 데이터 과학자는 회사 데이터를 기반으로, 이 데이터를 모두가 이해할 수 있는 언어로 변환함으로써 회사에 대한 ‘스토리’를 만들어낸다. 이론적으로 이들은 특정한 과학적 훈련을 받지 않았음에도 불구하고 여러 전문가(수학자, 컴퓨터 과학자, 통계학자)의 기술을 결합한다. 

그러나 기술적 전문성을 넘어 진정한 차이를 만들어내는 것은 이른바 “소프트 스킬)Soft Skill)”이다. 무엇보다 데이터 과학자에게는 호기심이 필요하다. 다른 직원이나 부서에 대한 흥미를 계산해서 ‘변환’하기 위해 대량의 데이터에서 잠재적으로 유용한 정보를 파악할 수 있어야 한다. 
 
시민 데이터 과학자의 특징 ⓒ Gartner
 

시민 데이터 과학자의 툴 

가트너는 데이터 과학자 업무의 40%가 2030년까지 자동화될 것으로 예상한다. 기업은 이런 기술을 더 폭넓은 직원이 사용할 수 있도록 함으로써 시민 데이터 과학자를 더 많이 육성할 수 있다. 실제 환경에서 이는 간소화된 분석 툴을 기반으로 할 수도 있다. 

새로운 데이터 과학자 세대의 부상은 긍정적인 효과를 불러온다. 한편에서는 자격 검증을 통해, 다른 한편에서는 복잡성을 덜어내는 현대적 툴을 통해 개발자와 분석가, 기술자, 비즈니스 사용자는 시민 데이터 과학자가 될 수 있는 기회를 얻게 된다. 
 
따라서 프로젝트를 시작할 때 다음과 같은 질문을 명확히 짚고 넘어가야 한다. 
 
  • 데이터에 어떻게 액세스할 것인가? 
  • 데이터의 품질은 어느 정도인가? 
  • 모델의 학습과 테스트에 사용할 수 있는 높은 품질의 일관적인 데이터 집합을 얻으려면 어떻게 해야 하는가? 
  • 모델 학습과 검증을 위한 데이터 집합은 어떻게 생성해야 하는가? 
  • 어떻게 하면 다양한 알고리즘을 기반으로 여러 모델을 간단히 학습시킨 다음 최선의 결과를 도출하는 모델을 자동으로 선택할 수 있는가? 

기술 요구 사항을 줄임으로써 직원 교육 절차와 방법에 집중할 수 있다. 
 
  • 데이터 마이닝 프로세스는 어떻게 진행되는가? 
  • 우수한 데이터 품질을 얻으려면 어떻게 해야 하는가? 
  • 어떤 머신 러닝 방법(유인/무인, 군집, 분류, 회귀)이 문제 해결에 가장 적합한가? 
 

새로운 데이터 문화 대사 

데이터 과학자의 역할을 개발자, 분석가, 기술자 또는 전문가 역할과 분리하는 것이 효율적이지 않다는 것은 실제 사례를 통해 드러났다. 분리되면 역할 간에 많은 지식 이전이 필요해진다. 이런 프로젝트에서는 다음과 같은 질문에 대한 명확한 답을 확인해야 한다. 
 
  • 누가 또는 무엇이, 어떤 목적으로, 무슨 데이터를 제공하는가? 
  • 데이터에 어떤 정보(스토리)가 있는가? 
  • 이 데이터를 기반으로 어떤 진술(statement)이 가능하고 의미가 있으며 어떤 문제가 해결되는가? 

데이터 과학자가 유의미한 지원을 제공할 수 있으려면 먼저 이 맥락을 데이터 과학자에게 설명해야 한다. 따라서 데이터 과학자에게 개발자, 분석가, 기술자 또는 전문 사용자에 대한 조언을 제공하는 것이 좋다. 시민 데이터 과학자는 전통적인 데이터 분석과 데이터 과학자가 사용하는 첨단 기법 사이의 간극을 이을 수 있다. 
 
데이터 과학자가 갖춰야 할 역량 ⓒ Gertner
 

데이터 민주화에서 인더스트리 4.0으로 

“모두가 데이터 과학자”는 다양한 이익 단체를 조화시키고 “데이터 민주화”에 기여함으로써 회사 자체의 데이터 문화에 대한 간판 역할을 할 수 있다. 그러나 정교한 툴을 사용하더라도 데이터에서 진정한 “가치”를 찾기 위해서는 구체적인 기술과 전문가가 필요하다. 따라서 시민 데이터 과학자는 결코 데이터 과학자를 대신할 수 없다. 그보다는 두 가지 직능이 공존하면서 회사의 경쟁력을 개선하기 위한 시너지 효과를 낸다. 

시민 데이터 과학자와 데이터 과학자는 내부적인 데이터 역학 확립에 대한 적극적인 기여를 통해 4차 산업 혁명의 새로운 전형이 되고 있다. 또한 기술적 지원과 관련하여 내부적인 분업이 갖는 중요함은 1차 산업 혁명의 사례를 통해 이미 증명됐다. editor@itworld.co.kr


2021.06.25

“분석가 가운데 스토리텔러” 시민 데이터 과학자의 부상

Ulrich Hatzinger | COMPUTERWOCHE
하버드 비즈니스 리뷰(Harvard Business Review)에 따르면, 데이터 과학자는 현 세기의 “가장 섹시한 직업”이다. 방대한 데이터 소스에서 지식을 만들어내는 역량은 기업의 디지털 트랜스포메이션에서 필수적이며, 데이터 과학자라는 직업군이 인기를 얻는 이유도 여기에 있다. 데이터 과학자는 데이터 소스를 열고 개선하고 나아가 이를 돈으로 바꾼다. 그러나 기업에서 필요한 이상적인 조건을 갖춘 데이터 과학자를 찾기는 쉽지 않은 일이다. 
 
ⓒ Getty Images Bank
 

시민 데이터 과학자 : 정의 

시민 데이터 과학자는 이 분야에서 필요한 인력의 탐색 범위를 넓혀준다. ‘데이터 과학자’라는 역할 앞에 ‘시민’이라는 단어를 붙여 놓으니 언뜻 혼란스럽게 보일 수 있다. 구체적으로 시민이라는 용어는 기술적이고 고도로 전문화된 데이터 과학자와 달리 특정한 과학적 훈련을 받지 않은 사람들을 의미한다. 
가트너에 따르면 “고급 분석 기법 또는 예측 특성을 사용해서 모델을 만들지만, 원래의 직능은 통계학과 분석 영역 바깥에 있는” 사람들이다. 시민 데이터 과학자는 회사 데이터를 기반으로, 이 데이터를 모두가 이해할 수 있는 언어로 변환함으로써 회사에 대한 ‘스토리’를 만들어낸다. 이론적으로 이들은 특정한 과학적 훈련을 받지 않았음에도 불구하고 여러 전문가(수학자, 컴퓨터 과학자, 통계학자)의 기술을 결합한다. 

그러나 기술적 전문성을 넘어 진정한 차이를 만들어내는 것은 이른바 “소프트 스킬)Soft Skill)”이다. 무엇보다 데이터 과학자에게는 호기심이 필요하다. 다른 직원이나 부서에 대한 흥미를 계산해서 ‘변환’하기 위해 대량의 데이터에서 잠재적으로 유용한 정보를 파악할 수 있어야 한다. 
 
시민 데이터 과학자의 특징 ⓒ Gartner
 

시민 데이터 과학자의 툴 

가트너는 데이터 과학자 업무의 40%가 2030년까지 자동화될 것으로 예상한다. 기업은 이런 기술을 더 폭넓은 직원이 사용할 수 있도록 함으로써 시민 데이터 과학자를 더 많이 육성할 수 있다. 실제 환경에서 이는 간소화된 분석 툴을 기반으로 할 수도 있다. 

새로운 데이터 과학자 세대의 부상은 긍정적인 효과를 불러온다. 한편에서는 자격 검증을 통해, 다른 한편에서는 복잡성을 덜어내는 현대적 툴을 통해 개발자와 분석가, 기술자, 비즈니스 사용자는 시민 데이터 과학자가 될 수 있는 기회를 얻게 된다. 
 
따라서 프로젝트를 시작할 때 다음과 같은 질문을 명확히 짚고 넘어가야 한다. 
 
  • 데이터에 어떻게 액세스할 것인가? 
  • 데이터의 품질은 어느 정도인가? 
  • 모델의 학습과 테스트에 사용할 수 있는 높은 품질의 일관적인 데이터 집합을 얻으려면 어떻게 해야 하는가? 
  • 모델 학습과 검증을 위한 데이터 집합은 어떻게 생성해야 하는가? 
  • 어떻게 하면 다양한 알고리즘을 기반으로 여러 모델을 간단히 학습시킨 다음 최선의 결과를 도출하는 모델을 자동으로 선택할 수 있는가? 

기술 요구 사항을 줄임으로써 직원 교육 절차와 방법에 집중할 수 있다. 
 
  • 데이터 마이닝 프로세스는 어떻게 진행되는가? 
  • 우수한 데이터 품질을 얻으려면 어떻게 해야 하는가? 
  • 어떤 머신 러닝 방법(유인/무인, 군집, 분류, 회귀)이 문제 해결에 가장 적합한가? 
 

새로운 데이터 문화 대사 

데이터 과학자의 역할을 개발자, 분석가, 기술자 또는 전문가 역할과 분리하는 것이 효율적이지 않다는 것은 실제 사례를 통해 드러났다. 분리되면 역할 간에 많은 지식 이전이 필요해진다. 이런 프로젝트에서는 다음과 같은 질문에 대한 명확한 답을 확인해야 한다. 
 
  • 누가 또는 무엇이, 어떤 목적으로, 무슨 데이터를 제공하는가? 
  • 데이터에 어떤 정보(스토리)가 있는가? 
  • 이 데이터를 기반으로 어떤 진술(statement)이 가능하고 의미가 있으며 어떤 문제가 해결되는가? 

데이터 과학자가 유의미한 지원을 제공할 수 있으려면 먼저 이 맥락을 데이터 과학자에게 설명해야 한다. 따라서 데이터 과학자에게 개발자, 분석가, 기술자 또는 전문 사용자에 대한 조언을 제공하는 것이 좋다. 시민 데이터 과학자는 전통적인 데이터 분석과 데이터 과학자가 사용하는 첨단 기법 사이의 간극을 이을 수 있다. 
 
데이터 과학자가 갖춰야 할 역량 ⓒ Gertner
 

데이터 민주화에서 인더스트리 4.0으로 

“모두가 데이터 과학자”는 다양한 이익 단체를 조화시키고 “데이터 민주화”에 기여함으로써 회사 자체의 데이터 문화에 대한 간판 역할을 할 수 있다. 그러나 정교한 툴을 사용하더라도 데이터에서 진정한 “가치”를 찾기 위해서는 구체적인 기술과 전문가가 필요하다. 따라서 시민 데이터 과학자는 결코 데이터 과학자를 대신할 수 없다. 그보다는 두 가지 직능이 공존하면서 회사의 경쟁력을 개선하기 위한 시너지 효과를 낸다. 

시민 데이터 과학자와 데이터 과학자는 내부적인 데이터 역학 확립에 대한 적극적인 기여를 통해 4차 산업 혁명의 새로운 전형이 되고 있다. 또한 기술적 지원과 관련하여 내부적인 분업이 갖는 중요함은 1차 산업 혁명의 사례를 통해 이미 증명됐다. editor@itworld.co.kr


X