2016.04.18

데이터 과학자에 관한 가장 큰 오해 4가지

Sarah K. White | CIO
데이터 과학 직종에 가장 적합한 인재에 대한 몇 가지 선입견이 있다. 예를 들어, 분석적이고, 세부 사항을 잘 챙기고, 직관력있는 사람을 원할 것이다. 이는 모두 데이터 과학자(data scientists)에게 중요한 자질들이다.

그러나 데이터 과학은 '수'에 정통한 것 이상을 요구하는 분야다. 데이터 과학자는 기업과 기관의 의사결정자에게 영향을 끼쳐야 하고, 회사의 미래에 대한 방향을 제시한다.

유능한 데이터 과학자를 만드는 자질 가운데 논리적으로 쉽게 떠올릴 수 있는 자질들이 많다. 그러나 데이터 과학자는 데이터 분야에 속하지 않는 많은 역량을 필요로 한다.

인포 다이내믹 사이언스 랩스(Infor Dynamic Science Labs)의 최고 과학자이자 수석 부사장인 자이드 네멜딘은 다른 누구보다 이 점을 잘 알고 있다. 네멜딘은 자사를 위해 일할 데이터 과학자를 채용하고 있으며, 회사 내 수많은 비즈니스의 데이터 전략에 대한 가이드라인을 제시하고 있다.

네멜딘에 따르면, 데이터 과학자를 잘못 이해하고 있다면, 지금이야말로 전략을 재평가할 시기다.

1. 데이터 수집에 관한 직종이다
수많은 데이터를 수집, 분류 및 정리, 이해하는 능력은 데이터 과학자에게 아주 중요한 역량이다. 그러나 이들 데이터를 유용한 형식으로 조직 내 다른 사람들에게 프레젠테이션할 수 있는 능력도 필요하다.

네멜딘은 프레젠테이션 스킬이 뛰어난 데이터 과학자를 채용하기 위해, 입사 후보자들에게 각자 열정을 갖고 있는 내용을 주제로 30분간 프레젠테이션을 실시하도록 요구하고 있다.

이는 프레젠테이션 능력 테스트에 목적이 있다. 그 결과, 시작부터 끝까지 데이터를 가장 잘 활용할 수 있는 능력을 갖춘 데이터 과학자로 구성된 팀을 보유하고 있다.

네멜딘에 따르면, 데이터 과학자를 찾을 때 자주 간과하는 자질 가운데 하나가 프리젠테이션 능력이다. 그는 "우리는 여러 소스(출처)에서 계속 증가하는 데이터를 수집하는 세상에 살고 있다. 데이터 과학 업무 가운데 상당수는 이렇게 데이터를 획득해 보고하는 것과 관련이 있다. 이런 사실 자체를 부정하거나 반대하지는 않는다. 그러나 데이터 과학은 그 이상이 필요한 분야이다"고 말했다.

네멜딘은 IT 리더가 이런 데이터 소프트 능력을 무시할 경우, 비즈니스에 피해가 발생한다고 강조했다. 데이터를 수용해야 할 사람들을 설득하지 못하면 데이터로 성과를 창출할 수 없기 때문이다.

데이터 과학자는 자신의 데이터 분석을 확신할 수 있어야 한다. 그리고 조직 내 임원과 매니저, 다른 직원들이 이를 실제 활용할 수 있도록 만들어야 한다. 회사의 데이터 과학자가 데이터를 수집해 전파하는 것 이상을 하지 않는다면, 해야 할 일을 명시한 직무 기술서를 바꿔야 할 시기인지 모른다.

2. 데이터 과학자는 개발자다
네멜딘에 따르면, 데이터 과학자에 대한 가장 큰 오해는 이들을 개발자로 인식하는 것이다. 데이터 과학자가 데이터 수집을 넘어, 이를 이해한 후, 솔루션을 기획해 발전시키도록 만들기 위해서는 기대치가 높아야 한다. 데이터 과학자는 분명히 개발 분야의 학력과 경력을 갖고 있지만, 개발은 실제 개발자에게 맡겨야 한다.

많은 데이터 과학자가 개발 분야의 경험을 갖고 있겠지만, 이들이 데이터에만 초점을 맞추는 것이 좋다. 이들은 데이터를 수집해, 이를 활용해야 할 사람들에게 제시하는 책임을 져야 한다.

동시에 신뢰를 구축해야 한다. 네멜딘은 "데이터 분석 결과를 토대로 행동하라고 요구하는 것은 분석 결과를 믿으라는 이야기다. 데이터 프레젠테이션과 데이터 분석에 활용하는 방법이 아주 중요한 이유가 여기에 있다. 이는 또 최초 신뢰 구축과 관련이 있다"고 말했다.

데이터 과학자가 데이터 분석과 함께 이를 보관할 시스템 구축과 설계를 책임지고 있을 경우, 이들은 데이터와 관련된 의사결정자와 관계를 구축하는데 시간을 투자할 수 없을 것이다.

즉 데이터 과학팀은 효과적으로 데이터를 관리, 분석하고, 조직 내 관련된 사람들과 관계를 구축할 시간을 갖고 있어야 한다. IT는 현대 비즈니스에서 아주 큰 비중을 차지하고 있다. 데이터 과학자가 데이터 전략을 제시하고 설명하지 못한다면, 성과 창출에 방해를 받을 것이다.

3. 중앙화된 팀 하나가 데이터와 관련된 모든 업무를 처리할 수 있다
바이모달(Bimodal) IT는 새로운 IT 관리 개념이다. 바이모달 IT의 한 면은 기존의 IT다. 더 느리게 움직이고, 네트워크와 하드웨어, 소프트웨어 보안 유지관리에 초점이 맞춰져 있다.

다른 한 면은 이보다 '진보적인' IT다. 빠르게 신기술을 도입하고, 항상 앞서나가는 등 혁신에 초점을 맞춘 IT다. 바이모달 IT는 IT가 전반적인 비즈니스 모델에 끼치는 영향을 2개의 초점으로 나눠 관리하는 방법이다.

네멜딘은 데이터에도 동일한 미래가 펼쳐질 것으로 예상하고 있다. 네멜딘은 "데이터 과학자는 데이터를 자주 취급하는 사람들을 집합적으로 가리키는 개념이다. 그러나 원칙적으로 데이터를 사용할 수 있도록 수집, 전송, 분류 및 정리, 보관하는 데이터 아키텍트 또는 엔지니어 집단과 데이터를 이용한 문제 해결을 중시하는 데이터 과학 집단으로 나눠져 있다"고 설명했다.

기업과 기관은 1~2명의 전담 데이터 과학자를 IT팀에 합류시켜, 모든 데이터를 처리하도록 책임을 맡기겠다는 생각을 버려야 한다. 조직이 커질수록 데이터 과학팀을 2개의 각기 다른 분야에 초점을 맞추는 집단으로 분류하고 싶은 생각이 커질 것이다.

데이터를 전담하는 완전한 부서를 만들거나, IT의 우산 아래 두는 방법을 파악하면서, 데이터 과학자에게 필요한 자원 모두를 제공해야 한다는 의미다.

4. 데이터는 변하지 않는다
데이터 과학자를 채용해 앞으로 몇년 동안 계속해서 동일한 데이터 모델을 사용하도록 만드는 비즈니스 모델을 갖고 있다면 기대에 어긋난 결과가 나올 것이다. IT는 빠르게 발전하고 있다. 빅데이터를 도입한 사람들은 향후 자신의 역할이 크게 바뀔 것이라고 생각해야 한다.

지난 5~10년 동안 IT가 비즈니스에 초래한 변화를 생각해보자. 그러면 앞으로 10년 동안 초래될 변화를 상상할 수 있다. 데이터가 폭증했다. 많은 비즈니스가 마침내 데이터를 올바르게 활용하고 있다. 그러나 여기에 안주해서는 안 된다.

데이터는 IT 산업만이 아니라 모든 산업에 영향을 미치고 있다. 데이터 전략에는 기업의 미래, 데이터가 기업 성장에 기여할 역할에 대한 고려가 포함되어 있어야 한다.

네멜딘은 "소프트웨어가 발전해 현재 존재하는 많은 직무들을 대신하게 될 것이다. BI(Business Intelligence) 소프트웨어에 접목된 인공지능의 기능이 향상되어, 비즈니스에 있어 이례적인 현상과 이를 초래한 원인을 파악하게 될 것이다. 데이터 과학 부서의 역할도 바뀔 전망이다. AI를 관리하거나 중개자 역할을 하고, 미래의 의사결정을 최적화하는 데 더 초점을 맞추게 된다. 그러나 이 역할 또한 대체될 것이다"고 말했다. editor@itworld.co.kr


2016.04.18

데이터 과학자에 관한 가장 큰 오해 4가지

Sarah K. White | CIO
데이터 과학 직종에 가장 적합한 인재에 대한 몇 가지 선입견이 있다. 예를 들어, 분석적이고, 세부 사항을 잘 챙기고, 직관력있는 사람을 원할 것이다. 이는 모두 데이터 과학자(data scientists)에게 중요한 자질들이다.

그러나 데이터 과학은 '수'에 정통한 것 이상을 요구하는 분야다. 데이터 과학자는 기업과 기관의 의사결정자에게 영향을 끼쳐야 하고, 회사의 미래에 대한 방향을 제시한다.

유능한 데이터 과학자를 만드는 자질 가운데 논리적으로 쉽게 떠올릴 수 있는 자질들이 많다. 그러나 데이터 과학자는 데이터 분야에 속하지 않는 많은 역량을 필요로 한다.

인포 다이내믹 사이언스 랩스(Infor Dynamic Science Labs)의 최고 과학자이자 수석 부사장인 자이드 네멜딘은 다른 누구보다 이 점을 잘 알고 있다. 네멜딘은 자사를 위해 일할 데이터 과학자를 채용하고 있으며, 회사 내 수많은 비즈니스의 데이터 전략에 대한 가이드라인을 제시하고 있다.

네멜딘에 따르면, 데이터 과학자를 잘못 이해하고 있다면, 지금이야말로 전략을 재평가할 시기다.

1. 데이터 수집에 관한 직종이다
수많은 데이터를 수집, 분류 및 정리, 이해하는 능력은 데이터 과학자에게 아주 중요한 역량이다. 그러나 이들 데이터를 유용한 형식으로 조직 내 다른 사람들에게 프레젠테이션할 수 있는 능력도 필요하다.

네멜딘은 프레젠테이션 스킬이 뛰어난 데이터 과학자를 채용하기 위해, 입사 후보자들에게 각자 열정을 갖고 있는 내용을 주제로 30분간 프레젠테이션을 실시하도록 요구하고 있다.

이는 프레젠테이션 능력 테스트에 목적이 있다. 그 결과, 시작부터 끝까지 데이터를 가장 잘 활용할 수 있는 능력을 갖춘 데이터 과학자로 구성된 팀을 보유하고 있다.

네멜딘에 따르면, 데이터 과학자를 찾을 때 자주 간과하는 자질 가운데 하나가 프리젠테이션 능력이다. 그는 "우리는 여러 소스(출처)에서 계속 증가하는 데이터를 수집하는 세상에 살고 있다. 데이터 과학 업무 가운데 상당수는 이렇게 데이터를 획득해 보고하는 것과 관련이 있다. 이런 사실 자체를 부정하거나 반대하지는 않는다. 그러나 데이터 과학은 그 이상이 필요한 분야이다"고 말했다.

네멜딘은 IT 리더가 이런 데이터 소프트 능력을 무시할 경우, 비즈니스에 피해가 발생한다고 강조했다. 데이터를 수용해야 할 사람들을 설득하지 못하면 데이터로 성과를 창출할 수 없기 때문이다.

데이터 과학자는 자신의 데이터 분석을 확신할 수 있어야 한다. 그리고 조직 내 임원과 매니저, 다른 직원들이 이를 실제 활용할 수 있도록 만들어야 한다. 회사의 데이터 과학자가 데이터를 수집해 전파하는 것 이상을 하지 않는다면, 해야 할 일을 명시한 직무 기술서를 바꿔야 할 시기인지 모른다.

2. 데이터 과학자는 개발자다
네멜딘에 따르면, 데이터 과학자에 대한 가장 큰 오해는 이들을 개발자로 인식하는 것이다. 데이터 과학자가 데이터 수집을 넘어, 이를 이해한 후, 솔루션을 기획해 발전시키도록 만들기 위해서는 기대치가 높아야 한다. 데이터 과학자는 분명히 개발 분야의 학력과 경력을 갖고 있지만, 개발은 실제 개발자에게 맡겨야 한다.

많은 데이터 과학자가 개발 분야의 경험을 갖고 있겠지만, 이들이 데이터에만 초점을 맞추는 것이 좋다. 이들은 데이터를 수집해, 이를 활용해야 할 사람들에게 제시하는 책임을 져야 한다.

동시에 신뢰를 구축해야 한다. 네멜딘은 "데이터 분석 결과를 토대로 행동하라고 요구하는 것은 분석 결과를 믿으라는 이야기다. 데이터 프레젠테이션과 데이터 분석에 활용하는 방법이 아주 중요한 이유가 여기에 있다. 이는 또 최초 신뢰 구축과 관련이 있다"고 말했다.

데이터 과학자가 데이터 분석과 함께 이를 보관할 시스템 구축과 설계를 책임지고 있을 경우, 이들은 데이터와 관련된 의사결정자와 관계를 구축하는데 시간을 투자할 수 없을 것이다.

즉 데이터 과학팀은 효과적으로 데이터를 관리, 분석하고, 조직 내 관련된 사람들과 관계를 구축할 시간을 갖고 있어야 한다. IT는 현대 비즈니스에서 아주 큰 비중을 차지하고 있다. 데이터 과학자가 데이터 전략을 제시하고 설명하지 못한다면, 성과 창출에 방해를 받을 것이다.

3. 중앙화된 팀 하나가 데이터와 관련된 모든 업무를 처리할 수 있다
바이모달(Bimodal) IT는 새로운 IT 관리 개념이다. 바이모달 IT의 한 면은 기존의 IT다. 더 느리게 움직이고, 네트워크와 하드웨어, 소프트웨어 보안 유지관리에 초점이 맞춰져 있다.

다른 한 면은 이보다 '진보적인' IT다. 빠르게 신기술을 도입하고, 항상 앞서나가는 등 혁신에 초점을 맞춘 IT다. 바이모달 IT는 IT가 전반적인 비즈니스 모델에 끼치는 영향을 2개의 초점으로 나눠 관리하는 방법이다.

네멜딘은 데이터에도 동일한 미래가 펼쳐질 것으로 예상하고 있다. 네멜딘은 "데이터 과학자는 데이터를 자주 취급하는 사람들을 집합적으로 가리키는 개념이다. 그러나 원칙적으로 데이터를 사용할 수 있도록 수집, 전송, 분류 및 정리, 보관하는 데이터 아키텍트 또는 엔지니어 집단과 데이터를 이용한 문제 해결을 중시하는 데이터 과학 집단으로 나눠져 있다"고 설명했다.

기업과 기관은 1~2명의 전담 데이터 과학자를 IT팀에 합류시켜, 모든 데이터를 처리하도록 책임을 맡기겠다는 생각을 버려야 한다. 조직이 커질수록 데이터 과학팀을 2개의 각기 다른 분야에 초점을 맞추는 집단으로 분류하고 싶은 생각이 커질 것이다.

데이터를 전담하는 완전한 부서를 만들거나, IT의 우산 아래 두는 방법을 파악하면서, 데이터 과학자에게 필요한 자원 모두를 제공해야 한다는 의미다.

4. 데이터는 변하지 않는다
데이터 과학자를 채용해 앞으로 몇년 동안 계속해서 동일한 데이터 모델을 사용하도록 만드는 비즈니스 모델을 갖고 있다면 기대에 어긋난 결과가 나올 것이다. IT는 빠르게 발전하고 있다. 빅데이터를 도입한 사람들은 향후 자신의 역할이 크게 바뀔 것이라고 생각해야 한다.

지난 5~10년 동안 IT가 비즈니스에 초래한 변화를 생각해보자. 그러면 앞으로 10년 동안 초래될 변화를 상상할 수 있다. 데이터가 폭증했다. 많은 비즈니스가 마침내 데이터를 올바르게 활용하고 있다. 그러나 여기에 안주해서는 안 된다.

데이터는 IT 산업만이 아니라 모든 산업에 영향을 미치고 있다. 데이터 전략에는 기업의 미래, 데이터가 기업 성장에 기여할 역할에 대한 고려가 포함되어 있어야 한다.

네멜딘은 "소프트웨어가 발전해 현재 존재하는 많은 직무들을 대신하게 될 것이다. BI(Business Intelligence) 소프트웨어에 접목된 인공지능의 기능이 향상되어, 비즈니스에 있어 이례적인 현상과 이를 초래한 원인을 파악하게 될 것이다. 데이터 과학 부서의 역할도 바뀔 전망이다. AI를 관리하거나 중개자 역할을 하고, 미래의 의사결정을 최적화하는 데 더 초점을 맞추게 된다. 그러나 이 역할 또한 대체될 것이다"고 말했다. editor@itworld.co.kr


X