2018.03.08

미국 내 데이터 과학과 머신러닝의 초고속 성장 원동력 4가지

Vivian Zhang and Chris Neimeth | InfoWorld
소셜 네트워킹 웹사이트 링크드인은 웹사이트 데이터에 기반해 미국 내에서 가장 빠르게 성장하고 있는 직군을 조명한 보고서를 발행했다. 링크드인은 이 보고서에서 2012년과 2017년 데이터를 비교하고 있다. 지난 5년간 9.8배의 성장률을 보인 머신러닝이 1위를, 2012년 이후 6.5배의 성장률을 보인 데이터 과학자가 2위를 차지했다. 상위 10개 직군 중 4개는 데이터 과학과 관련된 분야였으며, 이들 4 직종 중 3종이 상위 5위 안에 들어갔다. 그렇다면 데이터 과학 관련 직군, 특히 머신러닝과 관련한 직군이 이처럼 빠르게 성장하는 이유는 무엇일까?

물론 그 전에도 데이터 과학 분야의 빠른 성장률을 지적하는 보고서는 꾸준히 있어 왔지만, 링크드인 보고서가 특별한 이유는 이들 직군의 엄청난 성장률을 뚜렷이 보여주었기 때문이다. 머신러닝과 데이터 과학 분야의 빠른 성장 뒤에 숨은 원동력 4가지를 살펴 보자.

기하급수적으로 증가한 데이터 양
전체 데이터의 90% 이상이 지난 2년 동안 생성된 것이다. 뿐만 아니라 오늘날 하루 데이터 생성량은 무려 2.5퀸틸리언(quintillion) 바이트에 달한다. 이 숫자가 무엇을 의미하는지 궁금한 독자들을 위해, 데이터 업체 도모(Domo)가 보다 쉽게 풀어 쓴 설명을 읽어 보자.

- 미국인들은 1분에 265만 7,700GB의 데이터를 사용한다.
- 인스타그램 유저들은 1분에 4만 6,750개의 사진을 포스팅 한다.
- 1분에 1,522만 700 개의 문자 메시지가 전송된다.
- 구글은 1분에 36만 7,080 건의 검색을 진행한다.

이런 활동을 할 때마다 데이터가 생성되므로 오늘날 존재하는 데이터의 양은 우리의 상상을 초월한다. 이처럼 차고 넘치는 데이터의 홍수 속에서, 어떻게든 데이터를 활용하려는 기업이 관련 기술을 가진 전문가를 찾는 건 당연한 일이다. 예컨대 인스타그램은 매 분마다 포스팅 되는 4만 6,750 개의 사진 중에서 가장 많이 공유되는 사진이 어떤 것인지 알고 싶을 것이다. 어떤 종류의 콘텐츠가 플랫폼에 더 잘 맞을까? 이는 데이터에서 유의미한 정보를 추출해 내는 하나의 단적인 예일 뿐이며, 데이터로 할 수 있는 수많은 일들 중 빙산의 일각일 뿐이다. 데이터의 양이 기하급수적으로 증가하면서, 데이터를 읽고 분석할 수 있는 전문가에 대한 수요도 급증하고 있다.

데이터에 기반해 의사 결정을 내릴 때 더 많은 이윤을 얻는다
데이터가 결국 돈으로 연결되지 않는다면 기업이 이를 유용하게 생각할 리 없다. 데이터는 더 나은 의사 결정을 내리도록 도와줄 뿐만 아니라, 의사 결정을 통해 기업의 이윤도 증가한다. 하버드 비즈니스 리뷰에서 내놓은 한 연구 결과에 의하면 “업계 상위 1/3 내에 드는 기업 중 데이터에 기반한 의사 결정을 내리는 기업은 경쟁 기업보다 생산성은 5%, 이윤은 6% 가량 더 앞서가고 있었다.”

데이터는 숫자와 통계에 근거하여, 개인적인 감정이 배제된 의사 결정을 내릴 수 있게 해준다. CEO의 직감에 의존하는 것과는 다르다. 데이터를 이용해 이윤과 경쟁력이 향상된다면, 데이터를 읽고 이를 비전문가에게 설명해 줄 수 있는 인력을 고용하려는 기업도 자연스레 늘어날 수 밖에 없을 것이다.

비즈니스 방식을 바꾸어 놓은 머신러닝
머신러닝이란 시스템이 자체적으로 새로운 정보를 학습하고, 발전해 나가는 인공 지능의 한 분과다. 마케팅에서 금융, 헬스 케어에 이르기까지 이제는 많은 산업들에서 머신러닝이 사용되고 있다. 머신러닝 알고리즘은 시간과 물자를 절약해 주며, 과거 정보에 기반하여 빠르고 정확한 의사 결정을 내릴 수 있다. 예를 들어 금융 기관에서는 이제 대출 심사 작업을 머신러닝 알고리즘에 맡길 수 있게 되었는데, 사람의 도움 없이도 알고리즘이 대출 신청자의 리스크를 평가해 대출 승인 여부를 판단할 수 있기 때문이다.
MLaaS(Machine Learning as a service)도 점차 현실이 되고 있다. 자체적인 머신러닝 플랫폼을 개발하려고 막대한 자원과 인력을 쏟아 붓는 대신 MLaaS를 이용하고자 하는 기업들이 늘어나기 때문이다. 이제는 C레벨 경영자의 인풋 없이 일반적인 기업의 직원들도 머신러닝 플랫폼을 사용해 현명한 의사 결정을 내릴 수 있다. 물론 머신러닝 알고리즘을 만들어 내는 개발자에 대한 의존도는 지속되겠지만, 앞으로 우리가 비즈니스를 하는 방식 역시 완전히 달라질 것임을 기대해 볼 수 있는 대목이다.

미래 예측을 통해 기업 경쟁력 더해주는 머신러닝
머신러닝 알고리즘을 통해 인간의 눈으로는 포착해 내지 못한 숨은 정보를 찾아내기도 한다. 처리되는 정보의 양이 워낙 많다 보니, 때로는 데이터 과학자들 조차도 놓치고 지나가는 트렌드나 패턴이 있다. 시장의 미래를 예측하는 능력이야말로 기업에게 경쟁력을 부여해 주며, 머신러닝 알고리즘이 하는 일이 바로 이런 것이다. 머신러닝 기술의 예측 모델을 계속해서 개선시켜 줄 수 있는, 그리하여 계속해서 기업의 경쟁 우위를 유지할 수 있도록 해 주는 머신러닝 전문가를 찾는 이유다.

데이터 과학과 머신러닝 관련 직종들은 앞으로도 한동안은 성장세를 이어 나갈 전망이다. 처리해야 할 방대한 데이터의 양과 그러한 데이터가 기업에게 안겨줄 수 있는 이윤을 생각해 보면, 이들 직군에 대한 기업들의 수요가 쉽게 사라지지 않을 것이라 짐작해 볼 수 있기 때문이다. 또한 이러한 수요는 공급을 훨씬 초과하고 있다.

맥킨지 글로벌 인스티튜트(McKinsey Global Institute)에 따르면 2024년에는 미국 전역에 약 25만 곳의 데이터 과학 관련 포지션이 공석으로 남게 될 것이라 한다. 데이터 과학 스킬 갭으로 인해 기업이 필요로 하는 분석적 능력을 갖춘 지원자를 고용 또는 교육시키는 일이 더욱 힘들어질 것이다. 온라인 프로그램이나 부트 캠프 등으로 이러한 간극을 메워 보려 할 수는 있겠지만, 유능한 데이터 과학 인재에 대한 기업들의 갈망은 앞으로도 수 년간 계속 될 것으로 보인다. 

2018.03.08

미국 내 데이터 과학과 머신러닝의 초고속 성장 원동력 4가지

Vivian Zhang and Chris Neimeth | InfoWorld
소셜 네트워킹 웹사이트 링크드인은 웹사이트 데이터에 기반해 미국 내에서 가장 빠르게 성장하고 있는 직군을 조명한 보고서를 발행했다. 링크드인은 이 보고서에서 2012년과 2017년 데이터를 비교하고 있다. 지난 5년간 9.8배의 성장률을 보인 머신러닝이 1위를, 2012년 이후 6.5배의 성장률을 보인 데이터 과학자가 2위를 차지했다. 상위 10개 직군 중 4개는 데이터 과학과 관련된 분야였으며, 이들 4 직종 중 3종이 상위 5위 안에 들어갔다. 그렇다면 데이터 과학 관련 직군, 특히 머신러닝과 관련한 직군이 이처럼 빠르게 성장하는 이유는 무엇일까?

물론 그 전에도 데이터 과학 분야의 빠른 성장률을 지적하는 보고서는 꾸준히 있어 왔지만, 링크드인 보고서가 특별한 이유는 이들 직군의 엄청난 성장률을 뚜렷이 보여주었기 때문이다. 머신러닝과 데이터 과학 분야의 빠른 성장 뒤에 숨은 원동력 4가지를 살펴 보자.

기하급수적으로 증가한 데이터 양
전체 데이터의 90% 이상이 지난 2년 동안 생성된 것이다. 뿐만 아니라 오늘날 하루 데이터 생성량은 무려 2.5퀸틸리언(quintillion) 바이트에 달한다. 이 숫자가 무엇을 의미하는지 궁금한 독자들을 위해, 데이터 업체 도모(Domo)가 보다 쉽게 풀어 쓴 설명을 읽어 보자.

- 미국인들은 1분에 265만 7,700GB의 데이터를 사용한다.
- 인스타그램 유저들은 1분에 4만 6,750개의 사진을 포스팅 한다.
- 1분에 1,522만 700 개의 문자 메시지가 전송된다.
- 구글은 1분에 36만 7,080 건의 검색을 진행한다.

이런 활동을 할 때마다 데이터가 생성되므로 오늘날 존재하는 데이터의 양은 우리의 상상을 초월한다. 이처럼 차고 넘치는 데이터의 홍수 속에서, 어떻게든 데이터를 활용하려는 기업이 관련 기술을 가진 전문가를 찾는 건 당연한 일이다. 예컨대 인스타그램은 매 분마다 포스팅 되는 4만 6,750 개의 사진 중에서 가장 많이 공유되는 사진이 어떤 것인지 알고 싶을 것이다. 어떤 종류의 콘텐츠가 플랫폼에 더 잘 맞을까? 이는 데이터에서 유의미한 정보를 추출해 내는 하나의 단적인 예일 뿐이며, 데이터로 할 수 있는 수많은 일들 중 빙산의 일각일 뿐이다. 데이터의 양이 기하급수적으로 증가하면서, 데이터를 읽고 분석할 수 있는 전문가에 대한 수요도 급증하고 있다.

데이터에 기반해 의사 결정을 내릴 때 더 많은 이윤을 얻는다
데이터가 결국 돈으로 연결되지 않는다면 기업이 이를 유용하게 생각할 리 없다. 데이터는 더 나은 의사 결정을 내리도록 도와줄 뿐만 아니라, 의사 결정을 통해 기업의 이윤도 증가한다. 하버드 비즈니스 리뷰에서 내놓은 한 연구 결과에 의하면 “업계 상위 1/3 내에 드는 기업 중 데이터에 기반한 의사 결정을 내리는 기업은 경쟁 기업보다 생산성은 5%, 이윤은 6% 가량 더 앞서가고 있었다.”

데이터는 숫자와 통계에 근거하여, 개인적인 감정이 배제된 의사 결정을 내릴 수 있게 해준다. CEO의 직감에 의존하는 것과는 다르다. 데이터를 이용해 이윤과 경쟁력이 향상된다면, 데이터를 읽고 이를 비전문가에게 설명해 줄 수 있는 인력을 고용하려는 기업도 자연스레 늘어날 수 밖에 없을 것이다.

비즈니스 방식을 바꾸어 놓은 머신러닝
머신러닝이란 시스템이 자체적으로 새로운 정보를 학습하고, 발전해 나가는 인공 지능의 한 분과다. 마케팅에서 금융, 헬스 케어에 이르기까지 이제는 많은 산업들에서 머신러닝이 사용되고 있다. 머신러닝 알고리즘은 시간과 물자를 절약해 주며, 과거 정보에 기반하여 빠르고 정확한 의사 결정을 내릴 수 있다. 예를 들어 금융 기관에서는 이제 대출 심사 작업을 머신러닝 알고리즘에 맡길 수 있게 되었는데, 사람의 도움 없이도 알고리즘이 대출 신청자의 리스크를 평가해 대출 승인 여부를 판단할 수 있기 때문이다.
MLaaS(Machine Learning as a service)도 점차 현실이 되고 있다. 자체적인 머신러닝 플랫폼을 개발하려고 막대한 자원과 인력을 쏟아 붓는 대신 MLaaS를 이용하고자 하는 기업들이 늘어나기 때문이다. 이제는 C레벨 경영자의 인풋 없이 일반적인 기업의 직원들도 머신러닝 플랫폼을 사용해 현명한 의사 결정을 내릴 수 있다. 물론 머신러닝 알고리즘을 만들어 내는 개발자에 대한 의존도는 지속되겠지만, 앞으로 우리가 비즈니스를 하는 방식 역시 완전히 달라질 것임을 기대해 볼 수 있는 대목이다.

미래 예측을 통해 기업 경쟁력 더해주는 머신러닝
머신러닝 알고리즘을 통해 인간의 눈으로는 포착해 내지 못한 숨은 정보를 찾아내기도 한다. 처리되는 정보의 양이 워낙 많다 보니, 때로는 데이터 과학자들 조차도 놓치고 지나가는 트렌드나 패턴이 있다. 시장의 미래를 예측하는 능력이야말로 기업에게 경쟁력을 부여해 주며, 머신러닝 알고리즘이 하는 일이 바로 이런 것이다. 머신러닝 기술의 예측 모델을 계속해서 개선시켜 줄 수 있는, 그리하여 계속해서 기업의 경쟁 우위를 유지할 수 있도록 해 주는 머신러닝 전문가를 찾는 이유다.

데이터 과학과 머신러닝 관련 직종들은 앞으로도 한동안은 성장세를 이어 나갈 전망이다. 처리해야 할 방대한 데이터의 양과 그러한 데이터가 기업에게 안겨줄 수 있는 이윤을 생각해 보면, 이들 직군에 대한 기업들의 수요가 쉽게 사라지지 않을 것이라 짐작해 볼 수 있기 때문이다. 또한 이러한 수요는 공급을 훨씬 초과하고 있다.

맥킨지 글로벌 인스티튜트(McKinsey Global Institute)에 따르면 2024년에는 미국 전역에 약 25만 곳의 데이터 과학 관련 포지션이 공석으로 남게 될 것이라 한다. 데이터 과학 스킬 갭으로 인해 기업이 필요로 하는 분석적 능력을 갖춘 지원자를 고용 또는 교육시키는 일이 더욱 힘들어질 것이다. 온라인 프로그램이나 부트 캠프 등으로 이러한 간극을 메워 보려 할 수는 있겠지만, 유능한 데이터 과학 인재에 대한 기업들의 갈망은 앞으로도 수 년간 계속 될 것으로 보인다. 

X