2017.08.25

"최고의 직업 1위"…데이터 과학자의 역할과 되는 방법

Sarah K. White | CIO
데이터 과학자가 되는 경로는 업종에 따라 다르다. 그럼에도 불구하고 공통적으로 요구되는 역량과 경력, 학위 등이 있다. 여기 데이터 과학자 커리어를 시작하는데 필요한 정보를 정리했다.



데이터 과학자란 무엇일까
데이터 과학자(데이터 사이언티스트)는 수많은 구조화, 비구조화 데이터에서 특정 비즈니스 요구 성과나 목표를 달성하는 데 도움을 주는 인사이트를 발견해야 하는 책임을 갖고 있다. 데이터 분석 분야에서 데이터 과학자의 역할이 점차 더 중요해지고 있다. 기업들이 빅데이터 및 데이터 분석을 더 많이 활용해 의사 결정을 내리고, 클라우드 기술과 자동화, 머신러닝을 IT 전략의 핵심 구성 요소로 활용하는 기업들이 증가하는 추세이기 때문이다.

데이터 과학자의 주요 임무는 수많은 데이터를 체계화하고 분석하는 것이다. 이를 위해 전용 소프트웨어를 사용하는 경우가 많다. 데이터 과학자가 데이터 분석을 한 최종 결과물을 모든 이해 당사자가 알기 쉽게 만들수 있어야 한다. 특히 IT 외부의 관계자가 이를 이해하는 것이 중요하다.

데이터 과학자가 데이터 분석에 접근하는 방법은 소속 산업, 비즈니스 요구(필요 사항), 소속 부서에 따라 달라진다. 비즈니스 부문 리더, 부서, 매니저는 찾고자 하는 것을 미리 알려줘야 한다. 그래야 데이터 과학자가 구조화, 비구조화 데이터에서 '의미'를 찾을 수 있다. 데이터 과학자는 기업이나 부서의 목표를 예측 엔진, 패턴 감지 분석, 최적화 알고리즘 등 데이터 기반 결과물로 전환시킬 수 있는 비즈니스 전문성을 갖추고 있어야 한다.

데이터 과학자의 연봉
2016년 미국 노동 통계청(BLS)은 데이터 과학자의 평균 연봉이 약 11만 8,000달러(약 1억 3,300만 원)라고 발표했다. 급성장하는 동시에 보수도 좋은 직종이다. BLS는 이 분야의 일자리가 2024년까지 11% 증가할 것으로 내다봤다.

데이터 과학자 직종은 만족도 높은 장기 커리어 경로로 자리를 잡아가고 있다. 글래스도어의 '미국의 최고 직업 50종' 보고서에 따르면 채용 기회(공석), 보수, 전반적인 업무 만족도를 기준으로 했을 때 데이터 과학자가 최고의 직업인 것으로 분석됐다.

데이터 과학자가 하는 일
데이터 과학자의 주요 책임은 데이터 분석이다. 데이터 분석이란 데이터 수집에서 시작, 데이터 과학자의 최종 데이터 분석 결과를 바탕으로 비즈니스 의사 결정을 내리는 것으로 끝나는 프로세스다.

데이터 과학자는 통상 수많은 소스(출처)에서 이른바 '빅데이터'를 수집해 분석한다. 빅데이터는 크게 '구조화 데이터' 및 '비 구조화 데이터' 2종으로 분류할 수 있다. 구조화 데이터는 컴퓨터가 쉽게 자동으로 분류, 판독, 조직화할 수 있는 범주로 체계화되어 있는 데이터다. 서비스와 제품, 전자 장치가 수집하는 데이터가 여기에 포함된다. 가령 스마트폰이 수집한 GPS 좌표, 은행 계좌, 매출 통계, 웹사이트 트래픽 등이 구조화 데이터다.

빠르게 증가하고 있는 빅데이터인 비구조화 데이터는 주로 사람이 입력한 정보에 바탕을 둔 데이터로 구성되어 있다. 고객 리뷰, 이메일, 비디오, 소셜 미디어 게시물을 예로 들 수 있다. 통상 기술을 이용해 효율적으로 분류, 체계화, 관리하기 힘들다. 간결하지 않은 비구조화 데이터를 관리하려면 많은 투자가 필요할 수 있다. 일반적으로 관련 데이터를 추출하기 위해, 키워드를 사용하는 방식으로 비구조화 데이터를 이해하기 쉽게 만든다.

기업은 통상 데이터 과학자가 비구조화 데이터를 처리하도록 만든다. 그리고 다른 IT 분야 전문가가 구조화 데이터 관리 및 유지를 책임치곤 한다. 데이터 과학자 또한 구조화 데이터를 다루곤 하지만 비즈니스에 비구조화 데이터를 사용하기 원하는 기업이 증가하고 있는 추세이다. 따라서 비구조화 데이터가 데이터 과학자 역할의 핵심이 되고 있다.

데이터 과학자에게 요구되는 사항
산업마다 데이터 과학자가 분석해야 할 빅데이터 프로필이 다르다. 다음은 BLS 자료를 기준으로 했을 때, 데이터 사이언티스가 수행해야 하는 분석과 빅데이터의 종류를 산업 및 업무 별로 정리한 내용이다.

- 영업 : 현재 데이터가 사실상 모든 기업의 비즈니스 전략을 결정한다. 그러나 이를 위해서는 데이터 과학자가 정보를 이해할 수 있도록 만들어야 한다. 비즈니스 데이터 분석은 효율성, 재고, 생산 오류, 고객 로열티 등과 관련된 의사 결정에 도움을 주는 정보를 제공한다.

- 전자상거래 : 이제 웹사이트는 구매 데이터 '이상'을 수집한다. 데이터 과학자는 전자상거래 사업체의 고객 서비스 개선, 트렌드 파악, 서비스나 제품 개발에 도움을 주고 있다.

- 금융 : 금융 산업에서는 계좌 신용 및 차변 거래에 대한 데이터, 기타 이와 유사한 금융 데이터가 기업 활동에 아주 중요한 역할을 한다. 그러나 이 분야의 데이터 과학자들은 사기 및 부정 행위 감지 등 보안과 컴플라이언스(규제 또는 정책 준수)도 크게 중시해야 한다.

- 공공 : 빅데이터는 정부의 정책 결정, 선거 구민 지원, 만족도 모니터링에 도움을 준다. 또 금융 부문과 마찬가지로 보안과 컴플라이언스를 중요하게 취급해야 한다.

- 과학 : 과학자들은 항상 데이터를 취급해 왔다. 그러나 이제는 기술을 활용, 더 효과적으로 실험 데이터를 수집, 공유, 분석할 수 있다. 데이터 과학자는 이런 프로세스에 도움을 줄 수 있다.

- 소셜 네트워킹 : 소셜 네트워킹 데이터는 표적화 된 광고에 필요한 정보를 제공하고, 고객 만족도를 높이고, 위치 데이터로 트렌드를 파악하고, 기능과 서비스를 개선하는 데 도움을 준다. 비즈니스는 게시물과 트윗, 블로그, 기타 소셜 미디어 데이터를 지속적으로 분석, 서비스를 꾸준히 개선할 수 있다.

- 의료 : 최근 전자 의료 기록(EMR)이 의료 기관의 '기준'이 됐다. 그리고 EMR에는 빅데이터, 보안, 컴플라이언스가 필요하다. 데이터 과학자는 의료 서비스를 향상시키고, 다른 방법으로 찾지 못할 수도 있는 트렌드 발굴에 도움을 줄 수 있다.

- 통신 : 모든 전자 장치가 데이터를 수집한다. 이렇게 수집한 데이터를 저장, 관리, 분석해야 한다. 데이터 과학자는 버그를 해결하고, 제품을 개선하고, 계속 고객이 원하는 기능을 전달해 만족도를 높이는 데 도움을 준다.

- 기타 : 빅데이터가 주도하는 변화에 영향을 받지 않는 산업은 없다. BLS는 정치 및 행정, 유틸리티, 스마트 가전 같은 틈새 분야에도 데이터 과학자 일자리가 있다고 강조한다.

데이터 과학자의 스킬
쿼라(Quora)의 데이터 과학자인 윌리엄 첸에 따르면, 데이터 과학자에게 가장 중요한 스킬은 5가지로, 이 중에는 하드 스킬과 소프트 스킬이 모두 포함되어 있다.

- 프로그래밍 : 첸은 데이터 과학자의 스킬 세트 가운데 가장 기본적인 스킬이 프로그래밍이라고 설명했다. 프로그래밍은 통계 관련 스킬을 높여준다. 이는 수많은 데이터세트 분석에 도움을 주고, 자신만의 도구를 만들 수 있는 능력을 제공한다.

- 정량적 분석 : 빅데이터 분석에 중요한 스킬이다. 정량적 분석은 실험 분석 역량을 높여주고, 데이터 전략을 확대시키고, 머신러닝 구현에 도움을 준다.

- 제품 이해력 : 제품을 이해하면 정량 분석에 도움이 된다. 또 시스템 행동 예측, 매트릭스 수립, 디버깅에 도움을 준다.

- 커뮤니케이션 : 산업에 상관 없이 가장 중요한 소프트 스킬이다. 커뮤니케이션 스킬은 앞서 설명한 스킬을 활용하는 데 도움을 줄 수 있다.

- 팀웍 : 데이터 과학자로 성공적인 커리어를 쌓는 데 아주 중요한 역할을 한다. 협업에 능통하고 피드백을 수용할 수 있어야 하며, 팀원과 지식을 공유할 수 있어야 한다.

데이터 과학자 관련 교육과 훈련
데이터 과학자가 될 수 있는 방법은 많다. 그러나 관련 학사 학위 취득이 가장 일반적인 방법이다. BLS 데이터에 따르면, 석사 학위 이상을 소지한 데이터 과학자가 많다. 그러나 반드시 석사 학위 이상을 취득해야 한다는 의미는 아니다. 데이터 과학자 스킬을 발전시킬 다른 방법들이 있기 때문이다. 고등 교육을 받기 전, 종사하고 싶은 산업에서 가장 중요한 스킬과 도구, 소프트웨어를 파악하는 것이 좋다.

데이터 과학에는 일정 수준의 비즈니스 전문성이 필요하다. 또 산업에 따라 데이터 과학자의 역할이 다르다. 첨단 기술 산업에 종사하고 있다면 추가 교육이 필요할 수도 있다. 예를 들어, 의료와 정부, 과학 부문에 필요한 스킬 세트는 마케팅, 비즈니스, 교육 부문과 다르다.

특정 산업의 필요 사항을 충족하는 스킬 세트를 개발해야 한다. 이런 스킬 획득에 도움을 줄 수 있는 온라인 강좌, 부트 캠프, 직업 개발 과정이 있다. 부트 캠프에 더해, 유용한 빅데이터 자격증이 많다. 이력서를 돋보이게 만들고, 연봉을 높일 수 있는 자격증들이다.

데이터 과학자 취업
필요한 교육과 트레이닝을 이수했다면, 자신의 스킬 수준에 맞는 일자리에 지원할 수 있다. 이미 IT 분야에 종사하고 있다면, 인맥을 활용해 빈 자리나 취업 기회가 있는지 찾는다.

희망하는 산업에 일자리가 있는지, 고등 교육 학위를 요구하는지, 자격증이나 부트 캠프로 채용 담당 매니저를 만족시킬 수 있는지 파악한다. 지원하는 일자리에 필요한 사항이 무엇인지 조사하는 데 시간을 투자한다. 이렇게 하면 필요한 교육 수준, 스킬, 경험으로 무장한 데이터 과학자가 되어 취업에 성공하는 전략을 수립할 수 있다. ciokr@idg.co.kr 


2017.08.25

"최고의 직업 1위"…데이터 과학자의 역할과 되는 방법

Sarah K. White | CIO
데이터 과학자가 되는 경로는 업종에 따라 다르다. 그럼에도 불구하고 공통적으로 요구되는 역량과 경력, 학위 등이 있다. 여기 데이터 과학자 커리어를 시작하는데 필요한 정보를 정리했다.



데이터 과학자란 무엇일까
데이터 과학자(데이터 사이언티스트)는 수많은 구조화, 비구조화 데이터에서 특정 비즈니스 요구 성과나 목표를 달성하는 데 도움을 주는 인사이트를 발견해야 하는 책임을 갖고 있다. 데이터 분석 분야에서 데이터 과학자의 역할이 점차 더 중요해지고 있다. 기업들이 빅데이터 및 데이터 분석을 더 많이 활용해 의사 결정을 내리고, 클라우드 기술과 자동화, 머신러닝을 IT 전략의 핵심 구성 요소로 활용하는 기업들이 증가하는 추세이기 때문이다.

데이터 과학자의 주요 임무는 수많은 데이터를 체계화하고 분석하는 것이다. 이를 위해 전용 소프트웨어를 사용하는 경우가 많다. 데이터 과학자가 데이터 분석을 한 최종 결과물을 모든 이해 당사자가 알기 쉽게 만들수 있어야 한다. 특히 IT 외부의 관계자가 이를 이해하는 것이 중요하다.

데이터 과학자가 데이터 분석에 접근하는 방법은 소속 산업, 비즈니스 요구(필요 사항), 소속 부서에 따라 달라진다. 비즈니스 부문 리더, 부서, 매니저는 찾고자 하는 것을 미리 알려줘야 한다. 그래야 데이터 과학자가 구조화, 비구조화 데이터에서 '의미'를 찾을 수 있다. 데이터 과학자는 기업이나 부서의 목표를 예측 엔진, 패턴 감지 분석, 최적화 알고리즘 등 데이터 기반 결과물로 전환시킬 수 있는 비즈니스 전문성을 갖추고 있어야 한다.

데이터 과학자의 연봉
2016년 미국 노동 통계청(BLS)은 데이터 과학자의 평균 연봉이 약 11만 8,000달러(약 1억 3,300만 원)라고 발표했다. 급성장하는 동시에 보수도 좋은 직종이다. BLS는 이 분야의 일자리가 2024년까지 11% 증가할 것으로 내다봤다.

데이터 과학자 직종은 만족도 높은 장기 커리어 경로로 자리를 잡아가고 있다. 글래스도어의 '미국의 최고 직업 50종' 보고서에 따르면 채용 기회(공석), 보수, 전반적인 업무 만족도를 기준으로 했을 때 데이터 과학자가 최고의 직업인 것으로 분석됐다.

데이터 과학자가 하는 일
데이터 과학자의 주요 책임은 데이터 분석이다. 데이터 분석이란 데이터 수집에서 시작, 데이터 과학자의 최종 데이터 분석 결과를 바탕으로 비즈니스 의사 결정을 내리는 것으로 끝나는 프로세스다.

데이터 과학자는 통상 수많은 소스(출처)에서 이른바 '빅데이터'를 수집해 분석한다. 빅데이터는 크게 '구조화 데이터' 및 '비 구조화 데이터' 2종으로 분류할 수 있다. 구조화 데이터는 컴퓨터가 쉽게 자동으로 분류, 판독, 조직화할 수 있는 범주로 체계화되어 있는 데이터다. 서비스와 제품, 전자 장치가 수집하는 데이터가 여기에 포함된다. 가령 스마트폰이 수집한 GPS 좌표, 은행 계좌, 매출 통계, 웹사이트 트래픽 등이 구조화 데이터다.

빠르게 증가하고 있는 빅데이터인 비구조화 데이터는 주로 사람이 입력한 정보에 바탕을 둔 데이터로 구성되어 있다. 고객 리뷰, 이메일, 비디오, 소셜 미디어 게시물을 예로 들 수 있다. 통상 기술을 이용해 효율적으로 분류, 체계화, 관리하기 힘들다. 간결하지 않은 비구조화 데이터를 관리하려면 많은 투자가 필요할 수 있다. 일반적으로 관련 데이터를 추출하기 위해, 키워드를 사용하는 방식으로 비구조화 데이터를 이해하기 쉽게 만든다.

기업은 통상 데이터 과학자가 비구조화 데이터를 처리하도록 만든다. 그리고 다른 IT 분야 전문가가 구조화 데이터 관리 및 유지를 책임치곤 한다. 데이터 과학자 또한 구조화 데이터를 다루곤 하지만 비즈니스에 비구조화 데이터를 사용하기 원하는 기업이 증가하고 있는 추세이다. 따라서 비구조화 데이터가 데이터 과학자 역할의 핵심이 되고 있다.

데이터 과학자에게 요구되는 사항
산업마다 데이터 과학자가 분석해야 할 빅데이터 프로필이 다르다. 다음은 BLS 자료를 기준으로 했을 때, 데이터 사이언티스가 수행해야 하는 분석과 빅데이터의 종류를 산업 및 업무 별로 정리한 내용이다.

- 영업 : 현재 데이터가 사실상 모든 기업의 비즈니스 전략을 결정한다. 그러나 이를 위해서는 데이터 과학자가 정보를 이해할 수 있도록 만들어야 한다. 비즈니스 데이터 분석은 효율성, 재고, 생산 오류, 고객 로열티 등과 관련된 의사 결정에 도움을 주는 정보를 제공한다.

- 전자상거래 : 이제 웹사이트는 구매 데이터 '이상'을 수집한다. 데이터 과학자는 전자상거래 사업체의 고객 서비스 개선, 트렌드 파악, 서비스나 제품 개발에 도움을 주고 있다.

- 금융 : 금융 산업에서는 계좌 신용 및 차변 거래에 대한 데이터, 기타 이와 유사한 금융 데이터가 기업 활동에 아주 중요한 역할을 한다. 그러나 이 분야의 데이터 과학자들은 사기 및 부정 행위 감지 등 보안과 컴플라이언스(규제 또는 정책 준수)도 크게 중시해야 한다.

- 공공 : 빅데이터는 정부의 정책 결정, 선거 구민 지원, 만족도 모니터링에 도움을 준다. 또 금융 부문과 마찬가지로 보안과 컴플라이언스를 중요하게 취급해야 한다.

- 과학 : 과학자들은 항상 데이터를 취급해 왔다. 그러나 이제는 기술을 활용, 더 효과적으로 실험 데이터를 수집, 공유, 분석할 수 있다. 데이터 과학자는 이런 프로세스에 도움을 줄 수 있다.

- 소셜 네트워킹 : 소셜 네트워킹 데이터는 표적화 된 광고에 필요한 정보를 제공하고, 고객 만족도를 높이고, 위치 데이터로 트렌드를 파악하고, 기능과 서비스를 개선하는 데 도움을 준다. 비즈니스는 게시물과 트윗, 블로그, 기타 소셜 미디어 데이터를 지속적으로 분석, 서비스를 꾸준히 개선할 수 있다.

- 의료 : 최근 전자 의료 기록(EMR)이 의료 기관의 '기준'이 됐다. 그리고 EMR에는 빅데이터, 보안, 컴플라이언스가 필요하다. 데이터 과학자는 의료 서비스를 향상시키고, 다른 방법으로 찾지 못할 수도 있는 트렌드 발굴에 도움을 줄 수 있다.

- 통신 : 모든 전자 장치가 데이터를 수집한다. 이렇게 수집한 데이터를 저장, 관리, 분석해야 한다. 데이터 과학자는 버그를 해결하고, 제품을 개선하고, 계속 고객이 원하는 기능을 전달해 만족도를 높이는 데 도움을 준다.

- 기타 : 빅데이터가 주도하는 변화에 영향을 받지 않는 산업은 없다. BLS는 정치 및 행정, 유틸리티, 스마트 가전 같은 틈새 분야에도 데이터 과학자 일자리가 있다고 강조한다.

데이터 과학자의 스킬
쿼라(Quora)의 데이터 과학자인 윌리엄 첸에 따르면, 데이터 과학자에게 가장 중요한 스킬은 5가지로, 이 중에는 하드 스킬과 소프트 스킬이 모두 포함되어 있다.

- 프로그래밍 : 첸은 데이터 과학자의 스킬 세트 가운데 가장 기본적인 스킬이 프로그래밍이라고 설명했다. 프로그래밍은 통계 관련 스킬을 높여준다. 이는 수많은 데이터세트 분석에 도움을 주고, 자신만의 도구를 만들 수 있는 능력을 제공한다.

- 정량적 분석 : 빅데이터 분석에 중요한 스킬이다. 정량적 분석은 실험 분석 역량을 높여주고, 데이터 전략을 확대시키고, 머신러닝 구현에 도움을 준다.

- 제품 이해력 : 제품을 이해하면 정량 분석에 도움이 된다. 또 시스템 행동 예측, 매트릭스 수립, 디버깅에 도움을 준다.

- 커뮤니케이션 : 산업에 상관 없이 가장 중요한 소프트 스킬이다. 커뮤니케이션 스킬은 앞서 설명한 스킬을 활용하는 데 도움을 줄 수 있다.

- 팀웍 : 데이터 과학자로 성공적인 커리어를 쌓는 데 아주 중요한 역할을 한다. 협업에 능통하고 피드백을 수용할 수 있어야 하며, 팀원과 지식을 공유할 수 있어야 한다.

데이터 과학자 관련 교육과 훈련
데이터 과학자가 될 수 있는 방법은 많다. 그러나 관련 학사 학위 취득이 가장 일반적인 방법이다. BLS 데이터에 따르면, 석사 학위 이상을 소지한 데이터 과학자가 많다. 그러나 반드시 석사 학위 이상을 취득해야 한다는 의미는 아니다. 데이터 과학자 스킬을 발전시킬 다른 방법들이 있기 때문이다. 고등 교육을 받기 전, 종사하고 싶은 산업에서 가장 중요한 스킬과 도구, 소프트웨어를 파악하는 것이 좋다.

데이터 과학에는 일정 수준의 비즈니스 전문성이 필요하다. 또 산업에 따라 데이터 과학자의 역할이 다르다. 첨단 기술 산업에 종사하고 있다면 추가 교육이 필요할 수도 있다. 예를 들어, 의료와 정부, 과학 부문에 필요한 스킬 세트는 마케팅, 비즈니스, 교육 부문과 다르다.

특정 산업의 필요 사항을 충족하는 스킬 세트를 개발해야 한다. 이런 스킬 획득에 도움을 줄 수 있는 온라인 강좌, 부트 캠프, 직업 개발 과정이 있다. 부트 캠프에 더해, 유용한 빅데이터 자격증이 많다. 이력서를 돋보이게 만들고, 연봉을 높일 수 있는 자격증들이다.

데이터 과학자 취업
필요한 교육과 트레이닝을 이수했다면, 자신의 스킬 수준에 맞는 일자리에 지원할 수 있다. 이미 IT 분야에 종사하고 있다면, 인맥을 활용해 빈 자리나 취업 기회가 있는지 찾는다.

희망하는 산업에 일자리가 있는지, 고등 교육 학위를 요구하는지, 자격증이나 부트 캠프로 채용 담당 매니저를 만족시킬 수 있는지 파악한다. 지원하는 일자리에 필요한 사항이 무엇인지 조사하는 데 시간을 투자한다. 이렇게 하면 필요한 교육 수준, 스킬, 경험으로 무장한 데이터 과학자가 되어 취업에 성공하는 전략을 수립할 수 있다. ciokr@idg.co.kr 


X