2016.02.01

가장 '핫'한 직업, 데이터 과학자가 되기 위한 조건

Katherine Noyes | IDG News Service
데이터 과학자(data scientist)가 올해 미국에서 가장 인기있는 직업으로 떠올랐다. 자신이 어떤 기술을 갖고 있어야 데이터 과학자가 될 수 있을까.

데이터 과학자는 평균 기본 연봉이 11만 6,840달러(1억 4,108만 원), 취업 사이트 글래스도어(Glassdoor)에서 구인란에 최고 순위 자리를 차지하고 있다.

최근 새로운 교육 프로그램을 설치하는 등 대학들의 온갖 노력에도 불구하고 공급이 부족하다. 이는 다시 말해, 사람들에게 데이터 과학자로의 기회가 열려 있음을 의미한다. 이런 기회의 땅에 자신도 찾아갈 수 있을까?

버치 웍스(Burtch Works)에서 데이터 과학자 리크루터 아담 플루겔은 "이는 경우에 따라 다르다"고 말했다. 플루겔은 "기본적인 요구사항 가운데 깊은 통계 지식과 예측 분석 작업 능력은 필수적"이라며, "기본적인 코딩 능력에 대한 증거로 R과 파이썬(Python) 기술은 일반적이다"고 전했다.

플루겔은 전통적으로 전문 특화된 영역인 예측 분석에서는 파이썬의 사용 수준이 특정 목적에서 상당히 기본적인 수준이지만, 데이터 과학자 영역에서는 파이썬 툴로 1~2개 라이브러리에서 제한없이 구축할 수 있는 이를 찾고 있다. 예를 들어 동영상, 이미지, 자연어와 같은 비정형 데이터를 함께 사용할 수 있어야 한다는 의미다.

플루겔은 특정 툴에 대한 경험 측면에서 일정부분 자유로운 것도 있다. 파이썬 역량 대신 자바 또는 C++ 기술로 대체할 수 있다고 전했다. "실제 중요한 것은 코딩 능력과 통계와 예측 분석 능력"이라며, "고용주 입장에서는 코딩 방법과 사고방식을 교육하는 것보다 파이썬 구문을 가르치는게 더 쉬울 수 있다"고.

또한 중요한 것은 관계형 데이터베이스(relational database, RDB)와 비관계형(nonrelational) 빅데이터 DB에서의 경험이다. SQL은 일반적으로 요구되는 사항이며, 하둡 또는 스파크 기술을 갖고 있다면 엄청난 도움이 된다.

플루겔은 "머신러닝 알고리즘 경험을 갖고 있는 것도 회사들에게는 매력적인 요소로 작용한다"고 말했다. 데이터 중심의 개발업체 크라우드플라워(CrowdFlower)의 최근 보고서에 따르면, SQL, 하둡, 파이썬, 자바, 그리고 R 역량 등이 TOP 5 기술이다. 

교육 현장에서 데이터 과학자들은 박사급과 석사급으로 크게 반반으로 나뉘며 학사는 아주 드물다. 일반적으로 전문화된 수학, 통계, 컴퓨터 과학이 대부분이지만, 신경과학(neuroscience), 컴퓨터 심리학(Computational Psychology), 생물학과 같은 다른 영역도 있다.

플루겔은 데이터 과학자가 되기 위해 고려해야 할 몇가지 팁을 소개했다.
우선 IT 또는 컴퓨터 과학, 또는 코딩 지식이 배경에 깔려 있어야 한다. 양적 연구방법은 과소평가해서는 안되며, 통계 기술은 기본 요구사항이다. 이는 주요한 공부 과제다. 이런 특별한 기술을 전수해 주는 것을 초점으로 하는 좋은 훈련 프로그램들이 많이 있다.

플루겔은 "데이터 과학 사이트 캐글(Kaggle)에서의 경쟁은 또다른 가치있는 자원이 될 수 있다. 이를 통해 구인 제안이 들어오기도 한다"고 덧붙였다.

데이터 과학은 여전히 열정 없이는 경험을 쌓을 수 없다. 플루겔은 "이는 일생의 과제다. 항상 현재에 머물러야 하며 항상 배움의 자세를 갖고 임해야 한다. 가장 최고의 데이터 과학자들은 낮에는 자신의 직업에서 일하면서도 집에 돌아와서는 자신이 좋아하는 프로젝트에서 새로운 기술과 툴들을 실험한다"고 말했다.

"이것이 높은 연봉과 연결되는 것은 쉽지 않다. 다른 말로 이 직업은 아주 몰입해야 하고 적당한 재미를 갖고 있어야 한다"고 조언했다. editor@itworld.co.kr


2016.02.01

가장 '핫'한 직업, 데이터 과학자가 되기 위한 조건

Katherine Noyes | IDG News Service
데이터 과학자(data scientist)가 올해 미국에서 가장 인기있는 직업으로 떠올랐다. 자신이 어떤 기술을 갖고 있어야 데이터 과학자가 될 수 있을까.

데이터 과학자는 평균 기본 연봉이 11만 6,840달러(1억 4,108만 원), 취업 사이트 글래스도어(Glassdoor)에서 구인란에 최고 순위 자리를 차지하고 있다.

최근 새로운 교육 프로그램을 설치하는 등 대학들의 온갖 노력에도 불구하고 공급이 부족하다. 이는 다시 말해, 사람들에게 데이터 과학자로의 기회가 열려 있음을 의미한다. 이런 기회의 땅에 자신도 찾아갈 수 있을까?

버치 웍스(Burtch Works)에서 데이터 과학자 리크루터 아담 플루겔은 "이는 경우에 따라 다르다"고 말했다. 플루겔은 "기본적인 요구사항 가운데 깊은 통계 지식과 예측 분석 작업 능력은 필수적"이라며, "기본적인 코딩 능력에 대한 증거로 R과 파이썬(Python) 기술은 일반적이다"고 전했다.

플루겔은 전통적으로 전문 특화된 영역인 예측 분석에서는 파이썬의 사용 수준이 특정 목적에서 상당히 기본적인 수준이지만, 데이터 과학자 영역에서는 파이썬 툴로 1~2개 라이브러리에서 제한없이 구축할 수 있는 이를 찾고 있다. 예를 들어 동영상, 이미지, 자연어와 같은 비정형 데이터를 함께 사용할 수 있어야 한다는 의미다.

플루겔은 특정 툴에 대한 경험 측면에서 일정부분 자유로운 것도 있다. 파이썬 역량 대신 자바 또는 C++ 기술로 대체할 수 있다고 전했다. "실제 중요한 것은 코딩 능력과 통계와 예측 분석 능력"이라며, "고용주 입장에서는 코딩 방법과 사고방식을 교육하는 것보다 파이썬 구문을 가르치는게 더 쉬울 수 있다"고.

또한 중요한 것은 관계형 데이터베이스(relational database, RDB)와 비관계형(nonrelational) 빅데이터 DB에서의 경험이다. SQL은 일반적으로 요구되는 사항이며, 하둡 또는 스파크 기술을 갖고 있다면 엄청난 도움이 된다.

플루겔은 "머신러닝 알고리즘 경험을 갖고 있는 것도 회사들에게는 매력적인 요소로 작용한다"고 말했다. 데이터 중심의 개발업체 크라우드플라워(CrowdFlower)의 최근 보고서에 따르면, SQL, 하둡, 파이썬, 자바, 그리고 R 역량 등이 TOP 5 기술이다. 

교육 현장에서 데이터 과학자들은 박사급과 석사급으로 크게 반반으로 나뉘며 학사는 아주 드물다. 일반적으로 전문화된 수학, 통계, 컴퓨터 과학이 대부분이지만, 신경과학(neuroscience), 컴퓨터 심리학(Computational Psychology), 생물학과 같은 다른 영역도 있다.

플루겔은 데이터 과학자가 되기 위해 고려해야 할 몇가지 팁을 소개했다.
우선 IT 또는 컴퓨터 과학, 또는 코딩 지식이 배경에 깔려 있어야 한다. 양적 연구방법은 과소평가해서는 안되며, 통계 기술은 기본 요구사항이다. 이는 주요한 공부 과제다. 이런 특별한 기술을 전수해 주는 것을 초점으로 하는 좋은 훈련 프로그램들이 많이 있다.

플루겔은 "데이터 과학 사이트 캐글(Kaggle)에서의 경쟁은 또다른 가치있는 자원이 될 수 있다. 이를 통해 구인 제안이 들어오기도 한다"고 덧붙였다.

데이터 과학은 여전히 열정 없이는 경험을 쌓을 수 없다. 플루겔은 "이는 일생의 과제다. 항상 현재에 머물러야 하며 항상 배움의 자세를 갖고 임해야 한다. 가장 최고의 데이터 과학자들은 낮에는 자신의 직업에서 일하면서도 집에 돌아와서는 자신이 좋아하는 프로젝트에서 새로운 기술과 툴들을 실험한다"고 말했다.

"이것이 높은 연봉과 연결되는 것은 쉽지 않다. 다른 말로 이 직업은 아주 몰입해야 하고 적당한 재미를 갖고 있어야 한다"고 조언했다. editor@itworld.co.kr


X