2016.03.04

나쁜 데이터 과학자의 숨길 수 없는 8가지 신호

Andrew C. Oliver | InfoWorld
유니콘을 본 적이 있는가? 이는 완벽한 데이터 과학자를 보는 것과 같다. 완벽한 데이터 과학자를 찾을 수 없지만 훌륭한 채용 방법을 찾는다면 엉뚱한 사람을 고용하는 최악의 상황은 면할 수 있을 것이다. 무엇보다 데이터 과학(data science)은 팀 경기라는 걸 잊어서는 안된다.

금광 캐기는 이제 막 시작됐지만 어디에 금맥이 흐르는지, 황금 덩어리를 어떻게 분별하는지, 그리고 어떻게 캐는지에 대해 아무도 질문하지 않는다.

해답을 가지고 있는 사람이 바로 데이터 과학자인데, 좋은 데이터 과학자의 조건에 대해서는 아주 많은 기사들이 있다. 이는 기존 기사를 찾아보면 충분하다. 그러나 여기서는 조직에 도움을 주기보다는 잠재적으로 해를 끼치는 나쁜 데이터 과학자를 어떻게 구별하는가에 초점을 맞췄다.

1. 수학적 배경이 약하다
아주 예외적인 상황을 제외하고 데이터 과학자들의 핵심은 수학에 능통하다는 것이다. 데이터 과학자의 범위는 아주 다양한데, 무시무시한 파이썬(Python)이나 R을 쓰는 토털 수학자에서부터 머리 속에 머신러닝 알고리듬을 장착한 사람에 이르기까지 모두를 포함한다.

기업 업무에 따라 양자 모두가 필요할 지 모른다. 그러나 수학적 배경이 약한 데이터 과학자는 아마도 실제 데이터 과학자가 아니라 데이터 아키텍트나 데이터 엔지니어일 것이다. 이들은 인재 파견회사에서 나온 일개 컨설턴트에 가까울 것이다.

이런 사람은 기업의 비즈니스를 도와줄 수 없다. 약한 수학적 배경은 많은 방법들을 상하게 할 수 있으며 특히 데이터의 유용성을 판단하는 부문에서는 더욱 그렇다.

2. 약한 컴퓨팅 배경
수학자이지만 실제 컴퓨터를 이해하지 못하는 데이터 과학자들은 유용하지 않다. 이는 타자기를 사용하는 비서가 현대 세계에서 유용하지 않다는 것과 동일하다. 수많은 상황에서 무언가를 종이로 계산하는 방법과 스파크(Spark)와 같은 분산형 플랫폼을 사용하는 것과는 같지 않다. 데이터 과학자를 뽑는다면 이를 이해할 필요가 있다.

3. 유니콘은 존재하지 않는다
수학자이자 통계학자, 그리고 동시에 분산형 컴퓨팅 개발자인 데이터 과학자를 기대하지 마라. MBA 출신에다가 수학자로서의 실제 경험, 분산형 컴퓨팅 개발자, 비즈니스 현업의 경력을 갖고 있는 이라면 아마도 나이는 80이 넘었을 것이다. 그래서 팀이 필요한 것이다.

혹시 이런 실력을 갖춘 데이터 과학자를 만나더라도 간단한 규칙을 기억하라. "유니콘은 존재하지 않는다."

4. 무력한 학구파
코드를 직접 만들지 않는 코더나 실제 기술적 경험이 없는 아키텍트와 같이 데이터 과학자들은 실제 제한된 데이터 경험을 갖고 있다. 게다가 그들은 코드 내에서 파묻혀 자신의 손이 더러워지는 걸 원하지 않는다.

우리가 원하는 것은 실제 응용 부문이지 이론을 얘기하는 것이 아니다. 데이터 과학자를 대학에서 찾지 마라.

5. 빈약한 커뮤니케이션 스킬
기본적으로 데이터 과학자는 데이터에서 투명성을 가져온다. 기술적 전문가나 비즈니스 전문가로서 자신은 이를 모두 이해하지 못할 수도, 스스로 이행할 수 없고, 의사 결정 프로세스에서 신뢰를 얻지 못할 수도 있다. 하지만 최소한 개념상으로는 높은 수준의 이해도를 갖고 있어야 한다.

클러스터링 알고리듬, 확률 계산, 또는 NLP(natural language processing)든 그 무엇이더라도 전달하는 것은 힘들지 않다. 만약 자사의 데이터 과학자가 이런 일을 하지 않고 있다면 그 데이터 과학자는 일을 제대로 하지 않고 있는 것이다. 데이터 과학자는 접근 가능하거나 접근 가능한 프로세스를 만들 필요가 있다.

또한 조직에서 다양한 그룹과의 명확한 커뮤니케이션 역량은 부가적인 정보, 데이터 또는 데이터 접속, 그리고 이 데이터가 어떻게 개발됐는지에 대한 상세 정보 등을 쉽게 가질 수 있으며 이는 업무가 좀더 자연스럽게 돌아가게 만든다.

6. 비즈니스 문제 이해도가 없다
반복해서 말하지만 실제 수학적, 통계학적 관점에서 자사의 모든 비즈니스를 바라보고 이를 해결할 수 있는 사람을 고용할 수 없다.

왜냐고? 만약 A라는 사람이 이 모든 것에 대해 방법을 알고 있다면 이미 하나의 알고리즘 내에서 충분히 설명해놨을 것이다. 그렇다면 B라는 사람을 찾을 필요가 있는가?

7. 업무 도구에 친숙하지 못하다
SAS가 있다. R이 있고 스칼라(Scala)가 있으며 파이썬이 있다. 그리고 매트랩(Matlab)과 다른 수많은 도구들이 있다. 만약 이력서에서 이것들을 보지 못했다면 아마 그 사람은 데이터 과학자가 아닐 것이다.

8. SAS 증후군
미안한 얘기지만, 대다수 SAS 개발자들이 자신들을 "데이터 과학자(data scientists)"라고 이름을 바꿔단 것처럼 보인다. 물론 그들이 데이터 과학에 대해 아무것도 모른다는 것이 아니다. 예를 들어 그들에게는 데이터를 읽는 노하우가 있다. SAS 코드를 쓰는 방법은 예외일 수 있다.

자사에 필요한 사람은 어떤 사람인가? 특정 문제를 준비하기 위한 특별한 스킬을 갖춘 이를 찾거나 기존 기술팀을 증원할 필요가 있다. 그런데 프로그래밍 역량, 분석 경험, 비즈니스 감각을 가진 수학자가 CEO와 대화하고 기술 전문가와 같은 능력의 소유자이길 원해서는 안된다.

현재 유니콘은 존재하지 않는다. 그렇다고 이상한 사람을 고용해서는 더더욱 안된다.

경쟁업체에서 이 문제를 어떻게 해결하고 있는 지 알기를 바란다면 한번쯤 자신의 링크드인 프로파일에 데이터 과학자를 추가해 보자. 100만 명의 인재채용 전문가들이 자신에게 엄청난 수의 일자리를 소개해 줄 것이다. editor@itworld.co.kr


2016.03.04

나쁜 데이터 과학자의 숨길 수 없는 8가지 신호

Andrew C. Oliver | InfoWorld
유니콘을 본 적이 있는가? 이는 완벽한 데이터 과학자를 보는 것과 같다. 완벽한 데이터 과학자를 찾을 수 없지만 훌륭한 채용 방법을 찾는다면 엉뚱한 사람을 고용하는 최악의 상황은 면할 수 있을 것이다. 무엇보다 데이터 과학(data science)은 팀 경기라는 걸 잊어서는 안된다.

금광 캐기는 이제 막 시작됐지만 어디에 금맥이 흐르는지, 황금 덩어리를 어떻게 분별하는지, 그리고 어떻게 캐는지에 대해 아무도 질문하지 않는다.

해답을 가지고 있는 사람이 바로 데이터 과학자인데, 좋은 데이터 과학자의 조건에 대해서는 아주 많은 기사들이 있다. 이는 기존 기사를 찾아보면 충분하다. 그러나 여기서는 조직에 도움을 주기보다는 잠재적으로 해를 끼치는 나쁜 데이터 과학자를 어떻게 구별하는가에 초점을 맞췄다.

1. 수학적 배경이 약하다
아주 예외적인 상황을 제외하고 데이터 과학자들의 핵심은 수학에 능통하다는 것이다. 데이터 과학자의 범위는 아주 다양한데, 무시무시한 파이썬(Python)이나 R을 쓰는 토털 수학자에서부터 머리 속에 머신러닝 알고리듬을 장착한 사람에 이르기까지 모두를 포함한다.

기업 업무에 따라 양자 모두가 필요할 지 모른다. 그러나 수학적 배경이 약한 데이터 과학자는 아마도 실제 데이터 과학자가 아니라 데이터 아키텍트나 데이터 엔지니어일 것이다. 이들은 인재 파견회사에서 나온 일개 컨설턴트에 가까울 것이다.

이런 사람은 기업의 비즈니스를 도와줄 수 없다. 약한 수학적 배경은 많은 방법들을 상하게 할 수 있으며 특히 데이터의 유용성을 판단하는 부문에서는 더욱 그렇다.

2. 약한 컴퓨팅 배경
수학자이지만 실제 컴퓨터를 이해하지 못하는 데이터 과학자들은 유용하지 않다. 이는 타자기를 사용하는 비서가 현대 세계에서 유용하지 않다는 것과 동일하다. 수많은 상황에서 무언가를 종이로 계산하는 방법과 스파크(Spark)와 같은 분산형 플랫폼을 사용하는 것과는 같지 않다. 데이터 과학자를 뽑는다면 이를 이해할 필요가 있다.

3. 유니콘은 존재하지 않는다
수학자이자 통계학자, 그리고 동시에 분산형 컴퓨팅 개발자인 데이터 과학자를 기대하지 마라. MBA 출신에다가 수학자로서의 실제 경험, 분산형 컴퓨팅 개발자, 비즈니스 현업의 경력을 갖고 있는 이라면 아마도 나이는 80이 넘었을 것이다. 그래서 팀이 필요한 것이다.

혹시 이런 실력을 갖춘 데이터 과학자를 만나더라도 간단한 규칙을 기억하라. "유니콘은 존재하지 않는다."

4. 무력한 학구파
코드를 직접 만들지 않는 코더나 실제 기술적 경험이 없는 아키텍트와 같이 데이터 과학자들은 실제 제한된 데이터 경험을 갖고 있다. 게다가 그들은 코드 내에서 파묻혀 자신의 손이 더러워지는 걸 원하지 않는다.

우리가 원하는 것은 실제 응용 부문이지 이론을 얘기하는 것이 아니다. 데이터 과학자를 대학에서 찾지 마라.

5. 빈약한 커뮤니케이션 스킬
기본적으로 데이터 과학자는 데이터에서 투명성을 가져온다. 기술적 전문가나 비즈니스 전문가로서 자신은 이를 모두 이해하지 못할 수도, 스스로 이행할 수 없고, 의사 결정 프로세스에서 신뢰를 얻지 못할 수도 있다. 하지만 최소한 개념상으로는 높은 수준의 이해도를 갖고 있어야 한다.

클러스터링 알고리듬, 확률 계산, 또는 NLP(natural language processing)든 그 무엇이더라도 전달하는 것은 힘들지 않다. 만약 자사의 데이터 과학자가 이런 일을 하지 않고 있다면 그 데이터 과학자는 일을 제대로 하지 않고 있는 것이다. 데이터 과학자는 접근 가능하거나 접근 가능한 프로세스를 만들 필요가 있다.

또한 조직에서 다양한 그룹과의 명확한 커뮤니케이션 역량은 부가적인 정보, 데이터 또는 데이터 접속, 그리고 이 데이터가 어떻게 개발됐는지에 대한 상세 정보 등을 쉽게 가질 수 있으며 이는 업무가 좀더 자연스럽게 돌아가게 만든다.

6. 비즈니스 문제 이해도가 없다
반복해서 말하지만 실제 수학적, 통계학적 관점에서 자사의 모든 비즈니스를 바라보고 이를 해결할 수 있는 사람을 고용할 수 없다.

왜냐고? 만약 A라는 사람이 이 모든 것에 대해 방법을 알고 있다면 이미 하나의 알고리즘 내에서 충분히 설명해놨을 것이다. 그렇다면 B라는 사람을 찾을 필요가 있는가?

7. 업무 도구에 친숙하지 못하다
SAS가 있다. R이 있고 스칼라(Scala)가 있으며 파이썬이 있다. 그리고 매트랩(Matlab)과 다른 수많은 도구들이 있다. 만약 이력서에서 이것들을 보지 못했다면 아마 그 사람은 데이터 과학자가 아닐 것이다.

8. SAS 증후군
미안한 얘기지만, 대다수 SAS 개발자들이 자신들을 "데이터 과학자(data scientists)"라고 이름을 바꿔단 것처럼 보인다. 물론 그들이 데이터 과학에 대해 아무것도 모른다는 것이 아니다. 예를 들어 그들에게는 데이터를 읽는 노하우가 있다. SAS 코드를 쓰는 방법은 예외일 수 있다.

자사에 필요한 사람은 어떤 사람인가? 특정 문제를 준비하기 위한 특별한 스킬을 갖춘 이를 찾거나 기존 기술팀을 증원할 필요가 있다. 그런데 프로그래밍 역량, 분석 경험, 비즈니스 감각을 가진 수학자가 CEO와 대화하고 기술 전문가와 같은 능력의 소유자이길 원해서는 안된다.

현재 유니콘은 존재하지 않는다. 그렇다고 이상한 사람을 고용해서는 더더욱 안된다.

경쟁업체에서 이 문제를 어떻게 해결하고 있는 지 알기를 바란다면 한번쯤 자신의 링크드인 프로파일에 데이터 과학자를 추가해 보자. 100만 명의 인재채용 전문가들이 자신에게 엄청난 수의 일자리를 소개해 줄 것이다. editor@itworld.co.kr


X