2018.07.02

IDG 블로그 | 흔히 저지르는 머신러닝 실수 3가지

David Linthicum | InfoWorld
필자는 대체로 클라우드 기반 머신러닝과 딥러닝, 그리고 AI를 적극 지지한다. 결국 사용자의 호출에 응답하고 이를 수행하는 인공지능과의 대화를 상상하지 못하면, 진정한 IT광이 될 수 없다.



그런데 필자는 클라우드 기반 머신러닝과 딥러닝을 잘못 적용하는 사례를 끊임없이 보고 있다. 분명 클라우드 기반 머신러닝은 언제든지 사용할 수 있는 기술이 되었다. 하지만 지혜롭게, 그리고 적절하게 사용해야 한다.

흔히 저지르는 머신러닝 관련 기술 세 가지를 소개한다.

지식 모델을 교육할 충분한 데이터를 제공하지 않는다
머신러닝은 학습없이는 아무런 가치가 없다. 머신러닝의 진정한 사용례는 막대한 양의 데이터에 알고리즘을 적용해 특정 패턴이 드러나면, 이런 패턴이 머신러닝 기반 애플리케이션을 훈련시키는 것이다. 따라서 데이터가 없으면 학습도 없다. 머신러닝 애플리케이션이 데이터를 수집해 점점 똑똑해질 수도 있지만, 처음에 어떻게 생각해야 하는지 시스템을 가르치기 위한 충분한 데이터가 있는 출발점이 필요하다.

예를 들어, 병원에서 사용하는 머신러닝 시스템이 있어서 환자가 병원에 머물러 있는 동안 사망할 확률을 이야기해준다고 생각해 보자. 최소한 10만 건 이상의 데이터가 없다면, 시스템이 말하는 확률은 0% 아니면 100%가 되어 아무런 도움이 되지 않을 것이다.

필요 없는 곳에 머신러닝을 사용한다
필자가 더 자주 보는 실패 사례로, 기업은 아무런 이유없이 애플리케이션 개발 비용을 서너 배 더 사용한다. 머신러닝 시스템을 사용해도 아무런 실익이 없는 사용례는 많다. 대부분 절차적 로직만으로도 충분히 잘 돌아가기 때문에, 예를 들어 회계 시스템이나 일정관리 시스템용으로 지식 기반을 구축하는 것은 과잉일 뿐이다. 게다가 이 때문에 애플리케이션은 훨씬 더 비효율적으로 돌아간다.

성능에 미치는 영향을 생각하지 않는다
애플리케이션에 머신러닝 시스템을 내장하는 것은 때로 애플리케이션을 훨씬 더 가치 있는 것으로 만들어 준다. 하지만 이 때문에 애플리케이션의 성능이 망가질 수도 있다.

생각해 보라. 내장 머신러닝 서비스가 데이터 사이의 알고리즘을 실행하느라 수 초의 지연이 생길 수 있다. 만약 해당 애플리케이션이 실시간에 가까운 응답속도를 제공해야 한다면, 지연된 응답 시간 때문에 사라진 생산성을 고려하면 머신러닝으로부터 얻을 수 있는 가치는 금방 사라지고 만다.  editor@itworld.co.kr


2018.07.02

IDG 블로그 | 흔히 저지르는 머신러닝 실수 3가지

David Linthicum | InfoWorld
필자는 대체로 클라우드 기반 머신러닝과 딥러닝, 그리고 AI를 적극 지지한다. 결국 사용자의 호출에 응답하고 이를 수행하는 인공지능과의 대화를 상상하지 못하면, 진정한 IT광이 될 수 없다.



그런데 필자는 클라우드 기반 머신러닝과 딥러닝을 잘못 적용하는 사례를 끊임없이 보고 있다. 분명 클라우드 기반 머신러닝은 언제든지 사용할 수 있는 기술이 되었다. 하지만 지혜롭게, 그리고 적절하게 사용해야 한다.

흔히 저지르는 머신러닝 관련 기술 세 가지를 소개한다.

지식 모델을 교육할 충분한 데이터를 제공하지 않는다
머신러닝은 학습없이는 아무런 가치가 없다. 머신러닝의 진정한 사용례는 막대한 양의 데이터에 알고리즘을 적용해 특정 패턴이 드러나면, 이런 패턴이 머신러닝 기반 애플리케이션을 훈련시키는 것이다. 따라서 데이터가 없으면 학습도 없다. 머신러닝 애플리케이션이 데이터를 수집해 점점 똑똑해질 수도 있지만, 처음에 어떻게 생각해야 하는지 시스템을 가르치기 위한 충분한 데이터가 있는 출발점이 필요하다.

예를 들어, 병원에서 사용하는 머신러닝 시스템이 있어서 환자가 병원에 머물러 있는 동안 사망할 확률을 이야기해준다고 생각해 보자. 최소한 10만 건 이상의 데이터가 없다면, 시스템이 말하는 확률은 0% 아니면 100%가 되어 아무런 도움이 되지 않을 것이다.

필요 없는 곳에 머신러닝을 사용한다
필자가 더 자주 보는 실패 사례로, 기업은 아무런 이유없이 애플리케이션 개발 비용을 서너 배 더 사용한다. 머신러닝 시스템을 사용해도 아무런 실익이 없는 사용례는 많다. 대부분 절차적 로직만으로도 충분히 잘 돌아가기 때문에, 예를 들어 회계 시스템이나 일정관리 시스템용으로 지식 기반을 구축하는 것은 과잉일 뿐이다. 게다가 이 때문에 애플리케이션은 훨씬 더 비효율적으로 돌아간다.

성능에 미치는 영향을 생각하지 않는다
애플리케이션에 머신러닝 시스템을 내장하는 것은 때로 애플리케이션을 훨씬 더 가치 있는 것으로 만들어 준다. 하지만 이 때문에 애플리케이션의 성능이 망가질 수도 있다.

생각해 보라. 내장 머신러닝 서비스가 데이터 사이의 알고리즘을 실행하느라 수 초의 지연이 생길 수 있다. 만약 해당 애플리케이션이 실시간에 가까운 응답속도를 제공해야 한다면, 지연된 응답 시간 때문에 사라진 생산성을 고려하면 머신러닝으로부터 얻을 수 있는 가치는 금방 사라지고 만다.  editor@itworld.co.kr


X