2019.11.25

IDG 블로그 | SaaS 기반 AI 학습 서비스의 엄청난 가능성

David Linthicum | InfoWorld
머신러닝 기반 시스템을 다루고 있다면, 학습 데이터에 대해 잘 알 것이다. 학습 데이터는 학습을 위해 AI 모델에 적용하기 전에 올바르게 형식화해야 하고, 또 정확해야 한다.
 
ⓒ GettyImagesBank

퍼블릭 클라우드의 인기 머신러닝 시스템을 사용해 사기 거래 탐지 엔진을 만든다고 생각해 보자. 우선 데이터 세트를 만들어 모델을 학습한다. 이 경우, 수백만 건의 거래 기록에 사기 거래라는 라벨을 붙여야 한다. 이 데이터는 머신러닝 모델이 어떤 것이 사기일 가능성이 있고 어떤 것은 아닌지 배우도록 한다. 물론, 다른 종류의 학습 데이터도 있는데, 일부는 라벨이 붙어있고 일부는 아니다.

일단 학습을 하면, 머신러닝 모델은 경험 학습을 통해 사기인지 아닌지를 배우는 훈련을 계속 받을지도 모른다. 시간이 있다면 이 모델은 사람이나 다른 시스템이 사기라고 표시한 거래를 모니터링함으로써 스스로 계속 학습할 수 있다.

AI 학습에 대한 이 접근법에서 중요한 것은 건강한 학습 데이터 세트가 필요하다는 것이다. 경우에 따라서는 학습 데이터 중개상으로부터 얻는 경우도 있지만, 대부분 기업은 자체 데이터를 형식화해 머신러닝 모델을 학습할 데이터를 마련한다. 그런데, 만약 다른 기업이 학습시킨 모델로 언제 어디서나 머신러닝 모델을 학습할 수 있다면 어떨까?

필자가 생각해 낸 아이디어가 아니다. AI의 대장정이 시작된 이래, 한 AI 엔진이 다른 AI를 학습시키는 상상을 해왔다. 학습 데이터를 공유할 수도 있고, 더 나아가 지식과 경험을 직접적이고 자동적인 인터랙션을 통해 공유할 수도 있다. 머신러닝 모델을 지도할 수 있는 멘토 역할의 AI 엔진이 있다면, 외부 경험을 제공해 AI 모델을 한층 더 가치 있고 효과적으로 만들 것이다.

물론 말처럼 쉽지는 않다. 머신러닝 엔진은 보통 서로 이야기를 나누지 않으며, 같은 소프트웨어라도 마찬가지다. AI 엔진은 처음부터 독립적으로 학습하고 AI가 아닌 시스템이나 사람과 인터랙션하도록 만들어진다. 하지만 이제는 이런 AI 엔진 간의 학습이 대부분 솔루션 업체의 레이더망에 나타나고 있다.

필자가 최근 발견한 몇 가지 핵심 트렌드는 게임의 판도를 바꿀 만하다.

우선, 온디맨드 방식 또는 SaaS 기반 AI 엔진의 사용이다. 이들 엔진은 퍼블릭 클라우드 내에서 또는 온프레미스 환경 내에서 다른 AI 엔진과 인터랙션을 할 수 있다. 특정 기술에 관해 다른 AI 엔진을 가르치는 데 전문화된 SaaS 클라우드라고 생각할 수 있다. 사기 거래 탐지부터 의료 진단, 기계 유지보수 등등 모든 것에 적용할 수 있다.

둘째, AI 엔진은 사용자의 교육 모델과 결합해 일종의 AI 슈퍼브레인을 만들 수 있다. 도메인 외부의 전 세계적 경험을 제공하는 데 그치지 않고, 자체 학습 데이터를 결합해 내부와 외부의 경험을 통합적으로 제공할 수 있다.

필자가 이 문제를 제기하는 것은 AI로부터 더 많은 가치를 얻고자 하는 기업 대부분이 이런 흐름을 인지할 필요가 있기 때문이다. 게다가 많은 기업이 머신러닝이 제대로 동작하도록 하는 데 필요한 충분한 학습 데이터를 확보하지 못한 채 벽에 갇혀 있다. SaaS 기반 AI 학습은 이 두 가지 문제를 모두 해결할 수 있는 해법이 될 것이다.  editor@itworld.co.kr


2019.11.25

IDG 블로그 | SaaS 기반 AI 학습 서비스의 엄청난 가능성

David Linthicum | InfoWorld
머신러닝 기반 시스템을 다루고 있다면, 학습 데이터에 대해 잘 알 것이다. 학습 데이터는 학습을 위해 AI 모델에 적용하기 전에 올바르게 형식화해야 하고, 또 정확해야 한다.
 
ⓒ GettyImagesBank

퍼블릭 클라우드의 인기 머신러닝 시스템을 사용해 사기 거래 탐지 엔진을 만든다고 생각해 보자. 우선 데이터 세트를 만들어 모델을 학습한다. 이 경우, 수백만 건의 거래 기록에 사기 거래라는 라벨을 붙여야 한다. 이 데이터는 머신러닝 모델이 어떤 것이 사기일 가능성이 있고 어떤 것은 아닌지 배우도록 한다. 물론, 다른 종류의 학습 데이터도 있는데, 일부는 라벨이 붙어있고 일부는 아니다.

일단 학습을 하면, 머신러닝 모델은 경험 학습을 통해 사기인지 아닌지를 배우는 훈련을 계속 받을지도 모른다. 시간이 있다면 이 모델은 사람이나 다른 시스템이 사기라고 표시한 거래를 모니터링함으로써 스스로 계속 학습할 수 있다.

AI 학습에 대한 이 접근법에서 중요한 것은 건강한 학습 데이터 세트가 필요하다는 것이다. 경우에 따라서는 학습 데이터 중개상으로부터 얻는 경우도 있지만, 대부분 기업은 자체 데이터를 형식화해 머신러닝 모델을 학습할 데이터를 마련한다. 그런데, 만약 다른 기업이 학습시킨 모델로 언제 어디서나 머신러닝 모델을 학습할 수 있다면 어떨까?

필자가 생각해 낸 아이디어가 아니다. AI의 대장정이 시작된 이래, 한 AI 엔진이 다른 AI를 학습시키는 상상을 해왔다. 학습 데이터를 공유할 수도 있고, 더 나아가 지식과 경험을 직접적이고 자동적인 인터랙션을 통해 공유할 수도 있다. 머신러닝 모델을 지도할 수 있는 멘토 역할의 AI 엔진이 있다면, 외부 경험을 제공해 AI 모델을 한층 더 가치 있고 효과적으로 만들 것이다.

물론 말처럼 쉽지는 않다. 머신러닝 엔진은 보통 서로 이야기를 나누지 않으며, 같은 소프트웨어라도 마찬가지다. AI 엔진은 처음부터 독립적으로 학습하고 AI가 아닌 시스템이나 사람과 인터랙션하도록 만들어진다. 하지만 이제는 이런 AI 엔진 간의 학습이 대부분 솔루션 업체의 레이더망에 나타나고 있다.

필자가 최근 발견한 몇 가지 핵심 트렌드는 게임의 판도를 바꿀 만하다.

우선, 온디맨드 방식 또는 SaaS 기반 AI 엔진의 사용이다. 이들 엔진은 퍼블릭 클라우드 내에서 또는 온프레미스 환경 내에서 다른 AI 엔진과 인터랙션을 할 수 있다. 특정 기술에 관해 다른 AI 엔진을 가르치는 데 전문화된 SaaS 클라우드라고 생각할 수 있다. 사기 거래 탐지부터 의료 진단, 기계 유지보수 등등 모든 것에 적용할 수 있다.

둘째, AI 엔진은 사용자의 교육 모델과 결합해 일종의 AI 슈퍼브레인을 만들 수 있다. 도메인 외부의 전 세계적 경험을 제공하는 데 그치지 않고, 자체 학습 데이터를 결합해 내부와 외부의 경험을 통합적으로 제공할 수 있다.

필자가 이 문제를 제기하는 것은 AI로부터 더 많은 가치를 얻고자 하는 기업 대부분이 이런 흐름을 인지할 필요가 있기 때문이다. 게다가 많은 기업이 머신러닝이 제대로 동작하도록 하는 데 필요한 충분한 학습 데이터를 확보하지 못한 채 벽에 갇혀 있다. SaaS 기반 AI 학습은 이 두 가지 문제를 모두 해결할 수 있는 해법이 될 것이다.  editor@itworld.co.kr


X