2014.06.24

글로벌 칼럼 | 융합 기술로 부상하는 ‘기계학습’…명확한 정의가 필요

James Kobielus | InfoWorld
‘기계학습(machine learning)’이 다방면에 걸쳐 적용되고 그 가능성에 대한 관심이 고조됨에 따라 기술에 대한 정의가 확대되고 있다. 이제 기계학습은 단순히 ‘컴퓨터가 학습할 수 있는 알고리즘’에서 벗어나 ‘새로운 지식를 학습하며 데이터에서 패턴을 발견, 활용하는 기술’이 됐다.

기계학습 기술을 활용, 개발하는 데이터 과학자들은 각종 통계 및 분석 기술을 사용해 대량의 비정형 데이터로부터 유용한 정보를 정제하는 이들이다. 일반적으로, 데이터 과학자들이 사용하는 이러한 다양한 기술들을 통틀어 ‘고급 분석(advanced analytics)’라고 일컫는다. 그러나 ‘고급 분석’이라는 말은 통계 분석, 데이터 마이닝, 예측 모델링, 자연어 처리 기술 등 다양한 기술을 한꺼번에 지칭하는 것이기에 ‘빅데이터’만큼이나 애매한 용어라고 할 수 있다.

기계학습 또한 ‘고급 분석’의 경우와 마찬가지다. 즉, 오늘날 데이터 과학자들은 자동 학습과 패턴 인식 기술을 뭉뚱그려 간단히 ‘기계학습’이라고 일반화시키곤 한다. 이 때문에 기계학습의 정의 자체가 모호해지고 있는 것이 현재 상황이다.



그러나 기계학습은 비정형 데이터를 대상으로 하는 것이지만 데이터 마이닝은 어디까지나 정제된 데이터세트를 분석하는 기술이다. 또한, ‘과거’의 데이터를 ‘해석’하는데 그치는 기계학습이나 데이터 마이닝과는 달리 예측 분석(predictive analysis) 기술은 이러한 데이터의 패턴을 분석해 미래에도 적용할 수 있는 ‘법칙’을 찾는 것이 목표다. 뿐만 아니라, 기계학습과 데이터 마이닝, 예측 분석은 각각의 적용 영역이 정해진 별개의 기술인데 반해 ‘고급 분석’은 이러한 기술을 ‘통합하는 기술 범주’에 가까운 용어라고 할 수 있다.

이와 같은 이유로 기계학습과 데이터 마이닝, 예측 분석, 고급 분석 등의 용어가 서로 일맥상통하는 것으로 일반화시키는 일은 피해야 한다. 이들 기술 사이에는 엄연한, 그리고 무시할 수 없는 차이가 있기 때문에 자칫하면 ‘수박 겉핥기’ 식으로 이해할 우려가 있다.

물론, 많은 이들이 기계학습을 모호한 ‘덩어리’로 이해하는 것도 무리는 아니다. 기계학습만큼 다양한 학문이 합쳐진 기술은 드물기 때문이다. 컴퓨터가 처음 만들어졌을 때 기계학습은 인공지능 개발에 사용되는 컴퓨터 과학의 하위 기술로 치부되곤 했다. 그러나 오늘날 기계학습이 데이터 과학과 컴퓨터 과학, 두 분야에 걸쳐있는 융합 기술로 진화했다.

미국 샌디에고 대학 교수 조셉 바는 기계학습을 “각종 확률, 조합 이론과 수학적 최적화 기법뿐만 아니라 통계, 컴퓨터 알고리즘 아키텍처를 활용해 이상적인 학습 모델을 구축하는 기술일 뿐만 아니라 ‘경험적(heuristics) 지식’ 습득과 그 응용 방법까지 포함하는, 더 포괄적인 융합 기술”이라고 설명하고 있다.

이처럼 기계학습은 수많은 학문의 경계가 허물어져 합쳐진 기술이다. 그리고 이 기술 일람은 줄어들기는커녕 더욱 늘어나는 추세다. 그러나 기계학습의 정의를 명확하게 내리는 것이 어려워진다는 뜻은 그만큼 기계학습의 활용 범위가 더욱 늘어나고 있다는 것이며 이는 기계학습이 실생활에 미치는 영향 또한 더 커진다는 의미다. 그리고 기계학습의 존재감이 무시할 수 없어질 정도로 거대해졌을 때, 데이터 과학자들은 머지 않아 이에 대한 직관적인 정의를 대중에게 소개할 것이다. editor@itworld.co.kr 


2014.06.24

글로벌 칼럼 | 융합 기술로 부상하는 ‘기계학습’…명확한 정의가 필요

James Kobielus | InfoWorld
‘기계학습(machine learning)’이 다방면에 걸쳐 적용되고 그 가능성에 대한 관심이 고조됨에 따라 기술에 대한 정의가 확대되고 있다. 이제 기계학습은 단순히 ‘컴퓨터가 학습할 수 있는 알고리즘’에서 벗어나 ‘새로운 지식를 학습하며 데이터에서 패턴을 발견, 활용하는 기술’이 됐다.

기계학습 기술을 활용, 개발하는 데이터 과학자들은 각종 통계 및 분석 기술을 사용해 대량의 비정형 데이터로부터 유용한 정보를 정제하는 이들이다. 일반적으로, 데이터 과학자들이 사용하는 이러한 다양한 기술들을 통틀어 ‘고급 분석(advanced analytics)’라고 일컫는다. 그러나 ‘고급 분석’이라는 말은 통계 분석, 데이터 마이닝, 예측 모델링, 자연어 처리 기술 등 다양한 기술을 한꺼번에 지칭하는 것이기에 ‘빅데이터’만큼이나 애매한 용어라고 할 수 있다.

기계학습 또한 ‘고급 분석’의 경우와 마찬가지다. 즉, 오늘날 데이터 과학자들은 자동 학습과 패턴 인식 기술을 뭉뚱그려 간단히 ‘기계학습’이라고 일반화시키곤 한다. 이 때문에 기계학습의 정의 자체가 모호해지고 있는 것이 현재 상황이다.



그러나 기계학습은 비정형 데이터를 대상으로 하는 것이지만 데이터 마이닝은 어디까지나 정제된 데이터세트를 분석하는 기술이다. 또한, ‘과거’의 데이터를 ‘해석’하는데 그치는 기계학습이나 데이터 마이닝과는 달리 예측 분석(predictive analysis) 기술은 이러한 데이터의 패턴을 분석해 미래에도 적용할 수 있는 ‘법칙’을 찾는 것이 목표다. 뿐만 아니라, 기계학습과 데이터 마이닝, 예측 분석은 각각의 적용 영역이 정해진 별개의 기술인데 반해 ‘고급 분석’은 이러한 기술을 ‘통합하는 기술 범주’에 가까운 용어라고 할 수 있다.

이와 같은 이유로 기계학습과 데이터 마이닝, 예측 분석, 고급 분석 등의 용어가 서로 일맥상통하는 것으로 일반화시키는 일은 피해야 한다. 이들 기술 사이에는 엄연한, 그리고 무시할 수 없는 차이가 있기 때문에 자칫하면 ‘수박 겉핥기’ 식으로 이해할 우려가 있다.

물론, 많은 이들이 기계학습을 모호한 ‘덩어리’로 이해하는 것도 무리는 아니다. 기계학습만큼 다양한 학문이 합쳐진 기술은 드물기 때문이다. 컴퓨터가 처음 만들어졌을 때 기계학습은 인공지능 개발에 사용되는 컴퓨터 과학의 하위 기술로 치부되곤 했다. 그러나 오늘날 기계학습이 데이터 과학과 컴퓨터 과학, 두 분야에 걸쳐있는 융합 기술로 진화했다.

미국 샌디에고 대학 교수 조셉 바는 기계학습을 “각종 확률, 조합 이론과 수학적 최적화 기법뿐만 아니라 통계, 컴퓨터 알고리즘 아키텍처를 활용해 이상적인 학습 모델을 구축하는 기술일 뿐만 아니라 ‘경험적(heuristics) 지식’ 습득과 그 응용 방법까지 포함하는, 더 포괄적인 융합 기술”이라고 설명하고 있다.

이처럼 기계학습은 수많은 학문의 경계가 허물어져 합쳐진 기술이다. 그리고 이 기술 일람은 줄어들기는커녕 더욱 늘어나는 추세다. 그러나 기계학습의 정의를 명확하게 내리는 것이 어려워진다는 뜻은 그만큼 기계학습의 활용 범위가 더욱 늘어나고 있다는 것이며 이는 기계학습이 실생활에 미치는 영향 또한 더 커진다는 의미다. 그리고 기계학습의 존재감이 무시할 수 없어질 정도로 거대해졌을 때, 데이터 과학자들은 머지 않아 이에 대한 직관적인 정의를 대중에게 소개할 것이다. editor@itworld.co.kr 


X