2019.09.17

글로벌 칼럼 | 현재의 인공 지능, 무엇이 과장이고, 무엇이 현실인가

Michael Berthold | InfoWorld
잡지를 보거나 기술 블로그의 글을 읽거나 산업 컨퍼런스에서 업계 사람들과 대화를 나누다 보면, 요즘 IT 세계에서 나오는 거의 모든 것에 인공 지능(Artificial Intelligence, AI) 또는 머신러닝(Machine Learning) 요소가 있는 듯한 느낌을 받게 된다. 이제 인공 지능에 대한 이야기는 거의 프로파간다 수준이다. 모든 문제를 해결할 수 있는 하나의 진정한 기술, AI는 인류를 구원할 기술이다. 
 
ⓒ Getty Images Bank 

AI 기반 기술로 놀라운 일을 할 수 있음은 사실이지만 여기서 “지능”이라는 용어는 단어 본래의 의미를 담고있진 않다. 지능은 인간과 창의적인 대화가 가능한 시스템, 즉 생각이 있고 새로운 생각을 개발할 수 있는 시스템을 암시한다. 이 용어가 문제다. 오늘날의 AI는 당연히 인간의 지능이 가진 전체적인 잠재력이 아니라, 사물 또는 음성 인식과 같은 인간 역량의 일부 측면을 구현한 것을 가리키는 데 사용된다.

따라서 AI는 현재 우리가 사용하는 “새로운” 머신러닝 기술을 나타내는 용어로 그다지 적합하지 않다. 그러나 열차는 이미 떠났고 용어는 굳어졌다. 어쨌든 머신러닝은 아직 머신 지능(machine intelligence)과 동의어는 아니지만 더 강력하고 더 유능하고 사용하기 쉬워진 것은 확실하다. AI(전통적인 머신러닝 외에 신경망 또는 딥 러닝도 의미)는 마침내 분석 툴킷의 표준 구성 요소로 자리를 잡는 중이다.

AI 혁명, 또는 AI 진화의 길로 접어든 지금, AI의 개념이 어떻게 시작됐고 앞으로 왜 중요하며 무엇을 의미하는지 생각해 보는 것이 중요하다. 본래의 의미는 다소 왜곡됐다 해도 인공 지능이 지금처럼 큰 관심을 끌게 된 이유를 구체적으로 살펴보자.


AI의 약속, 왜 지금인가?

지금의 하이퍼 사이클(hype cycle)에서 인공 지능 또는 머신러닝은 최근에서야 개념 단계에서 애플리케이션 통합 단계로 발전한, 급격히 부상한 비교적 새로운 기술로 묘사되는 경우가 많다. 

흔히 사람들은 독립형 머신러닝 제품이 지난 몇 년 사이에 만들어졌다고 생각한다. 그러나 AI 영역에서 중요한 발전은 새로운 것이 아니다. 지금의 AI는 지난 수십년 동안 이어진 발전의 결과다. 바뀐 점은 예전에 비해 훨씬 더 많은 분야에서 AI가 사용되는 것인데, 이는 AI 기술 자체와는 별 관계가 없고 AI의 주변 기술, 즉 데이터 생성 및 처리 성능의 발전에 따른 현상이다.

이제 곧 몇 제타바이트의 데이터를 저장하게 된다는 지루한 이야기는 하지 않겠다(사실 제타바이트에 0이 몇 개인지도 모름). 데이터를 생성하고 수집하는 역량이 급격하게 높아진다는 것은 모두가 이미 아는 사실이다. 동시에, 가용한 컴퓨팅 성능 역시 상상하기 어려울 정도로 증가하는 중이다. 싱글 코어 프로세서에서 멀티 코어로의 전환과 범용 그래픽 처리 장치(GPGPU)의 개발 및 도입으로 딥 러닝을 위한 충분한 성능이 마련됐다. 심지어 컴퓨팅을 내부에서 처리할 필요도 없다. 클라우드에서 제공하는 처리 성능을 간편히 임대하면 된다.

데이터 과학자들은 이렇게 많은 데이터와 풍부한 컴퓨팅 리소스를 통해 지난 수십 년 사이 개발된 방법을 차원이 다른 규모로 사용할 수 있게 됐다. 1990년대에는 손으로 쓴 수만 개의 숫자 예제를 사용해 숫자를 인식하도록 신경망을 학습시키려면 며칠이 걸렸다. 지금은 수천만 개의 이미지를 사용해 훨씬 더 복잡한, 즉 심층 신경망(deep neural network)을 학습시켜 동물, 얼굴 및 기타 복잡한 사물을 인식하도록 할 수 있다. 또한 농작물의 성숙도 탐지 및 예측이나 수신 전화 라우팅과 같은 보편적인 비즈니스 애플리케이션에 딥 러닝 모델을 구축해 작업과 의사 결정을 자동화할 수도 있다.

얼핏 진짜 지능을 만드는 것처럼 들리지만 이러한 시스템 하에서 우리는 단순히 수학적 종속성 매개변수를 조정할 뿐임을 알아야 한다(물론 아주 복잡한 매개변수이긴 함). 인공 지능 방법은 “새로운” 지식을 습득하는 데는 서툴다. 그저 제시된 정보로부터 학습할 뿐이다. 다르게 말하면, 인공 지능은 “왜”를 묻지 않는다. 시스템의 작동 방식은 주변 세계를 이해하는 과정에서 끊임없이 부모에게 질문하는 어린이와는 다르다. 시스템은 공급된 지식만 안다. 인식하도록 사전에 학습되지 않은 어떤 것을 인식할 수는 없다.

다른 “전통적인” 머신러닝 시나리오에서 중요한 것은 데이터를 알고 시스템이 어떤 방식으로 패턴을 찾아야 하는지에 관한 개념을 갖는 것이다. 예를 들어 우리는 태어난 연도는 이 수치를 고객의 나이로 변환하기 전까지는 고객에 관한 유용한 팩트가 아니라는 것을 안다. 또한 계절적 변동의 효과에 대해서도 안다. 시스템이 계절과는 상관없이 패션 구매 패턴을 학습할 것으로 기대해서는 안 된다. 시스템이 이미 알고 있는 것을 기반으로 추가로 학습하도록 시스템에 다른 몇 가지를 주입하는 경우도 있다. 수십년 전부터 비즈니스에 사용되고 있는 딥 러닝과 달리 이 형태의 머신러닝은 일정한 속도로 발전해왔다.

AI 분야에서의 최근 발전은 주로 데이터 과학자들이 인간의 인지 능력을 모조할 수 있는 분야에서 이뤄졌다. 예를 들어 이미지에서 사물 인식하기나 음향 신호에서 단어 인식하기 등이 있다. 오디오 스트림 또는 이미지와 같은 복합적인 신호에서의 패턴 인식 학습은 매우 강력하다. 그래서 많은 사람들은 이렇게 강력한데 모든 곳에 딥 러닝 기법을 사용하지 않는 이유가 무엇인지 궁금해한다.


AI의 약속, 이번에는 무엇인가?

조직의 경영진은 언제 인공 지능을 사용해야 하는지를 묻는다. 사람이 잘 하는 것(사물 인식과 음성 인식이 가장 대표적인 예)의 모조와 관계된 문제를 해결하는 신경망 분야에서 AI 기반 연구는 상당한 발전을 이뤘다. 

누군가가 “좋은 객체 표현”에 대해 물을 때 적당한 답이 떠오르지 않는다면 딥 러닝 모델을 시도해볼 만하다. 그러나 데이터 과학자가 의미론적으로 풍부한 객체 표현을 구축할 수 있다면 전통적인 머신러닝 방법이 더 나을 수 있다(좋은 객체 표현을 찾기 위해 진지하게 생각할 만한 가치는 충분하다).

결국 특정 소프트웨어 업체의 방법이나 현재의 발전을 따라잡지 못하는 능력 부족에 속박될 필요 없이 동일한 플랫폼 내에서 여러 기법을 테스트해 보는 것이 좋다. 오픈소스 플랫폼이 이 시장의 리더인 이유가 여기에 있다. 오픈소스 플랫폼은 현재의 최신 기술과 실험적 최첨단 기술을 결합할 수 있게 해준다.

앞으로 각 팀이 목표와 그 목표를 달성하기 위해 사용하는 머신러닝 방법을 정렬하게 되면 딥 러닝은 모든 데이터 과학자의 도구함에 포함될 것이다. 많은 작업에서 딥 러닝 방법을 추가하면 큰 가치를 얻게 된다. 생각해 보라. 사전 학습된 인공 지능 시스템을 활용하는 사물 인식 기능을 시스템에 포함할 수 있게 된다. 다른 누군가가 충분한 데이터를 수집하고 주석을 달아주는 수고를 해준 덕분에 기존 음성 인식 구성요소를 통합할 수 있게 된다. 그러나 결국 우리는 딥 러닝 역시 그 이전의 전통적인 머신러닝과 마찬가지로 적합한 곳에 사용하는 또 하나의 도구일 뿐임을 인식하게 될 것이다.


AI의 약속, 다음은 무엇인가?

앞으로 드러날 장애물 가운데 하나는 20년 전과 마찬가지로, 인공 지능 시스템이 무엇을 학습했는지, 어떻게 예측에 도달했는 지를 이해하려는 과정에서 직면하는 큰 난관이다. 고객이 특정 제품을 좋아할지 그렇지 않을지를 예측하는 경우에는 그다지 중요한 문제가 아닐 수 있다. 그러나 사람과 상호작용하는 시스템이 예상치 못한 방식으로 행동하는 이유를 설명해야 할 때는 문제가 된다. 사람은 “인간의 실패”는 기꺼이 받아들인다. 인간이 완벽하리라고 기대하는 사람은 없기 때문이다. 그러나 인공 지능 시스템의 실패는, 특히 왜 실패했는지를 설명하고 수정하지 못한다면, 받아들이지 않을 것이다.

딥 러닝에 대해 더 익숙해지면 20년 전 머신러닝에 대해서도 그랬듯이, 시스템의 복잡성과 학습을 위한 데이터의 방대한 양에도 불구하고 분야별 지식 없이는 패턴 파악은 불가능하다는 것을 인지하게 될 것이다. 인간의 음성 인식이 잘 작동하는 것은 우리가 현재 대화의 맥락을 이해함으로써 빈 틈을 메울 수 있기 때문이다

현재의 인공 지능 시스템에는 이러한 심층적 이해가 없다. 지금은 얕은 지능, 상호 분리된 인간의 인지 능력을 모조하고 때로는 이런 분리된 작업에서 인간을 앞지르는 역량이다. 수십억 개의 예제로 시스템을 학습시키는 것은 데이터와 충분한 컴퓨팅 리소스만 있으면 되는데, 이 조건은 더 이상 불가능한 조건이 아니다.

인공 지능의 유용성은 궁극적으로 “세계를 구한다”는 프로파간다에는 미치지 못할 가능성이 높다. 아마 작업을 더 빠르고 능률적으로 수행하는 데 사용할 수 있는, 매우 뛰어난 툴을 갖게 되는 정도일 것이다. editor@itworld.co.kr 


2019.09.17

글로벌 칼럼 | 현재의 인공 지능, 무엇이 과장이고, 무엇이 현실인가

Michael Berthold | InfoWorld
잡지를 보거나 기술 블로그의 글을 읽거나 산업 컨퍼런스에서 업계 사람들과 대화를 나누다 보면, 요즘 IT 세계에서 나오는 거의 모든 것에 인공 지능(Artificial Intelligence, AI) 또는 머신러닝(Machine Learning) 요소가 있는 듯한 느낌을 받게 된다. 이제 인공 지능에 대한 이야기는 거의 프로파간다 수준이다. 모든 문제를 해결할 수 있는 하나의 진정한 기술, AI는 인류를 구원할 기술이다. 
 
ⓒ Getty Images Bank 

AI 기반 기술로 놀라운 일을 할 수 있음은 사실이지만 여기서 “지능”이라는 용어는 단어 본래의 의미를 담고있진 않다. 지능은 인간과 창의적인 대화가 가능한 시스템, 즉 생각이 있고 새로운 생각을 개발할 수 있는 시스템을 암시한다. 이 용어가 문제다. 오늘날의 AI는 당연히 인간의 지능이 가진 전체적인 잠재력이 아니라, 사물 또는 음성 인식과 같은 인간 역량의 일부 측면을 구현한 것을 가리키는 데 사용된다.

따라서 AI는 현재 우리가 사용하는 “새로운” 머신러닝 기술을 나타내는 용어로 그다지 적합하지 않다. 그러나 열차는 이미 떠났고 용어는 굳어졌다. 어쨌든 머신러닝은 아직 머신 지능(machine intelligence)과 동의어는 아니지만 더 강력하고 더 유능하고 사용하기 쉬워진 것은 확실하다. AI(전통적인 머신러닝 외에 신경망 또는 딥 러닝도 의미)는 마침내 분석 툴킷의 표준 구성 요소로 자리를 잡는 중이다.

AI 혁명, 또는 AI 진화의 길로 접어든 지금, AI의 개념이 어떻게 시작됐고 앞으로 왜 중요하며 무엇을 의미하는지 생각해 보는 것이 중요하다. 본래의 의미는 다소 왜곡됐다 해도 인공 지능이 지금처럼 큰 관심을 끌게 된 이유를 구체적으로 살펴보자.


AI의 약속, 왜 지금인가?

지금의 하이퍼 사이클(hype cycle)에서 인공 지능 또는 머신러닝은 최근에서야 개념 단계에서 애플리케이션 통합 단계로 발전한, 급격히 부상한 비교적 새로운 기술로 묘사되는 경우가 많다. 

흔히 사람들은 독립형 머신러닝 제품이 지난 몇 년 사이에 만들어졌다고 생각한다. 그러나 AI 영역에서 중요한 발전은 새로운 것이 아니다. 지금의 AI는 지난 수십년 동안 이어진 발전의 결과다. 바뀐 점은 예전에 비해 훨씬 더 많은 분야에서 AI가 사용되는 것인데, 이는 AI 기술 자체와는 별 관계가 없고 AI의 주변 기술, 즉 데이터 생성 및 처리 성능의 발전에 따른 현상이다.

이제 곧 몇 제타바이트의 데이터를 저장하게 된다는 지루한 이야기는 하지 않겠다(사실 제타바이트에 0이 몇 개인지도 모름). 데이터를 생성하고 수집하는 역량이 급격하게 높아진다는 것은 모두가 이미 아는 사실이다. 동시에, 가용한 컴퓨팅 성능 역시 상상하기 어려울 정도로 증가하는 중이다. 싱글 코어 프로세서에서 멀티 코어로의 전환과 범용 그래픽 처리 장치(GPGPU)의 개발 및 도입으로 딥 러닝을 위한 충분한 성능이 마련됐다. 심지어 컴퓨팅을 내부에서 처리할 필요도 없다. 클라우드에서 제공하는 처리 성능을 간편히 임대하면 된다.

데이터 과학자들은 이렇게 많은 데이터와 풍부한 컴퓨팅 리소스를 통해 지난 수십 년 사이 개발된 방법을 차원이 다른 규모로 사용할 수 있게 됐다. 1990년대에는 손으로 쓴 수만 개의 숫자 예제를 사용해 숫자를 인식하도록 신경망을 학습시키려면 며칠이 걸렸다. 지금은 수천만 개의 이미지를 사용해 훨씬 더 복잡한, 즉 심층 신경망(deep neural network)을 학습시켜 동물, 얼굴 및 기타 복잡한 사물을 인식하도록 할 수 있다. 또한 농작물의 성숙도 탐지 및 예측이나 수신 전화 라우팅과 같은 보편적인 비즈니스 애플리케이션에 딥 러닝 모델을 구축해 작업과 의사 결정을 자동화할 수도 있다.

얼핏 진짜 지능을 만드는 것처럼 들리지만 이러한 시스템 하에서 우리는 단순히 수학적 종속성 매개변수를 조정할 뿐임을 알아야 한다(물론 아주 복잡한 매개변수이긴 함). 인공 지능 방법은 “새로운” 지식을 습득하는 데는 서툴다. 그저 제시된 정보로부터 학습할 뿐이다. 다르게 말하면, 인공 지능은 “왜”를 묻지 않는다. 시스템의 작동 방식은 주변 세계를 이해하는 과정에서 끊임없이 부모에게 질문하는 어린이와는 다르다. 시스템은 공급된 지식만 안다. 인식하도록 사전에 학습되지 않은 어떤 것을 인식할 수는 없다.

다른 “전통적인” 머신러닝 시나리오에서 중요한 것은 데이터를 알고 시스템이 어떤 방식으로 패턴을 찾아야 하는지에 관한 개념을 갖는 것이다. 예를 들어 우리는 태어난 연도는 이 수치를 고객의 나이로 변환하기 전까지는 고객에 관한 유용한 팩트가 아니라는 것을 안다. 또한 계절적 변동의 효과에 대해서도 안다. 시스템이 계절과는 상관없이 패션 구매 패턴을 학습할 것으로 기대해서는 안 된다. 시스템이 이미 알고 있는 것을 기반으로 추가로 학습하도록 시스템에 다른 몇 가지를 주입하는 경우도 있다. 수십년 전부터 비즈니스에 사용되고 있는 딥 러닝과 달리 이 형태의 머신러닝은 일정한 속도로 발전해왔다.

AI 분야에서의 최근 발전은 주로 데이터 과학자들이 인간의 인지 능력을 모조할 수 있는 분야에서 이뤄졌다. 예를 들어 이미지에서 사물 인식하기나 음향 신호에서 단어 인식하기 등이 있다. 오디오 스트림 또는 이미지와 같은 복합적인 신호에서의 패턴 인식 학습은 매우 강력하다. 그래서 많은 사람들은 이렇게 강력한데 모든 곳에 딥 러닝 기법을 사용하지 않는 이유가 무엇인지 궁금해한다.


AI의 약속, 이번에는 무엇인가?

조직의 경영진은 언제 인공 지능을 사용해야 하는지를 묻는다. 사람이 잘 하는 것(사물 인식과 음성 인식이 가장 대표적인 예)의 모조와 관계된 문제를 해결하는 신경망 분야에서 AI 기반 연구는 상당한 발전을 이뤘다. 

누군가가 “좋은 객체 표현”에 대해 물을 때 적당한 답이 떠오르지 않는다면 딥 러닝 모델을 시도해볼 만하다. 그러나 데이터 과학자가 의미론적으로 풍부한 객체 표현을 구축할 수 있다면 전통적인 머신러닝 방법이 더 나을 수 있다(좋은 객체 표현을 찾기 위해 진지하게 생각할 만한 가치는 충분하다).

결국 특정 소프트웨어 업체의 방법이나 현재의 발전을 따라잡지 못하는 능력 부족에 속박될 필요 없이 동일한 플랫폼 내에서 여러 기법을 테스트해 보는 것이 좋다. 오픈소스 플랫폼이 이 시장의 리더인 이유가 여기에 있다. 오픈소스 플랫폼은 현재의 최신 기술과 실험적 최첨단 기술을 결합할 수 있게 해준다.

앞으로 각 팀이 목표와 그 목표를 달성하기 위해 사용하는 머신러닝 방법을 정렬하게 되면 딥 러닝은 모든 데이터 과학자의 도구함에 포함될 것이다. 많은 작업에서 딥 러닝 방법을 추가하면 큰 가치를 얻게 된다. 생각해 보라. 사전 학습된 인공 지능 시스템을 활용하는 사물 인식 기능을 시스템에 포함할 수 있게 된다. 다른 누군가가 충분한 데이터를 수집하고 주석을 달아주는 수고를 해준 덕분에 기존 음성 인식 구성요소를 통합할 수 있게 된다. 그러나 결국 우리는 딥 러닝 역시 그 이전의 전통적인 머신러닝과 마찬가지로 적합한 곳에 사용하는 또 하나의 도구일 뿐임을 인식하게 될 것이다.


AI의 약속, 다음은 무엇인가?

앞으로 드러날 장애물 가운데 하나는 20년 전과 마찬가지로, 인공 지능 시스템이 무엇을 학습했는지, 어떻게 예측에 도달했는 지를 이해하려는 과정에서 직면하는 큰 난관이다. 고객이 특정 제품을 좋아할지 그렇지 않을지를 예측하는 경우에는 그다지 중요한 문제가 아닐 수 있다. 그러나 사람과 상호작용하는 시스템이 예상치 못한 방식으로 행동하는 이유를 설명해야 할 때는 문제가 된다. 사람은 “인간의 실패”는 기꺼이 받아들인다. 인간이 완벽하리라고 기대하는 사람은 없기 때문이다. 그러나 인공 지능 시스템의 실패는, 특히 왜 실패했는지를 설명하고 수정하지 못한다면, 받아들이지 않을 것이다.

딥 러닝에 대해 더 익숙해지면 20년 전 머신러닝에 대해서도 그랬듯이, 시스템의 복잡성과 학습을 위한 데이터의 방대한 양에도 불구하고 분야별 지식 없이는 패턴 파악은 불가능하다는 것을 인지하게 될 것이다. 인간의 음성 인식이 잘 작동하는 것은 우리가 현재 대화의 맥락을 이해함으로써 빈 틈을 메울 수 있기 때문이다

현재의 인공 지능 시스템에는 이러한 심층적 이해가 없다. 지금은 얕은 지능, 상호 분리된 인간의 인지 능력을 모조하고 때로는 이런 분리된 작업에서 인간을 앞지르는 역량이다. 수십억 개의 예제로 시스템을 학습시키는 것은 데이터와 충분한 컴퓨팅 리소스만 있으면 되는데, 이 조건은 더 이상 불가능한 조건이 아니다.

인공 지능의 유용성은 궁극적으로 “세계를 구한다”는 프로파간다에는 미치지 못할 가능성이 높다. 아마 작업을 더 빠르고 능률적으로 수행하는 데 사용할 수 있는, 매우 뛰어난 툴을 갖게 되는 정도일 것이다. editor@itworld.co.kr 


X