2017.11.02

모든 데이터의 "미스터리"를 풀어줄 열쇠, GPU 컴퓨팅의 이해

Carlos Melendez | InfoWorld
수년 전, 벤처 투자자인 마크 앤더신은 '소프트웨어가 세상을 점령할 것'을 정확히 예측했다. 그러나 이제 데이터가 세상을 집어삼킬 예정이다.

IDC에 따르면, 2025년에는 매년 생산되는 데이터가 180ZB에 달할 전망이다(2013년 4.4ZB). 최근까지 이런 데이터는 구조화 데이터로 열과 행으로 구성되어 있고, 쉽게 입력, 저장, 정렬할 수 있는 데이터다. 그러나 현재는 많은 데이터가 여러 웹사이트, 기기, 데이터베이스에서 생성된 비디오, 이미지, 그래픽 등 비구조화 데이터다.

구조화 및 비구조화 데이터는 기업과 기관이 고객을 더 잘 이해하고, 행동 패턴을 적용해 미래의 행동을 예측하고, 질병을 치료할 돌파구를 발견하고, 사회를 더 안전하게 만드는 등 여러 일에 도움을 줄 '열쇠'를 쥐고 있다.

데이터를 가지고 할 수 있는 일
이런 데이터 금광을 활용할 수 있는 인공 지능과 머신러닝이 부상했다. 알고리즘을 사용해 데이터를 훈련시켜 패턴을 찾는 기술들이다. 그런데 문제가 있다. 전통적인 CPU(Central Processing Units)는 이런 복잡하고 많은 데이터를 처리하기에 적합하지 않다. 이에 GPU(Graphics Processing Unit) 컴퓨팅이 부상하고 있다.

GPU 기반의 서버가 딥 러닝 알고리즘을 중심으로 한 인공지능을 위한 데이터를 효과적으로 처리할 수 있는 필수 기술로 빠르게 부상하고 있다(CPU가 나머지 대부분을 처리하는 정도). CPU가 며칠, 또는 몇 시간에 처리할 비구조화 데이터를 GPU는 몇 분이면 충분하다.

CPU는 경주용 자동차, GPU는 화물 트럭
GPU가 컴퓨팅이 '핫'한 신기술이기는 하지만, 완전히 새로운 기술은 아니다. 게임 관련 애플리케이션, 비디오 재생 및 분석과 관련해 수년 동안 사용된 기술이다. 데이터 어레이를 지원, 큰 데이터 어레이를 더 빠르게 처리할 수 있도록 만들어졌다.

CPU를 경주용 자동차, GPU를 한 장소에서 다른 장소로 많은 물건을 옮기는 화물 트럭에 비유할 수 있다. 경주용 자동차는 작고 빠르다. 목적지에 정말 빠르게 도착할 수 있다. 그러나 목적지에 도착하기까지 여러 과정을 거쳐야 할 수도 있다. 반면 화물 트럭은 경주용 자동차만큼 빠르지 않지만, 한 번의 여행으로 많은 물건을 배달할 수 있다.

GPU 구현 딥 러닝의 선두주자
현재 이 '화물 트럭' 기술의 선두주자는 엔비디아(Nvidia)다. 게이머들에게 아주 우수한 3D 렌더링 기술을 제공하는 비디오 카드 제조업체로 출발한 이 업체는 이 기술이 빅데이터 처리에 어떤 도움을 주는지 발견했다. 그래서 데이터 사이언티스트들이 GPU를 활용, 데이터를 과거 어느 때보다 빨리 효율적으로 처리할 수 있는 컴퓨터 플랫폼을 개발했다.

엔비디아는 하드웨어를 원래 의도와는 다소 다르게 사용할 수 있는 소프트웨어 플랫폼인 CUDA를 통해 딥 러닝 알고리즘을 효과적으로 활용할 수 있는 기술을 구현했다.

그러나 시장이 계속 성장하면서, 새로운 업체가 시장에 진입해 새로운 경쟁력과 기능들을 제공하기 시작하고 있다. 또한 인텔이나 구글 같은 대기업들도 GPU에 계속 초점을 맞추고 있다. 이런 경쟁이 더 큰 혁신을 가져오고, 가격을 낮출 전망이다.

GPU 투자 시 고려 사항
새로운 기술은 무턱대고 도입해서는 안 된다. GPU 도입 시 고려해야 할 사항 몇 가지를 소개한다.
- 비용: GPU 카드 1개에 1만 달러가 넘을 수 있다. 또 대부분의 딥 러닝 프로젝트에는 최소 4개 이상의 GPU 카드가 필요하다.
- 전용 하드웨어 아키텍처 GPU 서버를 도입하고 싶은 기업들은 GPU 가격은 물론 전용 하드웨어 아키텍처, 수많은 CPU와 RAM에 대해서도 고려해야 한다. 대부분의 경우 개발자의 머신러닝 요구 사항에 맞춰 GPU 서버를 맞춤형으로 구현해야 한다.
- 전용 시설 GPU 서버에는 특수한 전력 및 통풍, 온도 요구 사항을 충족하는 전용 시설이 필요하다.

또한 GPU 서버를 운영할 수 있는 전문성, 지속적인 유지관리, 많은 금전적 투자도 고려해야 한다. 미드마켓을 중심으로 대부분 기업들은 내부에 이를 감당할 예산이 없다. 따라서 머신러닝 프로젝트를 구현하고 관리할 수 있는 GPU 기능과 전문성을 제공할 수 있는 소수의 인공 지능 및 소프트웨어 엔지니어링 서비스 공급업체를 찾는다.

GPU 컴퓨팅은 궁극적으로 머신러닝이 장악할 모든 소프트웨어 개발 프로젝트의 '기준' 같은 컴퓨팅 프로세서가 될 것이다. 그 기원과 능력, 가능성을 이해하면 빠르게 변하는 비즈니스 환경에서 경쟁하는 데 도움이 될 것이다. editor@itworld.co.kr 


2017.11.02

모든 데이터의 "미스터리"를 풀어줄 열쇠, GPU 컴퓨팅의 이해

Carlos Melendez | InfoWorld
수년 전, 벤처 투자자인 마크 앤더신은 '소프트웨어가 세상을 점령할 것'을 정확히 예측했다. 그러나 이제 데이터가 세상을 집어삼킬 예정이다.

IDC에 따르면, 2025년에는 매년 생산되는 데이터가 180ZB에 달할 전망이다(2013년 4.4ZB). 최근까지 이런 데이터는 구조화 데이터로 열과 행으로 구성되어 있고, 쉽게 입력, 저장, 정렬할 수 있는 데이터다. 그러나 현재는 많은 데이터가 여러 웹사이트, 기기, 데이터베이스에서 생성된 비디오, 이미지, 그래픽 등 비구조화 데이터다.

구조화 및 비구조화 데이터는 기업과 기관이 고객을 더 잘 이해하고, 행동 패턴을 적용해 미래의 행동을 예측하고, 질병을 치료할 돌파구를 발견하고, 사회를 더 안전하게 만드는 등 여러 일에 도움을 줄 '열쇠'를 쥐고 있다.

데이터를 가지고 할 수 있는 일
이런 데이터 금광을 활용할 수 있는 인공 지능과 머신러닝이 부상했다. 알고리즘을 사용해 데이터를 훈련시켜 패턴을 찾는 기술들이다. 그런데 문제가 있다. 전통적인 CPU(Central Processing Units)는 이런 복잡하고 많은 데이터를 처리하기에 적합하지 않다. 이에 GPU(Graphics Processing Unit) 컴퓨팅이 부상하고 있다.

GPU 기반의 서버가 딥 러닝 알고리즘을 중심으로 한 인공지능을 위한 데이터를 효과적으로 처리할 수 있는 필수 기술로 빠르게 부상하고 있다(CPU가 나머지 대부분을 처리하는 정도). CPU가 며칠, 또는 몇 시간에 처리할 비구조화 데이터를 GPU는 몇 분이면 충분하다.

CPU는 경주용 자동차, GPU는 화물 트럭
GPU가 컴퓨팅이 '핫'한 신기술이기는 하지만, 완전히 새로운 기술은 아니다. 게임 관련 애플리케이션, 비디오 재생 및 분석과 관련해 수년 동안 사용된 기술이다. 데이터 어레이를 지원, 큰 데이터 어레이를 더 빠르게 처리할 수 있도록 만들어졌다.

CPU를 경주용 자동차, GPU를 한 장소에서 다른 장소로 많은 물건을 옮기는 화물 트럭에 비유할 수 있다. 경주용 자동차는 작고 빠르다. 목적지에 정말 빠르게 도착할 수 있다. 그러나 목적지에 도착하기까지 여러 과정을 거쳐야 할 수도 있다. 반면 화물 트럭은 경주용 자동차만큼 빠르지 않지만, 한 번의 여행으로 많은 물건을 배달할 수 있다.

GPU 구현 딥 러닝의 선두주자
현재 이 '화물 트럭' 기술의 선두주자는 엔비디아(Nvidia)다. 게이머들에게 아주 우수한 3D 렌더링 기술을 제공하는 비디오 카드 제조업체로 출발한 이 업체는 이 기술이 빅데이터 처리에 어떤 도움을 주는지 발견했다. 그래서 데이터 사이언티스트들이 GPU를 활용, 데이터를 과거 어느 때보다 빨리 효율적으로 처리할 수 있는 컴퓨터 플랫폼을 개발했다.

엔비디아는 하드웨어를 원래 의도와는 다소 다르게 사용할 수 있는 소프트웨어 플랫폼인 CUDA를 통해 딥 러닝 알고리즘을 효과적으로 활용할 수 있는 기술을 구현했다.

그러나 시장이 계속 성장하면서, 새로운 업체가 시장에 진입해 새로운 경쟁력과 기능들을 제공하기 시작하고 있다. 또한 인텔이나 구글 같은 대기업들도 GPU에 계속 초점을 맞추고 있다. 이런 경쟁이 더 큰 혁신을 가져오고, 가격을 낮출 전망이다.

GPU 투자 시 고려 사항
새로운 기술은 무턱대고 도입해서는 안 된다. GPU 도입 시 고려해야 할 사항 몇 가지를 소개한다.
- 비용: GPU 카드 1개에 1만 달러가 넘을 수 있다. 또 대부분의 딥 러닝 프로젝트에는 최소 4개 이상의 GPU 카드가 필요하다.
- 전용 하드웨어 아키텍처 GPU 서버를 도입하고 싶은 기업들은 GPU 가격은 물론 전용 하드웨어 아키텍처, 수많은 CPU와 RAM에 대해서도 고려해야 한다. 대부분의 경우 개발자의 머신러닝 요구 사항에 맞춰 GPU 서버를 맞춤형으로 구현해야 한다.
- 전용 시설 GPU 서버에는 특수한 전력 및 통풍, 온도 요구 사항을 충족하는 전용 시설이 필요하다.

또한 GPU 서버를 운영할 수 있는 전문성, 지속적인 유지관리, 많은 금전적 투자도 고려해야 한다. 미드마켓을 중심으로 대부분 기업들은 내부에 이를 감당할 예산이 없다. 따라서 머신러닝 프로젝트를 구현하고 관리할 수 있는 GPU 기능과 전문성을 제공할 수 있는 소수의 인공 지능 및 소프트웨어 엔지니어링 서비스 공급업체를 찾는다.

GPU 컴퓨팅은 궁극적으로 머신러닝이 장악할 모든 소프트웨어 개발 프로젝트의 '기준' 같은 컴퓨팅 프로세서가 될 것이다. 그 기원과 능력, 가능성을 이해하면 빠르게 변하는 비즈니스 환경에서 경쟁하는 데 도움이 될 것이다. editor@itworld.co.kr 


X