2016.05.19

"무어의 법칙보다 7년 앞서다" 구글의 텐서 프로세싱 유닛

Gordon Mah Ung | PCWorld
"CPU, GPU, 그리고 FPGA(Field-Programmable Gate Array)는 잊어라." 구글은 자체 텐서 프로세싱 유닛(Tensor Processing Unit, TPU)이 3세대나 앞선 기술을 통해 머신러닝 역량을 개선했다고 말했다.


Credit: Google

구글 CEO 순다 피차이는 구글 I/O 개발자 컨퍼런스에서 "TPU는 상업적으로 가용할 수 있는 모든 GPU와 FPGA보다 와트당 고성능을 보여준다"고 말했다.

그간 구글은 TPU를 비밀로 취급해 긴밀히 보호해왔는데, 피차이는 이번 컨퍼런스에서 "이 칩들이 알파고 컴퓨터에 사용되어 이세돌 바둑기사와 바둑 대결을 펼칠 때 사용됐다"고 말했다.
피차이는 더이상 상세한 내용에 대해서는 말하지 않았지만 구글은 그날 블로그를 통해 조금의 정보를 더 공개했다.

이 블로그 게시물은 "우리는 1년 전부터 머신러닝을 위한 좀더 최적화된 성능을 끌어내기 위해 TPU를 데이터센터 내부에서 사용하고 있었다. 이 TPU의 성능은 현재 무어의 법칙보다 3세대나 앞선, 7년이나 앞선 기술이다"고 전했다.

"머신러닝 애플리케이션에 맞게 만들어진 TPU는 좀더 높은 연산력을 견딜 수 있도록 설계됐다. 이는 연산당 소요되는 트랜지스터 수가 적어진다는 의미다. 이를 통해 우리는 이 실리콘에서 초당 연산수를 짜낼 수 있어 좀더 지능적이고 강력한 머신러닝 모델을 사용할 수 있으며, 이들 모델을 좀더 빠르게 적용할 수 있어 사용자들이 좀더 현명한 결과를 도출할 수 있게 도와준다."

이 블로그는 "이 작은 TPU는 데이터센터 렉에 있는 하드드라이브 슬롯에 적합하며 이미 구글 랭크브레인(RankBrain)과 스트릿 뷰(Street View)에 사용하고 있다"고 말했다.

아직 CPU와 GPU를 포기할 때는 아니다
TPU가 정확하게 무엇인지는 알지 못한다. 2000년대 초반 SGI는 자체 워크스테이션 내에 TPU(Tensor Processing Unit)라고 부르는 상업용 제품을 갖고 있었다. 이는 디지털 시그널 프로세서(Digital Signal Processor, DSP)를 나타내는 말이었다.

이 DSP는 전용 칩으로, 반복적이고, 단순한 업무에 극도로 빠르고 능률적이었다. 그러나 구글에 따르면 구글의 TPU는 이와는 관련이 없다.

이번 I/O 개발자 컨퍼런스에 참석한 무어헤드 인사이트 & 스트레티지 분석가 패트릭 무어헤드는 "구글이 TPU에 대해 드러낸 정보는 아주 조금밖에 없다"며, "그렇다고 구글이 전통적인 CPU와 GPU를 포기한다고는 생각치 않는다"고 말했다.

무어헤드는 "TPU는 가르치거나 배우는 것이 아니라 생산 또는 재생하는 것"이라고 말했다. 무어헤드는 TPU가 머신러닝 알고리듬을 수행하는 GPU와 CPU 보다 좀더 강력한 칩 형태를 하고 있는 것으로 추정했다.


Credit: Google

TPU의 성능이 무어의 법칙을 7년이나 앞섰다는 구글의 주장에 대해 무어헤드는 의심하지 않았다. 그는 전통적인 ASIC(application-specific integrated circuit)와 하나의 CPU 간 관계와 유사한 것으로 보고 있다.

하드코딩된 ASIC는 하나의 작업을 하는데 고도로 최적화된 칩이다. FPGA처럼 변경할 수 없는 ASIC는 대신 엄청난 성능 효과를 누릴 수 있다.

그는 하나의 CPU에서 H.265 비디오 스트림을 디코딩하는 작업을 통해 ASIC의 효과를 설명했다. 특정 작업을 하는 데에서 전용이 아닌 일반 CPU에서의 성능은 ASIC를 통하는 것을 따라가지 못한다.

ASIC의 문제는 비용과 영구적인 속성에 있다. 버그나 개선을 위해 알고리듬을 변경해야 한다면 새로운 칩으로 다시 만들어야 하는 게 유일한 방법이다. 한 마디로 재프로그래밍이 되지 않는다. 그래서 ASIC는 전통적으로 정부와 같이 무제한의 예산이 있는 곳에서만 사용할 수 있는 것으로 격하됐다. editor@itworld.co.kr

2016.05.19

"무어의 법칙보다 7년 앞서다" 구글의 텐서 프로세싱 유닛

Gordon Mah Ung | PCWorld
"CPU, GPU, 그리고 FPGA(Field-Programmable Gate Array)는 잊어라." 구글은 자체 텐서 프로세싱 유닛(Tensor Processing Unit, TPU)이 3세대나 앞선 기술을 통해 머신러닝 역량을 개선했다고 말했다.


Credit: Google

구글 CEO 순다 피차이는 구글 I/O 개발자 컨퍼런스에서 "TPU는 상업적으로 가용할 수 있는 모든 GPU와 FPGA보다 와트당 고성능을 보여준다"고 말했다.

그간 구글은 TPU를 비밀로 취급해 긴밀히 보호해왔는데, 피차이는 이번 컨퍼런스에서 "이 칩들이 알파고 컴퓨터에 사용되어 이세돌 바둑기사와 바둑 대결을 펼칠 때 사용됐다"고 말했다.
피차이는 더이상 상세한 내용에 대해서는 말하지 않았지만 구글은 그날 블로그를 통해 조금의 정보를 더 공개했다.

이 블로그 게시물은 "우리는 1년 전부터 머신러닝을 위한 좀더 최적화된 성능을 끌어내기 위해 TPU를 데이터센터 내부에서 사용하고 있었다. 이 TPU의 성능은 현재 무어의 법칙보다 3세대나 앞선, 7년이나 앞선 기술이다"고 전했다.

"머신러닝 애플리케이션에 맞게 만들어진 TPU는 좀더 높은 연산력을 견딜 수 있도록 설계됐다. 이는 연산당 소요되는 트랜지스터 수가 적어진다는 의미다. 이를 통해 우리는 이 실리콘에서 초당 연산수를 짜낼 수 있어 좀더 지능적이고 강력한 머신러닝 모델을 사용할 수 있으며, 이들 모델을 좀더 빠르게 적용할 수 있어 사용자들이 좀더 현명한 결과를 도출할 수 있게 도와준다."

이 블로그는 "이 작은 TPU는 데이터센터 렉에 있는 하드드라이브 슬롯에 적합하며 이미 구글 랭크브레인(RankBrain)과 스트릿 뷰(Street View)에 사용하고 있다"고 말했다.

아직 CPU와 GPU를 포기할 때는 아니다
TPU가 정확하게 무엇인지는 알지 못한다. 2000년대 초반 SGI는 자체 워크스테이션 내에 TPU(Tensor Processing Unit)라고 부르는 상업용 제품을 갖고 있었다. 이는 디지털 시그널 프로세서(Digital Signal Processor, DSP)를 나타내는 말이었다.

이 DSP는 전용 칩으로, 반복적이고, 단순한 업무에 극도로 빠르고 능률적이었다. 그러나 구글에 따르면 구글의 TPU는 이와는 관련이 없다.

이번 I/O 개발자 컨퍼런스에 참석한 무어헤드 인사이트 & 스트레티지 분석가 패트릭 무어헤드는 "구글이 TPU에 대해 드러낸 정보는 아주 조금밖에 없다"며, "그렇다고 구글이 전통적인 CPU와 GPU를 포기한다고는 생각치 않는다"고 말했다.

무어헤드는 "TPU는 가르치거나 배우는 것이 아니라 생산 또는 재생하는 것"이라고 말했다. 무어헤드는 TPU가 머신러닝 알고리듬을 수행하는 GPU와 CPU 보다 좀더 강력한 칩 형태를 하고 있는 것으로 추정했다.


Credit: Google

TPU의 성능이 무어의 법칙을 7년이나 앞섰다는 구글의 주장에 대해 무어헤드는 의심하지 않았다. 그는 전통적인 ASIC(application-specific integrated circuit)와 하나의 CPU 간 관계와 유사한 것으로 보고 있다.

하드코딩된 ASIC는 하나의 작업을 하는데 고도로 최적화된 칩이다. FPGA처럼 변경할 수 없는 ASIC는 대신 엄청난 성능 효과를 누릴 수 있다.

그는 하나의 CPU에서 H.265 비디오 스트림을 디코딩하는 작업을 통해 ASIC의 효과를 설명했다. 특정 작업을 하는 데에서 전용이 아닌 일반 CPU에서의 성능은 ASIC를 통하는 것을 따라가지 못한다.

ASIC의 문제는 비용과 영구적인 속성에 있다. 버그나 개선을 위해 알고리듬을 변경해야 한다면 새로운 칩으로 다시 만들어야 하는 게 유일한 방법이다. 한 마디로 재프로그래밍이 되지 않는다. 그래서 ASIC는 전통적으로 정부와 같이 무제한의 예산이 있는 곳에서만 사용할 수 있는 것으로 격하됐다. editor@itworld.co.kr

X