2015.06.22

“구글 데이터센터의 네트워크 들여다보기”…초당 1.13PB 용량

Stephen Lawson | IDG News Service
구글이 10년째 자체 소프트웨어 기반 데이터센터 네트워크를 구축하고 있다. 전통적인 장비로 창고 규모의 컴퓨터의 규모를 감당할 수 없기 때문이다.

구글은 지금까지는 자사 인프라에 대한 정보를 많이 밝히지는 않았으나, 한 네트워킹 총괄 책임자가 지난 수요일 오픈 네트워크 서밋과 블로그에서 상세한 내용을 밝혔다.

현재 구글의 모든 데이터센터를 연결하는네트워크 설계는 최대 초당 1.13PB 용량이다. 이것은 구글이 10년 전 처음 데이터센터 네트워크를 구축하기 시작할 때의 100배에 달하는 용량이다. 3단의 스위치로 이루어진 계층 구조지만, 모든 스위치가 동일한 범용 칩을 사용한다. 또한 표준 프로토콜로 제어되지 않으며, 모든 스위치를 하나로 취급하는 소프트웨어를 통해 제어된다.

구글 펠로우이자 네트워킹 기술 책임자인 아민 바다트는 네트워킹이 컴퓨팅과 스토리지 풀에 골고루 워크로드가 분배되는 특성을 지닌 구글 데이터센터의 핵심이라고 밝혔다. 네트워킹은 구글이 모든 구성 요소를 최대한 이용할 수 있게 하지만, 구글 데이터센터에서 네트워크 용량의 필요성이 점차 커져서 기존의 라우터와 스위치가 따라잡지 못했다.


바다트는 “서버에 공급해야 하는 대역폭의 양이 무어의 법칙을 앞지르기 시작해 지난 6년간 약 50배 증가했다. 네트워크가 컴퓨팅 성능을 따라잡을 필요가 있었으며, 뿐만 아니라 플래시나 비휘발성 메모리를 사용하는 빠른 스토리지 기술을 이용하기 위한 고성능을 필요로 했다”고 설명했다.

구글이 타 업체들의 기존 장비를 사용할 때는, 구글이 구입할 수 있는 가장 큰 라우터에 의해 네트워크 규모가 정해졌다. 더 큰 라우터가 오면 네트워크가 다시 재구축돼야 했다. 결국 잘 굴러가지 않았다.

바다트는 “가격이 얼마든 구글의 분산 시스템이 요구하는 조건을 충족하는 데이터센터 네트워크를 구입하는 것은 불가능했다”고 밝혔다. 1,000대의 개별 네트워크 장비는 구글의 운영을 더 복잡하게 했고, 데이터센터 네트워크 전체를 교체하는 방법은 너무 차질이 컸던 것이다.

그래서 구글은 소프트웨어를 통해 중앙집권적으로 제어되는, 범용 하드웨어를 사용하는 자체 네트워크를 구축하기 시작했다. 기기간 다수의 경로를 가지는 메쉬 구조인 클로스(Clos) 언어와 화이트박스 업체가 쓰는 상용 표준 규격화된 칩으로 구축된 장비를 사용했다. 이를 제어하는 소프트웨어 스택은 구글 자체 솔루션이지만, 오픈소스 오픈플로우(Open Flow) 프로토콜을 통해 작동한다.

바다트에 따르면 프로덕션에 적용할 수는 없지만 배울 수는 있는 파이어호스(Firehose) 1.0이라는 프로젝트를 시작했다. 그 당시에는 목적지 간 다수의 경로를 가진 프로토콜이나 오픈소스 네트워킹 스택 중 적당한 것이 없어서 구글이 고유 프로토콜을 개발한 것이다. 이제 구글은 주피터라는 이름의 직접 개발한 5세대 네트워크를 보유하고 있다. 40GB 이더넷 연결과 ToR, 애그리게이션, 스파인 스위치의 계층구조를 가졌다.

바다트는 이러한 설계가 구글이 데이터 센터 운영의 차질 없이 네트워크를 업그레이드할 수 있게 했다며, “끊임없이 인프라를 갱신하고, 네트워크를 업그레이드하고, 낡은 것을 새 것으로 대체해야만 했다”고 밝혔다.

구글은 현재 개발하는데 10년이 걸렸던 네트워크 기술을 다른 개발자가 사용할 수 있도록 공개하고 있다. 바다트는 “구글이 정말 바라는 것은 다음에 나오는 훌륭한 서비스가 이 인프라와 네트워킹을 견인해 새로 만들어낼 필요 없이 잘 사용하는 것”이라고 강조했다. editor@itworld.co.kr 


2015.06.22

“구글 데이터센터의 네트워크 들여다보기”…초당 1.13PB 용량

Stephen Lawson | IDG News Service
구글이 10년째 자체 소프트웨어 기반 데이터센터 네트워크를 구축하고 있다. 전통적인 장비로 창고 규모의 컴퓨터의 규모를 감당할 수 없기 때문이다.

구글은 지금까지는 자사 인프라에 대한 정보를 많이 밝히지는 않았으나, 한 네트워킹 총괄 책임자가 지난 수요일 오픈 네트워크 서밋과 블로그에서 상세한 내용을 밝혔다.

현재 구글의 모든 데이터센터를 연결하는네트워크 설계는 최대 초당 1.13PB 용량이다. 이것은 구글이 10년 전 처음 데이터센터 네트워크를 구축하기 시작할 때의 100배에 달하는 용량이다. 3단의 스위치로 이루어진 계층 구조지만, 모든 스위치가 동일한 범용 칩을 사용한다. 또한 표준 프로토콜로 제어되지 않으며, 모든 스위치를 하나로 취급하는 소프트웨어를 통해 제어된다.

구글 펠로우이자 네트워킹 기술 책임자인 아민 바다트는 네트워킹이 컴퓨팅과 스토리지 풀에 골고루 워크로드가 분배되는 특성을 지닌 구글 데이터센터의 핵심이라고 밝혔다. 네트워킹은 구글이 모든 구성 요소를 최대한 이용할 수 있게 하지만, 구글 데이터센터에서 네트워크 용량의 필요성이 점차 커져서 기존의 라우터와 스위치가 따라잡지 못했다.


바다트는 “서버에 공급해야 하는 대역폭의 양이 무어의 법칙을 앞지르기 시작해 지난 6년간 약 50배 증가했다. 네트워크가 컴퓨팅 성능을 따라잡을 필요가 있었으며, 뿐만 아니라 플래시나 비휘발성 메모리를 사용하는 빠른 스토리지 기술을 이용하기 위한 고성능을 필요로 했다”고 설명했다.

구글이 타 업체들의 기존 장비를 사용할 때는, 구글이 구입할 수 있는 가장 큰 라우터에 의해 네트워크 규모가 정해졌다. 더 큰 라우터가 오면 네트워크가 다시 재구축돼야 했다. 결국 잘 굴러가지 않았다.

바다트는 “가격이 얼마든 구글의 분산 시스템이 요구하는 조건을 충족하는 데이터센터 네트워크를 구입하는 것은 불가능했다”고 밝혔다. 1,000대의 개별 네트워크 장비는 구글의 운영을 더 복잡하게 했고, 데이터센터 네트워크 전체를 교체하는 방법은 너무 차질이 컸던 것이다.

그래서 구글은 소프트웨어를 통해 중앙집권적으로 제어되는, 범용 하드웨어를 사용하는 자체 네트워크를 구축하기 시작했다. 기기간 다수의 경로를 가지는 메쉬 구조인 클로스(Clos) 언어와 화이트박스 업체가 쓰는 상용 표준 규격화된 칩으로 구축된 장비를 사용했다. 이를 제어하는 소프트웨어 스택은 구글 자체 솔루션이지만, 오픈소스 오픈플로우(Open Flow) 프로토콜을 통해 작동한다.

바다트에 따르면 프로덕션에 적용할 수는 없지만 배울 수는 있는 파이어호스(Firehose) 1.0이라는 프로젝트를 시작했다. 그 당시에는 목적지 간 다수의 경로를 가진 프로토콜이나 오픈소스 네트워킹 스택 중 적당한 것이 없어서 구글이 고유 프로토콜을 개발한 것이다. 이제 구글은 주피터라는 이름의 직접 개발한 5세대 네트워크를 보유하고 있다. 40GB 이더넷 연결과 ToR, 애그리게이션, 스파인 스위치의 계층구조를 가졌다.

바다트는 이러한 설계가 구글이 데이터 센터 운영의 차질 없이 네트워크를 업그레이드할 수 있게 했다며, “끊임없이 인프라를 갱신하고, 네트워크를 업그레이드하고, 낡은 것을 새 것으로 대체해야만 했다”고 밝혔다.

구글은 현재 개발하는데 10년이 걸렸던 네트워크 기술을 다른 개발자가 사용할 수 있도록 공개하고 있다. 바다트는 “구글이 정말 바라는 것은 다음에 나오는 훌륭한 서비스가 이 인프라와 네트워킹을 견인해 새로 만들어낼 필요 없이 잘 사용하는 것”이라고 강조했다. editor@itworld.co.kr 


X