데이터센터

“서버 10년 이상 쓰고 부품 80% 재활용” 한 클라우드 업체의 놀라운 인프라 관리

Andy Patrizio | Network World 2023.03.31
서버의 수명은 보통 3~5년이지만, 최근에는 이를 더 연장해서 쓰는 추세다. 마이크로소프트를 비롯한 여러 기업이 원래는 수명을 다해 폐기할 하드웨어의 사용 기간을 몇 년 더 늘리는 방안을 찾고 있다. 이런 트렌드의 최전선에 있는 것이 바로 파리에 본사를 둔 유럽 클라우드 서비스 기업 스케일웨이(Scaleway)다. 재사용 및 수리를 통해 서버를 10년 이상 사용하고 있다.
 
ⓒ Getty Image Bank

서버를 오래 쓰려는 가장 큰 이유는 탄소 발자국이다. 각 시스템이 가진 탄소 영향에서 서버 하드웨어 자체가 차지하는 비중이 15~30%에 이르므로, 새 서버를 구매하는 대신 기존 시스템을 재사용하면 e-폐기물을 크게 줄일 수 있다. 스케일웨이는 1만 4,000대의 서버를 폐기하는 대신 개조해 사용하고 있다. 스케일웨이의 하드웨어 지원 관리자 마크 레이너드는 이 프로젝트의 세부 사항을 블로그를 통해 공개했는데 여기에서 서버를 오래 쓰는 몇 가지 비법을 확인할 수 있다.
 

소프트웨어 RAID로 RAID 컨트롤러 대체 

먼저 스케일웨이는 구형 서버에서 RAID 고장률이 높지만 그 외에는 잘 작동한다는 사실을 발견했다. 주 고장 원인은 RAID 컨트롤러의 배터리였다. 레이너드에 따르면, 배터리는 시간이 지나면서 열화되기 때문에 배터리를 교체해도 장기적으로 안정된 성능을 얻을 수 없다. 결국 스케일웨이는 RAID 컨트롤러를 제거하기로 했고 이는 대규모 개조 프로젝트로 이어졌다. 

레이너드는 “구형 서버에 장착된 것과 같은 하드웨어 카드에 의존하지 않는, 더 현대적인 서버 구성을 검토했다. 핵심 목표 중 하나는 하드웨어 RAID 카드의 필요성을 아예 없애는 것이므로, 이 목표에 부합하는 서버를 구하는 쪽으로 방향을 잡았다”라고 말했다. 최종적으로 이 업체는 온보드 SATA 컨트롤러를 사용해 서버에 직접 디스크를 연결하는 방식을 선택했다. 레이너드는 “필요한 모든 RAID 기능을 소프트웨어 RAID 기능을 통해 사용할 수 있다”라고 말했다. 
 

각 서버가 성능 기준 충족하는지 확인

이 기업의 목표는 선별, 테스트, 검증의 3단계 프로세스를 통해 서버에서 높은 수준의 안정성과 성능을 달성하는 것이다. 스케일웨이는 우선 완성된 제품의 성능 목표를 설정하고, 성능이 떨어지는 서버의 인벤토리를 더 세부적으로 만들어 위치, 사용하는 CPU, 각 서버가 현재 속한 카탈로그, 개조된 이후에 속하게 될 카탈로그와 같은 변수를 검토했다. 

그 후에는 개조된 서버가 프로덕션 환경의 요건을 충족하는지 테스트해야 했다. 스케일웨이의 하드웨어 엔지니어링 팀이 각 서버군의 제약 요소와 요구 사항을 파악하기 위한 체크리스트를 마련했다. 

프로덕션 환경에서 서버의 성능을 확인하는 물리적 검사도 고안했다. RAID 카드를 물리적으로 제거하거나 우회해서 디스크에 액세스할 수 있는지 확인했고, 모든 읽기/쓰기 테스트는 SATA 모드에서 실행해 개조 전에 비해 성능이 더 좋거나 최소한 대등한지 봤다. 또한, RAM을 업그레이드하고 성능을 검증하고 CPU 성능 검사를 수행하고 BIOS, BMC 등의 펌웨어 버전을 검토해 업데이트가 필요한지 확인했다.
 

서버 메모리 업그레이드 

메모리는 큰 문제가 되지 않았다. 스케일웨이의 이전 베어메탈 제품에는 도입 시점에서 기업 고객 요구를 충족하는 사양으로 메모리가 탑재된 상태다. 이후 기업 고객 요구 변화에 따라 메모리를 추가했다. 레이너드는 “메모리 DIMM(듀얼 인라인 메모리 모듈)의 안정성이 크게 개선되면서 고장률은 의사 결정 프로세스에서 결정적인 요소가 되지 않았다”라고 말했다. 업그레이드 과정에서 기존의 DDR3 및 DDR4 DIMM은 대부분 재사용할 수 있었다.

이렇게 검사까지 마친 후 스케일웨이는 1만 4,000대 모든 서버를 새 데이터센터로 물리적으로 옮기는 작업을 시작했다. 전담 팀을 채용해 매주 수백 대씩 랙을 해체해 옮기는 작업을 반복했다. 서버가 새 데이터센터에 도착한 후에는 RAID 카드 제거, 새 메모리 장착, 펌웨어 업데이트 등의 업그레이드를 실행했다. 

레이너드에 따르면, 이 과정에서 네트워크 인프라를 최적화하고 스케일웨이 시스템의 전체적인 성능과 안정성을 개선하기 위해 여러 위치와 데이터센터로 서버를 재배치해야 했다. 이 과정에서 탈락한 서버도 있지만 이런 서버는 일종의 '예비 부품'이 됐다. 레이너드는 “개조된 서버도 여전히 오래된 서버이므로 앞으로 유지보수가 필요하다. 그때 탈락한 서버 제품을 재활용할 수 있다”라고 말했다. 

현재 스케일웨이는 서버를 7~10년째 사용하고 있다. 서버가 안정적으로 작동하도록 적절하게 유지보수하고 업그레이드한 덕분이다. 레이너드는 “이 같은 투자는 장기적으로는 비즈니스와 환경에 모두 유익하다. 새 서버를 만드는 데 사용하는 자원은 무한하지 않다. 우리가 폐기물을 최소화하면서 오래된 서버를 개조하는 시스템을 개발할 것을 자랑스럽게 생각하는 이유다. 현재 우리가 쓰는 서버 중 일부는 10년째 사용하고 있다. 업계 평균인 3~4년에 비해 훨씬 길다. 또한 부품의 거의 80%를 재활용하고 있다”라고 말했다. 
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.