Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

세상의 모든 IT 리서치 자료 - 넘버스 Numbers

클라우드 장애 사례 중 피해 규모가 10만 달러 이상인 비율
60+
%
넘버스
자료 제목 :
2022 클라우드 장애 분석
2022 Outage Analysis
자료 출처 :
Uptime
원본자료 다운로드
발행 날짜 :
2022년 06월 08일
클라우드

블로그 | '투자-복잡성-장애-투자' 고통스러운 클라우드의 띠

David Linthicum | InfoWorld 2022.06.15
클라우드 업체의 여러 가지 주장에도 불구하고 퍼블릭 클라우드 장애가 점점 더 심각해지고 있는 것으로 나타났다. 업타임 인스티튜트(Uptime Institute)의 최신 보고서 '2022 장애 분석(2022 Outage Analysis)'에 따르면, 클라우드의 높은 장애 비율이 여전히 주요 문제로 남아 있음을 알 수 있다. 설문에 응한 기업 5곳 중 1곳은 '중대하(serious)'거나 '심각한(severe)' 장애를 경험했고 이에 따라 상당한 비용 손실과 평판 하락, 법률 위반 등을 겪었다고 답했다. 일부 기업은 아예 기업 운영을 중단했다. 보고서는 지난 3년간 주요 장애의 발생이 약간씩 늘어나고 있다고 결론 내렸다.
 
ⓒ Getty Images Bank

이에 대한 업타임 인스티튜트의 앤디 로렌스의 지적은 귀 기울일 만하다. 그는 "전반적으로 장애율이 개선되지 않는 것은 최근 디지털 인프라에 대한 막대한 투자가 한 원인이다. 이런 투자를 통해 기업이 하이브리드, 분산 아키텍처로 전환함에 따라 운영의 복잡성에 직면한 것이다"라고 말했다.

사실 복잡성은 IT에 있어 새로운 이슈가 아니다. 그러나 최근에는 팬데믹에 대응하기 위해 빠르게 디지털 트랜스포메이션을 추진하고 클라우드/멀티클라우드로 이전하면서 더 심각한 복잡성 문제에 직면하게 됐다. 이 때문에 기업에는 현업을 지원하는 시스템을 담당하는 직원이 크게 늘고 있다. 상당수 기업이 전사적으로 500가지 정도 클라우드 서비스를 지원한 경험이 있다고 답했고, 현재는 멀티 클라우드 전반에서 3,000가지가량 서비스를 지원하는 것으로 나타났다.

이러한 수치는 기술 자체가 곧 장애를 일으키는 것이 아니라는 점을 보여준다. 기술을 사용하는 방법, 활용하는 기술의 규모가 장애에 더 큰 영향을 준다. 보고서에 따르면, 기업의 40% 정도가 사람의 실수로 인한 장애를 겪고 있다. 이런 장애 중 85%는 실무자가 절차를 따르지 않거나 실수하거나 절차 자체에 문제가 있었던 것이 근본 원인이었다.

이처럼 사람으로 인한 장애가 발생하는 근본 이유 역시 우리는 잘 익히 알고 있다. 관리가 필요한 많은 부분이 멀티클라우드와 클라우드 아키텍처로 전환했지만, 운영 인력을 늘릴 수 있는 예산은 여전히 부족하기 때문이다. 신규 기술 투자 > 복잡성 증가 > 운영 예산 부족 > 장애가 반복되는 것이다.

그렇다면 이런 복잡성은 왜 처음부터 나타나는 것일까? 더 좋은 관리 툴을 도입하면 문제를 해결할 수 있을까? 현재 시장에는 AI옵스, 크로스 클라우드 멀티클라우드 모니터링 솔루션 등 더 효율적인 운영 툴이 다양하게 나와 있다. 이런 툴을 이용하면 개발자와 기업 내 혁신가가 원하는 가장 좋은 기술을 조합해 비즈니스를 바꾸는 기술을 만들어 배포할 수 있다. 개발자는 최적의 스토리지 시스템, AI 시스템, 컴퓨트, 데이터베이스 등을 원하는 대로 선택해 적용할 수 있다. 이런 솔루션은 한 업체에서 일괄 구매할 수도 있지만 대부분은 여러 클라우드 제공업체로부터 조달하게 된다.

그러나 그 결과는 '또다시' 복잡하고 매우 다양한 이기종의 멀티클라우드다. 이들 서비스를 효과적으로 운영하고 장애를 줄일 수 있는 전문성을 가진 실무자가 꼭 필요해지는 것이다. 아이러니한 것은 대부분 IT 조직은 운영 예산 증액을 승인받기 쉽지 않다는 점이다. 그 클라우드 컴퓨팅을 도입한 근거가 바로 운영비용 절감이었기 때문이다.

이런 문제를 해결하는 근본적인 방법은 추상화, 자동화 계층을 활용하는 것이다. 이를 통해 모든 운영 프로세스에서 사람(그리고 사람의 실수)을 최소화할 수 있다. 또한 이런 계층에서 운영 계획 또는 멀티클라우드 운영을 최적화하는 재계획 툴을 운영할 수 있는데, 이런 툴을 통해 운영의 질을 한 단계 높일 수 있다.

그러나 클라우드 장애 문제를 깊이 들여다보면 결국 제자리로 돌아온다. 이처럼 클라우드와 멀티클라우드 작업을 완전히 개선해 추상화와 자동화 레이어를 통합하려면 더 큰 비용과 인력이 필요하다. 그리고 이러한 투자가 임계점을 돌파할 때까지는 복잡성 문제를 다루는 비용이 사람이 직접 제어하는 것보다 더 많이 들게 된다. 이 과정에서 더 많은 클라우드 장애를 경험하게 될 것이다. 장애를 줄이는 방법을 찾기 위해 더 많은 장애를 경험해야 하는 역설적인 상황. 안타깝게도 과거 많은 기술 활용 과정에서도 똑같이 겪었던 것이다.
editor@itworld.co.kr
 Tags 클라우드 장애

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.