Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

카오스엔지니어링

“클라우드를 위한 카오스 엔지니어링” 애저 카오스 스튜디오 공개 프리뷰

마이크로소프트 애저(Azure) CTO 마크 루시노비치는 2021년 초 애저 아키텍처에 관한 정기적인 이그나이트(Ignite) 행사를 통해 애저 플랫폼의 결함 주입 툴인 카오스 스튜디오(Chaos Studio)를 공개했다. 넷플릭스가 도입한 카오스 몽키 개념을 기반으로 확산되고 있는 카오스 엔지니어링은 클라우드 규모의 애플리케이션이 실패할 때 정확히 어떤 일이 일어나는지를 개발자가 이해하는 데 도움이 된다.    이제 마이크로소프트는 더 탄력적이고 더 나은 클라우드 애플리케이션을 제공하는 것을 목표로 이번 2021년 2차 이그나이트 행사에서 카오스 스튜디오의 첫 공개 프리뷰 버전을 공개한다. 필자는 프리뷰 공개에 앞서 마크 루시노비치와 만나 카오스 엔지니어링에 대한 애저의 접근 방법과 개발자가 이런 기술을 활용하는 방법에 관해 이야기를 나눴다.    애저 클라우드에 혼돈 더하기  애저의 카오스 엔지니어링은 새로운 것은 아니다. 루시노비치는 “거의 시작부터 애저에서 자체적인 카오스 엔지니어링을 해왔다”고 말했다. 그러나 서비스가 성장하면서 한때 특정 팀에서만 사용하던 툴이 애저를 개발하는 모든 사람들에게 필요한 툴이 됐다. 루시노비치는 “지난 몇 년 동안 카오스 엔지니어링에 투입되는 노력을 서비스 전반에 적용할 수 있는 하나의 공통된 툴, 공통 프레임워크 서비스로 통합해야 한다는 것을 알고 있었다”고 말했다.  그 공통 툴이 카오스 스튜디오의 기반이 됐다. 루시노비치는 카오스 스튜디오가 시작은 내부 툴이었지만, 항상 고객 대면 애플리케이션이 될 것이라는 점을 염두에 뒀다고 강조했다. 고객에게 필요한 것과 마이크로소프트에 필요한 것은 다를 수 있지만, 마이크로소프트가 얻은 교훈은 스스로든 고객이든 모든 사용자 관점에서 애저를 더 개선하는 데 도움이 될 수 있다. 루시노비치는 “고객을 위해 운영되는 서비스의 혜택을 누리는 것 외에, 이를 기반으로 고객과 함께 생태계를 구축할 수 있다. 이 확장성을 통해 생태...

카오스엔지니어링 카오스스튜디오 애저 2021.11.04

넷플릭스에 탄력성을 가져온 원숭이 부대 ‘카오스 몽키’ 알아보기

DVD 대여업을 하던 넷플릭스가 비디오 스트리밍을 위한 분산 클라우드 시스템으로 전환하던 시기에 처음 고안한 카오스 몽키(Chaos Monkey)는 이후 형태와 규모를 불문하고 모든 소프트웨어 개발 조직에 적용되는 엔지니어링 원칙으로 자리잡았다. 핵심 원리는 의도적으로 시스템에 장애를 일으킴으로써 시스템의 탄력성을 더 높일 방법을 알아낸다는 것이다.   2011년 7월, 당시 넷플릭스의 클라우드 및 시스템 인프라 책임자였던 유리 아즈라일레브스키와 클라우드 솔루션 책임자 아리엘 자이틀린이 처음 카오스 몽키를 주제로 올린 넷플릭스 블로그 글에 따르면 카오스 몽키는 아마존 웹 서비스 인프라의 프로덕션 인스턴스를 무작위로 마비시키도록 고안됐다. 그렇게 해서 약점이 노출되면 넷플릭스 엔지니어들이 더 나은 자동 복구 메커니즘을 구축해 이 약점을 없애도록 하는 것이 목적이었다.   블로그 글을 보면 카오스 몽키라는 재미있는 이름은 “무기를 든 야생 원숭이가 데이터센터(또는 클라우드 영역)에 들어와 무작위로 인스턴스를 파괴하고 케이블을 끊더라도 중단 없이 고객에게 서비스를 계속 제공한다는 개념”에서 유래됐다.   전 넷플릭스 엔지니어인 노라 존스와 케이시 로젠탈이 카오스 몽키를 주제로 써서 오라일리 미디어(O’Reilly Media)를 통해 출판한 책 '카오스 엔지니어링(Chaos Engineering)'에 의하면 실무에서 카오스 몽키는 간단한 애플리케이션이 “매일 각 클러스터에서 임의의 인스턴스를 선택해서 영업 시간 중 특정 시점에 경고 없이 이 인스턴스를 끄는” 방식으로 진행된다.   카오스 몽키의 개념은 가장 약한 부분이 어디인지 파악하면 엔지니어가 문제에 대처하는 자동화된 트리거를 설정할 수 있고 이를 통해 한밤중에 장애 발생으로 엔지니어가 호출될 일이 없다는 것이다. 이후 카오스 몽키는 카오스 엔지니어링이라는 이름 아래에 종합적인 카오스 원칙으로 발전했다.   넷플릭스의 카오스 몽키 카오스 몽키는 2010년을 전후해...

넷플릭스 카오스엔지니어링 카오스몽키 2020.05.15

카오스 엔지니어링 실험을 운용하는 3가지 핵심 단계

카오스 엔지니어링(Chaos Engineering)은 고장(failure)에 직면했을 때, 시스템이 어떻게 가동하는지 알려주는 계획된 실험을 운용하는 것이다. 역동적인 클라우드 환경을 중심으로 하는 트렌드와 마이크로서비스의 등장으로 웹은 점점 더 복잡하게 발전하고 있다. 고장을 완화하고 선제적으로 억제하는 것이 그 어느 때보다도 중요하다. 고장은 간단한 문제라 할지라도 고객 경험을 해치고 기업의 성과에 영향을 끼칠 수 있다. 다운타임의 비용이 엔지니어링 팀의 주요 KPI로 자리잡고 있으며 주요 고장 정지가 발생하는 경우 엄청난 비용이 발생할 수 있다. 2017년, ITIC가 조사한 바에 따르면, 조직의 98%가 1시간의 다운타임으로 기업에 10만 달러 이상의 비용이 발생할 것이라고 밝혔다. 한 번의 심각한 고장 정지로 기업에 수백만 달러의 비용이 발생할 수 있다. 일례로 영국항공(British Airways)의 CEO는 최근 2017년 5월 기술 문제로 인해 수만 명의 영국항공 승객들의 발이 묶이면서 8,000만 파운드(약 1,227억 원)의 비용이 발생했다고 밝혔다. 이는 기업들이 사태를 기다리기 보다 선제적으로 대비해야 하는 이유가 된다. 조직 내에서 효과적인 카오스 엔지니어링 실험을 운용하는 3가지 핵심 단계는 다음과 같다. 테스트 환경에서 단일 호스트, 컨테이너 또는 마이크로서비스로 시작한다. 그리고 나서 여러 개를 의도적으로 충돌시킨다. 테스트 환경에서 100%를 달성한 후 생산에서 가장 작은 부분을 재설정하고 거기에서부터 시작한다. 카오스 엔지니어링 1단계. 실험을 계획하라 카오스 엔지니어링에서 가장 강력한 질문은 "어떤 문제가 발생할 수 있는가?"다. 시스템이 스트레스를 받을 때 어떻게 가동해야 하는 지에 대한 가설을 세우는 것부터 시작한다. 먼저 서비스와 환경에 대해 생각함으로써 어떤 시나리오의 가능성이 더 높고(혹은 더 무섭고) 먼저 테스트해야 하는지 우선순위를 더욱 잘 설정할 수 있다. 하지만 하...

카오스엔지니어링 Chaos Engineering failure 2018.04.17

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.