장애

글로벌 칼럼 | 클라우드 장애 대부분은 클라우드와 상관없다

미디어에서 클라우드 장애를 다룬 기사를 볼 때마다 깜짝 놀라곤 한다. '클라우드 서비스 장애(The Cloud Fails to Deliver)' 같은 기사인데, 클릭해 자세히 읽어 보면 제목에 문제가 있음을 알 수 있다. 사실 클라우드 기술은 '애초에...

클라우드 장애 2024.01.25

네트워크 운영에서 발생하는 대표적인 인적 오류 4가지와 대처법

네트워크 중단의 원인은 오류 분석 및 대응, 구성 변경, 확장 및 장애 조치, 보안 정책 등 오류가 발생하기 쉬운 4가지 활동에서 찾을 수 있다. 건수만 놓고 보면, 모든 네트워크 문제의 절반은 사람의 실수로 인해 발생한다. 하지만 성능 저하나 운영...

네트워크 NOC 인적오류 2023.08.23

깃허브 왜 이러나... 지난 4개월간 잇따른 서비스 장애

마이크로소프트 산하 버전 관리 서비스 깃허브에서 지난 3개월 동안 총 13건의 사고가 발생한 데 이어 지난주에도 3건의 서비스 중단 사태가 벌어졌다.  깃허브의 최고 보안 책임자 마이크 핸리는 5월 16일 공식 블로그에서 “지난주 깃허브는 ...

깃허브 마이크로소프트 버전 관리 2023.05.18

“MS 이어 오라클 OCI도 대규모 장애” 클라우드 기반 업무 시스템 '불안불안'

최근 OCI(Oracle Cloud Infrastructure) 장애가 발생해 전 세계 사용자에게 영향을 끼쳤다. 최근의 또다른 마이크로소프트 클라우드 서비스 중단에 이어 발생해 클라우드 기반 미션 크리티컬 애플리케이션에 비즈니스를 의존하는 시스템 관...

OCI 마이크로소프트 오라클 2023.02.21

대규모 MS 서비스 장애 분석해 보니⋯“급속한 BGP 라우터 업데이트가 원인”

지난 1월 25일 마이크로소프트 애저를 비롯해 여러 마이크로소프트 클라우드 서비스의 광범위한 장애를 유발한 원인은 경계 게이트웨이 프로토콜(BGP, Border Gateway Protocol) 라우터 프리픽스의 반복적이고 빠른 재광고가 일으킨 연쇄 효...

장애 마이크로소프트 2023.02.02

블로그 | '투자-복잡성-장애-투자' 고통스러운 클라우드의 띠

클라우드 업체의 여러 가지 주장에도 불구하고 퍼블릭 클라우드 장애가 점점 더 심각해지고 있는 것으로 나타났다. 업타임 인스티튜트(Uptime Institute)의 최신 보고서 '2022 장애 분석(2022 Outage Analysis)'에 따르면, 클...

클라우드 장애 2022.06.15

아틀라시안 클라우드 장애…"서비스 복구에 최대 2주"

아틀라시안이 예정된 클라우드 유지보수 작업 중 자체 제품과 서드파티 애플리케이션이 삭제되는 사고가 발생한 가운데, 약 400곳의 기업 고객을 대상으로 현재 복구가 진행 중이다. 그러나 완전한 복구까지는 최대 2주가 걸릴 전망이다. 지난 4일 아틀라시...

아틀라시안 클라우드 장애 2022.04.14

블로그 | 엣지 컴퓨팅이 고장 나는 곳

시골 여기저기에 설치된 유정의 운영을 모니터링하는 하는 사람이 있다. 모든 원유 시추기에는 어떤 장치가 설치되어 있으며, 유정에서 지상으로 석유를 뽑아 올리는 메커니즘이 있다. 이 장치는 지역의 날씨와 시추기의 동작을 모니터링하며, 시추기에서 로컬 프...

엣지컴퓨팅 고장 장애 2022.04.11

RPA 봇 장애에 대비한 올바른 유지보수 전략

성공적인 파일럿 단계 이후, 많은 기업이 전사적으로 RPA를 확장하고 있다. 이 과정에서 기업은 한 가지 중요한 점을 간과하는 경우가 많다. 자동화 붕괴가 일어나지 않도록 하려면 소프트웨어 봇 역시 수명 주기 전반에 걸쳐 지속적으로 모니터링하고 유지보...

RPA 유지보수 장애 2021.10.06

“데이터센터 장애의 원인이 바뀐다” 정전보다는 환경 구성 : 업타임 보고서

업타임 인스티튜트의 새로운 조사에 따르면, 데이터센터 운영업체에 전력은 점점 큰 문제가 아니다. 하지만 네트워킹과 소프트웨어가 더 큰 문제가 되고 있다.   업타임의 세 번째 연례 서비스 중단 분석(Annual Outage Analysis...

데이터센터 장애 서비스중단 2021.04.26

글로벌 칼럼 | 오피스 365에서 무슨 일이 일어나고 있나?

필자의 윈도우 업데이트 경험은 지금까지 완전히 엉망이었다. 그렇다면 아웃룩이나 오피스는 어떨까? 여기서는 무슨 일이 벌어지고 있을까?  몇 달마다 필자는 또 하나의 재난 같은 윈도우 업데이트나 패치를 시도한다. 정말로 하고 싶지 않은 일이다...

오피스365 마이크로소프트365 마이크로소프트 2020.10.15

"인증서 갱신을 안 해서···" MS, 팀즈 장애 '망신살'

마이크로소프트 팀즈(Teams) 사용자가 2시간 이상 이 협업 앱에 로그인하지 못하는 장애가 발생했다. 지난 3일의 상황으로, 인증서가 만기 됐기 때문으로 나타났다. 이번 장애는 기업 협업 시장에서 슬랙(Slack)과 경쟁하고 있는 마이크로소프트에 타...

인증서 장애 팀즈 2020.02.05

데이터센터 가동시간에 가장 위험한 요소는 사람 : 업타임 설문조사

오래된 농담이 있다. “인간은 실수하기 마련이지만, 일을 진짜로 망치려면 컴퓨터가 있어야 한다.” 하지만 이제는 그 반대가 현실이다. 그동안 데이터센터 장비의 안정성은 크게 향상된 반면, 이를 운영하는 인간은 여전히 실수를 하기 때문이다. 그리고 이제...

설문조사 장애 서비스중단 2019.10.10

IDG 블로그 | 머신러닝 운영은 클라우드옵스에 적합하지 않다

월요일 아침, 그리고 길고 긴 주말의 시스템 장애가 끝나고 클라우드 운영팀은 지난 주말에 일어난 일에 대해 토론했다. 머신러닝으로 동작하는 최첨단이자 새로운 인벤토리 관리 시스템과 관련된 여러 시스템이 주말 동안 문제를 일으켰다.   사후...

인공지능 장애 클라우드옵스 2019.08.26

글로벌 칼럼 | 클라우드 서비스의 가용성과 실제 서비스 중단 시간

오늘날 클라우드의 가동시간은 매우 중요하지만, 업체가 제공하는 데이터는 혼란스럽다. 3대 클라우드 서비스를 비교 분석해 본다. 많은 기업에 클라우드는 그저 중요한 정도가 아니라 이른바 ‘미션 크리티컬한’ 존재이다. 점점 더 많은...

가용성 SLA 장애 2019.05.14

네트워크 문제로 인한 데이터센터 가동 정지 증가 중

데이터센터 가동 정지를 유발하는 일반적인 원인 중 하나는 정전이다. 그러나 정전이 유일한 원인은 아니다. 기업 컴퓨팅 환경의 복잡성이 높아지면서 IT 시스템과 네트워크의 장애로 인해 데이터센터 가동이 멈추는 사례가 늘고 있는 것으로 나타났다. &nbs...

가용성 장애 서비스중단 2019.03.25

서버리스 컴퓨팅의 3대 문제점과 해결 방법

서버리스 컴퓨팅이 대세다. 누구든 이미 구축했거나, 구축을 고려하거나 둘 중 하나에는 속한다. 지금 동참하지 않으면 뒤처지게 될지도 모른다. 이렇게 서버리스가 화제인 이유가 무엇일까? 서버리스 컴퓨팅은 시스템 확장을 위해 필요할 때 서버 리소스를 시...

가시성 함수 장애 2019.02.11

“편리하고 빠른” 스마트폰용 무료 네트워크 툴

스마트폰이 네트워크 문제 해결을 위한 툴킷의 핵심 요소가 될 수 있다. 유지보수 작업이 필요할 때 네트워크 전문가는 대부분 데스크톱 PC나 노트북에서 변경 작업을 한다. 그러나 아이폰 또는 안드로이드 폰 역시 PC 못지않게 유용하다. 스마트폰을 진단...

테스트 원격 장애 2019.01.31

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.