2018.12.19

아틀라시안, 지라옵스에 '장애 후 검토' 기능 추가

Matthew Finnegan | Computerworld
아틀라시안(Atlassian)이 자사의 이슈 관리 툴 '지라옵스(JiraOps)'에 '장애 후 검토(postmortem)' 기능을 추가했다. 이를 이용하면 IT팀이 주요 소프트웨어 장애에 어떻게 대응했는지를 쉽게 재검토할 수 있다.
 
© Getty Images Bank

지라옵스는 지난 9월 바르셀로나에서 열린 아틀라시안의 사용자 대상 행사에서 처음 공개됐다. 지라 이슈 추적 툴을 IT 운영팀에 맞춰 수정한 솔루션이다. 업체 측은 이를 한 곳에서 장애에 대응하고 그 해법을 연결해 모든 장애에 대해 일관된 대응이 가능한 제품이라고 설명했다. 

이후 아틀라시안은 이 제품에 신기능을 몇 가지 더 추가했다. 장애 후 검토 문서 작성을 간소화한 기능이 대표적이다. 보통 장애를 해결한 이후에는 소홀히 넘어가기 쉽다. 반면 지라옵스 사용자는 아틀라시안 콘텐츠 협업 툴 '컨플루언스(Confluence) 내에서 쉽게 장애 후 검토 문서를 만들 수 있다. 장애 개요와 근본 원인, 시사점 같은 주요 정보를 작성할 수 있는 템플릿도 제공한다. 장애 대응 과정 동안 지라옵스 내에는 이벤트 타임라인이 만들어진다. 자동으로 장애 후 검토 문서 내에 추가되며, 주요 내용은 상태 변화, 슬랙 메시지, 아틀라시안의 장애 소통 툴 '스테이터스페이지(Statuspage) 게시물 등이다.

기존까지는 이런 정보를 수작업으로 대조하는 데만 몇 시간이 걸렸다. 아틀라시안 이슈 관리 제품 마케팅 총괄 임원이자 스테이터스페이지의 공동 설립자인 대니 올린스키는 "이런 정보를 장애 후 검토용 컨플루언스로 가져와, 그동안 많은 시간이 걸리고 관리하기 어려웠던 작업을 줄여준다"라고 말했다. 장애 후 검토 분석을 마치고 문서화가 끝나면, 해당 장애 사건은 컨플루언스에서 '실행 아이템을 추적하고 다음번을 위해 개선하는' 단계로 넘어간다.

포레스터의 수석 데브옵스 애널리스트 찰스 베츠는 "지라옵스는 서비스 관리 등을 포함한 소스 제어 작업을 통해, 가볍지만 포괄적인 디지털 파이프라인을 만들고자 하는 아틀라시안의 전략과 잘 부합한다. 특히 이 장애 후 검토 기능은 다른 시스템에서 관련 문서를 추출한 후 제품 백로그에 추가해 전체 배포 과정의 효율성과 신뢰성을 향상한다"라고 말했다.

이처럼 장애 후 검토 절차가 간편해지면 더 많은 기업이 시스템 장애에 대해 고객과 투명하게 소통할 수 있다. 시스템 장애의 원인뿐만 아니라 이를 해결하기 위해 한 조치를 쉽게 설명할 수 있기 때문이다. 올린스키는 "장애 대응 정보를 더 쉽게 확인할 수 있으면, 관련 팀이 이를 이용해 장애 후 검토를 더 강화할 수 있다. 이를 통해 더 투명한 소통이 가능해진다. 단순히 고객에게 언제 장애가 발생했다고 알리는 것을 넘어 '이러이러한 일이 벌어졌고 현재 이런 조처를 하고 있다'라고 후속 조치를 안내하는 것도 가능하다"라고 말했다.

지라옵스는 현재 일부 기업에만 제한적으로 사용이 허가됐다. 2019년 상반기 중 정식 출시할 예정이다. 한편 아틀라시안은 지난 9월 인수한 장애 알림 툴 옵스지니(OpsGenie)용 자동화된 액션도 공개했다. 이 신기능은 EC2 인스턴스 같은 AWS 클라우드 리소스용 관리 콘솔인 'AWS 시스템 매니저(AWS Systems Manager)'와 통합해, 서버 재시작 같은 소프트웨어 장애 대응 작업을 자동화한다. ciokr@idg.co.kr


2018.12.19

아틀라시안, 지라옵스에 '장애 후 검토' 기능 추가

Matthew Finnegan | Computerworld
아틀라시안(Atlassian)이 자사의 이슈 관리 툴 '지라옵스(JiraOps)'에 '장애 후 검토(postmortem)' 기능을 추가했다. 이를 이용하면 IT팀이 주요 소프트웨어 장애에 어떻게 대응했는지를 쉽게 재검토할 수 있다.
 
© Getty Images Bank

지라옵스는 지난 9월 바르셀로나에서 열린 아틀라시안의 사용자 대상 행사에서 처음 공개됐다. 지라 이슈 추적 툴을 IT 운영팀에 맞춰 수정한 솔루션이다. 업체 측은 이를 한 곳에서 장애에 대응하고 그 해법을 연결해 모든 장애에 대해 일관된 대응이 가능한 제품이라고 설명했다. 

이후 아틀라시안은 이 제품에 신기능을 몇 가지 더 추가했다. 장애 후 검토 문서 작성을 간소화한 기능이 대표적이다. 보통 장애를 해결한 이후에는 소홀히 넘어가기 쉽다. 반면 지라옵스 사용자는 아틀라시안 콘텐츠 협업 툴 '컨플루언스(Confluence) 내에서 쉽게 장애 후 검토 문서를 만들 수 있다. 장애 개요와 근본 원인, 시사점 같은 주요 정보를 작성할 수 있는 템플릿도 제공한다. 장애 대응 과정 동안 지라옵스 내에는 이벤트 타임라인이 만들어진다. 자동으로 장애 후 검토 문서 내에 추가되며, 주요 내용은 상태 변화, 슬랙 메시지, 아틀라시안의 장애 소통 툴 '스테이터스페이지(Statuspage) 게시물 등이다.

기존까지는 이런 정보를 수작업으로 대조하는 데만 몇 시간이 걸렸다. 아틀라시안 이슈 관리 제품 마케팅 총괄 임원이자 스테이터스페이지의 공동 설립자인 대니 올린스키는 "이런 정보를 장애 후 검토용 컨플루언스로 가져와, 그동안 많은 시간이 걸리고 관리하기 어려웠던 작업을 줄여준다"라고 말했다. 장애 후 검토 분석을 마치고 문서화가 끝나면, 해당 장애 사건은 컨플루언스에서 '실행 아이템을 추적하고 다음번을 위해 개선하는' 단계로 넘어간다.

포레스터의 수석 데브옵스 애널리스트 찰스 베츠는 "지라옵스는 서비스 관리 등을 포함한 소스 제어 작업을 통해, 가볍지만 포괄적인 디지털 파이프라인을 만들고자 하는 아틀라시안의 전략과 잘 부합한다. 특히 이 장애 후 검토 기능은 다른 시스템에서 관련 문서를 추출한 후 제품 백로그에 추가해 전체 배포 과정의 효율성과 신뢰성을 향상한다"라고 말했다.

이처럼 장애 후 검토 절차가 간편해지면 더 많은 기업이 시스템 장애에 대해 고객과 투명하게 소통할 수 있다. 시스템 장애의 원인뿐만 아니라 이를 해결하기 위해 한 조치를 쉽게 설명할 수 있기 때문이다. 올린스키는 "장애 대응 정보를 더 쉽게 확인할 수 있으면, 관련 팀이 이를 이용해 장애 후 검토를 더 강화할 수 있다. 이를 통해 더 투명한 소통이 가능해진다. 단순히 고객에게 언제 장애가 발생했다고 알리는 것을 넘어 '이러이러한 일이 벌어졌고 현재 이런 조처를 하고 있다'라고 후속 조치를 안내하는 것도 가능하다"라고 말했다.

지라옵스는 현재 일부 기업에만 제한적으로 사용이 허가됐다. 2019년 상반기 중 정식 출시할 예정이다. 한편 아틀라시안은 지난 9월 인수한 장애 알림 툴 옵스지니(OpsGenie)용 자동화된 액션도 공개했다. 이 신기능은 EC2 인스턴스 같은 AWS 클라우드 리소스용 관리 콘솔인 'AWS 시스템 매니저(AWS Systems Manager)'와 통합해, 서버 재시작 같은 소프트웨어 장애 대응 작업을 자동화한다. ciokr@idg.co.kr


X