2017.11.22

IDG 블로그 | 클라우드 성능 문제를 진단하는 5단계

David Linthicum | InfoWorld
퍼블릭 클라우드 기반 워크로드가 너무 느리다면, 어디부터 살펴봐야 할까? 성능 문제 대부분의 근본 원인을 진단하는 즉석 지침을 소개한다.

Image Credit : GettyImagesBank

필자는 전통적인 시스템의 문제를 순식간에 진단해 내는 IT 인력 중 많은 수가 클라우드 기반 시스템을 진단하는 데 애를 먹는 경우를 드물지 않게 본다. 이유는 AWS나 마이크로소프트 애저 같은 퍼블릭 클라우드에 무엇이 있는지 심도 있게 이해하지 못하기 때문이다. 퍼블릭 클라우드를 마치 블랙박스 같은 것으로 여기는 것이다.

여기에 더해 퍼블릭 클라우드 서비스 업체가 제공하는 시스템 관리 툴과 API이 초보적이다. 하지만 IT 관리자는 어디를 살펴보고 어떤 툴을 사용해야 하는지 파악해야만 한다.

클라우드 성능은 복잡한 문제다. 클라우드가 본질적으로 복잡한 분산 시스템이기 때문이다. 하지만 여기 소개하는 5단계 진단 방법을 따르면, 문제의 원인을 찾을 수 있다. 1단계에서 원인을 찾아도 진단을 계속할 것을 권장한다. 성능에 영향을 미치는 다른 문제를 찾아낼 수도 있기 때문이다.

1. 워크로드를 지원하는 인프라를 점검한다.
시스템 모니터링 및 로그 분석 툴을 사용해 CPU와 스토리지 활용률을 확인한다. 범인일 가능성이 크다.

클라우드를 사용하는 많은 IT 전문가가 애플리케이션과 데이터베이스의 규모 확장에 필요한 CPU와 스토리지 증설에 실패한다. 퍼블릭 클라우드가 자동으로 사용자의 요구에 맞춰 확장될 것으로 생각하지만, 실제로는 그렇지 않다. 정말로 필요해지기 전에 추가 워크로드를 맡을 더 많은 서버를 설정해 프로비저닝해야 한다.

2. 애플리케이션 자체를 점검한다.
애플리케이션을 들여다 볼 수 있는 모니터링 툴은 많은데, 이중 하나를 반드시 사용할 것을 권장한다.

애플리케이션은 인프라만큼이나 성능 저하의 원인이 되는데, 클라우드 네이티브 기능을 사용할 수 있도록 리팩터링하거나 수정하지 않은 경우가 많기 때문이다. 이런 경우 클라우드 인프라를 사용하는 데 매우 비효율적인 애플리케이션이 되며, 성능 문제의 책임을 인프라에 잘못 돌리는 경우도 많다.

3. 성능 문제의 원인이 될 가능성이 적은 요소를 살펴본다.
이제 다른 요소를 살펴볼 차례이다. 보안 시스템을 보자. 암호화 서비스는 스토리지와 컴퓨팅을 잠식할 수 있다. 거버넌스 서비스와 성능 문제를 제일 먼저 알려주는 모니터링 서비스도 살펴보자. 필자는 이런 툴이 인프라를 과도하게 잠식하는 것을 보와 왔다.

4. 클라우드 내외부의 대역폭을 포함해 네트워크를 점검한다.
퍼블릭 클라우드 서비스는 개방된 인터넷을 통해 소비하기 때문에 종종 다른 패킷과 경합을 벌이곤 한다. 인터넷이 성능 저하의 원인인지 확인하려면, 핑 테스트는 물론 데이터도 올렸다 내려보자. 이때 클라우드 기반 워크로드가 전송하고 소비하는 것과 근사한 테스트를 사용하는 것이 좋다.

5. 사용자의 브라우저와 컴퓨터를 점검한다.
마지막으로 클라우드 기반 애플리케이션과 인터랙션하는 사용자의 브라우저에 문제가 있는 경우가 종종 있다.

악성코드나 암호화 문제도 있지만, 기본적으로 윈도우 PC와 맥에서 잘못될 수 있는 모든 것이 클라이언트 쪽에서 클라우드 성능을 느리게 만들 수 있다. 앞의 4단계를 완료했다면, 기술 지원팀에게 PC를 점검하도록 하자.  editor@itworld.co.kr


2017.11.22

IDG 블로그 | 클라우드 성능 문제를 진단하는 5단계

David Linthicum | InfoWorld
퍼블릭 클라우드 기반 워크로드가 너무 느리다면, 어디부터 살펴봐야 할까? 성능 문제 대부분의 근본 원인을 진단하는 즉석 지침을 소개한다.

Image Credit : GettyImagesBank

필자는 전통적인 시스템의 문제를 순식간에 진단해 내는 IT 인력 중 많은 수가 클라우드 기반 시스템을 진단하는 데 애를 먹는 경우를 드물지 않게 본다. 이유는 AWS나 마이크로소프트 애저 같은 퍼블릭 클라우드에 무엇이 있는지 심도 있게 이해하지 못하기 때문이다. 퍼블릭 클라우드를 마치 블랙박스 같은 것으로 여기는 것이다.

여기에 더해 퍼블릭 클라우드 서비스 업체가 제공하는 시스템 관리 툴과 API이 초보적이다. 하지만 IT 관리자는 어디를 살펴보고 어떤 툴을 사용해야 하는지 파악해야만 한다.

클라우드 성능은 복잡한 문제다. 클라우드가 본질적으로 복잡한 분산 시스템이기 때문이다. 하지만 여기 소개하는 5단계 진단 방법을 따르면, 문제의 원인을 찾을 수 있다. 1단계에서 원인을 찾아도 진단을 계속할 것을 권장한다. 성능에 영향을 미치는 다른 문제를 찾아낼 수도 있기 때문이다.

1. 워크로드를 지원하는 인프라를 점검한다.
시스템 모니터링 및 로그 분석 툴을 사용해 CPU와 스토리지 활용률을 확인한다. 범인일 가능성이 크다.

클라우드를 사용하는 많은 IT 전문가가 애플리케이션과 데이터베이스의 규모 확장에 필요한 CPU와 스토리지 증설에 실패한다. 퍼블릭 클라우드가 자동으로 사용자의 요구에 맞춰 확장될 것으로 생각하지만, 실제로는 그렇지 않다. 정말로 필요해지기 전에 추가 워크로드를 맡을 더 많은 서버를 설정해 프로비저닝해야 한다.

2. 애플리케이션 자체를 점검한다.
애플리케이션을 들여다 볼 수 있는 모니터링 툴은 많은데, 이중 하나를 반드시 사용할 것을 권장한다.

애플리케이션은 인프라만큼이나 성능 저하의 원인이 되는데, 클라우드 네이티브 기능을 사용할 수 있도록 리팩터링하거나 수정하지 않은 경우가 많기 때문이다. 이런 경우 클라우드 인프라를 사용하는 데 매우 비효율적인 애플리케이션이 되며, 성능 문제의 책임을 인프라에 잘못 돌리는 경우도 많다.

3. 성능 문제의 원인이 될 가능성이 적은 요소를 살펴본다.
이제 다른 요소를 살펴볼 차례이다. 보안 시스템을 보자. 암호화 서비스는 스토리지와 컴퓨팅을 잠식할 수 있다. 거버넌스 서비스와 성능 문제를 제일 먼저 알려주는 모니터링 서비스도 살펴보자. 필자는 이런 툴이 인프라를 과도하게 잠식하는 것을 보와 왔다.

4. 클라우드 내외부의 대역폭을 포함해 네트워크를 점검한다.
퍼블릭 클라우드 서비스는 개방된 인터넷을 통해 소비하기 때문에 종종 다른 패킷과 경합을 벌이곤 한다. 인터넷이 성능 저하의 원인인지 확인하려면, 핑 테스트는 물론 데이터도 올렸다 내려보자. 이때 클라우드 기반 워크로드가 전송하고 소비하는 것과 근사한 테스트를 사용하는 것이 좋다.

5. 사용자의 브라우저와 컴퓨터를 점검한다.
마지막으로 클라우드 기반 애플리케이션과 인터랙션하는 사용자의 브라우저에 문제가 있는 경우가 종종 있다.

악성코드나 암호화 문제도 있지만, 기본적으로 윈도우 PC와 맥에서 잘못될 수 있는 모든 것이 클라이언트 쪽에서 클라우드 성능을 느리게 만들 수 있다. 앞의 4단계를 완료했다면, 기술 지원팀에게 PC를 점검하도록 하자.  editor@itworld.co.kr


X