2009.05.11

엔비디아 쿠다(CUDA) 툴킷 2.2 발표

편집부 | CIO

2009년 5월 11일(월요일) ? 병렬 컴퓨팅 아키텍쳐인 쿠다(CUDA)를 통해 ‘GPU 혁명’을 가속화하고 있는 엔비디아(kr.nvidia.com, 지사장 이용덕)는 GPU 컴퓨팅을 위한 쿠다 툴킷(CUDA Toolkit) 2.2버전과 소프트웨어 개발 킷(SDK)을 발표했다고 밝혔다.

 

이번 최신 버전은 엔비디아의 대규모 병렬 쿠다 기반 GPU에서 최상의 성능을 끌어낼 수 있는 여러 가지 새로운 주요 기능이 추가되었으며, GPU 컴퓨팅을 지원하는 차기 OS인 마이크로소프트의 윈도우(Windows) 7을 지원하게 된다.

 

쿠다 툴킷 2.2에서 추가된 새로운 주요 기능은 다음과 같다.

 

?GPU용 비주얼 프로파일러(Visual Profiler)

쿠다 비주얼 프로파일러(CUDA Visual Profiler)는 GPU상에서 가동되는 C 어플리케이션을 프로파일링하는 그래픽 툴이다. 일반적으로 어플리케이션 성능 튜닝은 어플리케이션 프로파일링을 한 후 코드 수정 단계로 진행되며, 쿠다 비주얼 프로파일러 최신 버전은 메모리 트랜스액션을 위한 메트릭스(metrics)를 포함하고 있어, 성능 향상을 위해 튜닝할 때 가장 중요한 부분 중 하나를 개발자들이 시각적으로 확인할 수 있도록 한다.

 

?향상된 오픈GL 연동(OpenGL Interop)

각각 다른 GPU상에서 쿠다로 컴퓨팅하고 오픈GL을 통해 렌더링을 하게 될 때, 쿼드로(Quadro) GPU에서 가동되는 의료 영상(Medical Imaging)을 비롯한 기타 오픈GL 어플리케이션 성능이 향상된다.

 

?피치 선형 메모리(Pitch Linear Memory) 텍스처

비디오 프로세싱 어플리케이션에서 최대 2x 메모리 대역 절감 효과가 있다.

 

?제로 카피(Zero-copy)

쿠다 기능이 핀형 시스템 메모리(pinned system memory)에서 직접 읽고 쓸 수 있도록 함으로써, 미디어 스트리밍, 비디오 트랜스코딩, 이미지 처리 및 신호 처리 어플리케이션의 성능을 크게 개선한다. 이를 통해 GPU와 CPU 메모리 간 복사되는 데이터 빈도와 양이 줄어들게 되며, MCP7X, GT200 및 최신 GPU에서 지원하게 된다.

 

?핀형 공유 시스템 메모리(Pinned Shared Sysmem)

멀티 GPU를 사용하는 어플리케이션의 성능을 향상시키고, 다수의 GPU가 시스템 메모리 내 동일 데이터를 액세스하도록 하여 사용되는 총 시스템 메모리가 줄어들게 된다. 전형적인 멀티 GPU 시스템으로는 테슬라(Tesla) 서버, 테슬라 퍼스널 수퍼컴퓨터, 쿼드로플렉스(QuadroPlex) 데스크사이드 유닛을 사용하는 워크스테이션, 멀티 GPU를 사용하는 소비자 시스템 등이 있다.

 

?윈도우 비스타에서 비동기식 메모리 복사 지원

메모리를 비동기식으로 복사하여 어플리케이션 성능을 크게 개선할 수 있도록 한다. 이 기능은 다른 지원 플랫폼에서 이미 제공되고 있고 있는 기능이며, 이번 버전을 통해 이제 비스타에서도 사용이 가능해졌다.

 

?GPU용 하드웨어 디버거(debugger)

개발자들은 이제 쿠다 기반 GPU에서 하드웨어 레벨 디버거를 사용할 수 있다. 인기 있는 오픈 소스 GDB 디거버만큼 간단하면서도 GPU에서 1000여 개의 쓰레드를 실행하는 프로그램을 디버깅할 수 있다. 이 리눅스용 쿠다 GDB 디버거는 GPU에서 직접 디버깅할 수 있도록 하며, 브레이크포인트 설정, 변수 관찰, 상태 검사 등의 기능이 포함된다.

 

?독점 디바이스 모드(Exclusive Device Mode)

독점 디바이스 모드 구성 옵션은, 하나의 어플리케이션이 하나의 GPU를 독점적으로 사용할 수 있도록 하며, 이 모드를 사용하면 GPU의 프로세싱 능력과 메모리 100%가 해당 어플리케이션에 투입된다. 다수의 어플리케이션이 동시에 시스템에서 가동될 수 있지만, 각각의 GPU 에서는 하나의 어플리케이션만이 사용될 수 있다. 이 구성 옵션은 특히 대용량 어플리케이션이 리눅스 클러스터의 각 노드(node)에서 한 개 이상의 GPU를 독점 사용해야 하는 테슬라 클러스터 시스템에 유용하다.

 

최신 버전의 쿠다 툴킷, 소프트웨어 개발 툴킷 및 드라이버를 다운로드 받기 위해서는 쿠다 개발자를 위한 엔비디아 쿠다 존(http://kr.nvidia.com/cuda)을 방문하면 된다. (뉴스검색제공제외)



2009.05.11

엔비디아 쿠다(CUDA) 툴킷 2.2 발표

편집부 | CIO

2009년 5월 11일(월요일) ? 병렬 컴퓨팅 아키텍쳐인 쿠다(CUDA)를 통해 ‘GPU 혁명’을 가속화하고 있는 엔비디아(kr.nvidia.com, 지사장 이용덕)는 GPU 컴퓨팅을 위한 쿠다 툴킷(CUDA Toolkit) 2.2버전과 소프트웨어 개발 킷(SDK)을 발표했다고 밝혔다.

 

이번 최신 버전은 엔비디아의 대규모 병렬 쿠다 기반 GPU에서 최상의 성능을 끌어낼 수 있는 여러 가지 새로운 주요 기능이 추가되었으며, GPU 컴퓨팅을 지원하는 차기 OS인 마이크로소프트의 윈도우(Windows) 7을 지원하게 된다.

 

쿠다 툴킷 2.2에서 추가된 새로운 주요 기능은 다음과 같다.

 

?GPU용 비주얼 프로파일러(Visual Profiler)

쿠다 비주얼 프로파일러(CUDA Visual Profiler)는 GPU상에서 가동되는 C 어플리케이션을 프로파일링하는 그래픽 툴이다. 일반적으로 어플리케이션 성능 튜닝은 어플리케이션 프로파일링을 한 후 코드 수정 단계로 진행되며, 쿠다 비주얼 프로파일러 최신 버전은 메모리 트랜스액션을 위한 메트릭스(metrics)를 포함하고 있어, 성능 향상을 위해 튜닝할 때 가장 중요한 부분 중 하나를 개발자들이 시각적으로 확인할 수 있도록 한다.

 

?향상된 오픈GL 연동(OpenGL Interop)

각각 다른 GPU상에서 쿠다로 컴퓨팅하고 오픈GL을 통해 렌더링을 하게 될 때, 쿼드로(Quadro) GPU에서 가동되는 의료 영상(Medical Imaging)을 비롯한 기타 오픈GL 어플리케이션 성능이 향상된다.

 

?피치 선형 메모리(Pitch Linear Memory) 텍스처

비디오 프로세싱 어플리케이션에서 최대 2x 메모리 대역 절감 효과가 있다.

 

?제로 카피(Zero-copy)

쿠다 기능이 핀형 시스템 메모리(pinned system memory)에서 직접 읽고 쓸 수 있도록 함으로써, 미디어 스트리밍, 비디오 트랜스코딩, 이미지 처리 및 신호 처리 어플리케이션의 성능을 크게 개선한다. 이를 통해 GPU와 CPU 메모리 간 복사되는 데이터 빈도와 양이 줄어들게 되며, MCP7X, GT200 및 최신 GPU에서 지원하게 된다.

 

?핀형 공유 시스템 메모리(Pinned Shared Sysmem)

멀티 GPU를 사용하는 어플리케이션의 성능을 향상시키고, 다수의 GPU가 시스템 메모리 내 동일 데이터를 액세스하도록 하여 사용되는 총 시스템 메모리가 줄어들게 된다. 전형적인 멀티 GPU 시스템으로는 테슬라(Tesla) 서버, 테슬라 퍼스널 수퍼컴퓨터, 쿼드로플렉스(QuadroPlex) 데스크사이드 유닛을 사용하는 워크스테이션, 멀티 GPU를 사용하는 소비자 시스템 등이 있다.

 

?윈도우 비스타에서 비동기식 메모리 복사 지원

메모리를 비동기식으로 복사하여 어플리케이션 성능을 크게 개선할 수 있도록 한다. 이 기능은 다른 지원 플랫폼에서 이미 제공되고 있고 있는 기능이며, 이번 버전을 통해 이제 비스타에서도 사용이 가능해졌다.

 

?GPU용 하드웨어 디버거(debugger)

개발자들은 이제 쿠다 기반 GPU에서 하드웨어 레벨 디버거를 사용할 수 있다. 인기 있는 오픈 소스 GDB 디거버만큼 간단하면서도 GPU에서 1000여 개의 쓰레드를 실행하는 프로그램을 디버깅할 수 있다. 이 리눅스용 쿠다 GDB 디버거는 GPU에서 직접 디버깅할 수 있도록 하며, 브레이크포인트 설정, 변수 관찰, 상태 검사 등의 기능이 포함된다.

 

?독점 디바이스 모드(Exclusive Device Mode)

독점 디바이스 모드 구성 옵션은, 하나의 어플리케이션이 하나의 GPU를 독점적으로 사용할 수 있도록 하며, 이 모드를 사용하면 GPU의 프로세싱 능력과 메모리 100%가 해당 어플리케이션에 투입된다. 다수의 어플리케이션이 동시에 시스템에서 가동될 수 있지만, 각각의 GPU 에서는 하나의 어플리케이션만이 사용될 수 있다. 이 구성 옵션은 특히 대용량 어플리케이션이 리눅스 클러스터의 각 노드(node)에서 한 개 이상의 GPU를 독점 사용해야 하는 테슬라 클러스터 시스템에 유용하다.

 

최신 버전의 쿠다 툴킷, 소프트웨어 개발 툴킷 및 드라이버를 다운로드 받기 위해서는 쿠다 개발자를 위한 엔비디아 쿠다 존(http://kr.nvidia.com/cuda)을 방문하면 된다. (뉴스검색제공제외)



X