2014.08.12

“PC 같은 태블릿” 엔비디아, 64비트 테그라 K1 성능 공개

Mark Hachman | PCWorld
엔비디아는 자사의 테그라 K1 프로세서의 64비트 덴버 버전이 태블릿 폼팩터로 PC와 같은 성능을 제공할 수 있을 것으로 기대하고 있다. 그리고 이런 기대를 뒷받침하는 첫 번째 벤치마크 결과를 공개했다.

미국 산호세에서 열린 핫칩 컨퍼런스에서 엔비디아는 자사의 쿼드코어 32비트 테그라 K1 프로세서와 64비트 듀얼코어 버전 간의 눈에 띄는 차이를 소개했다. 32비트 테그라 K1은 이미 출시되어 최근 에이서 크롬북 13 등에 탑재된 반면, 64비트 덴버 버전은 아직 출시 전이다. 덴버의 정식 출시 버전은 최대 2.5GHz 클럭 속도로 최대 2.3GHz인 32비트 테그라 K1보다 조금 더 빠른 속도로 동작한다.



엔비디아의 덴더 칩은 또한 ARMv8 아키텍처를 사용하는 초기 프로세서 중 하나로, 현재 시장에서 매우 귀한 제품이다. ARM은 이미 2세대 64비트 아키텍처로 옮겨가고 있지만, 아직 ARM 라이선스 업체들은 64비트 프로세서의 개발과 생산에는 더딘 움직임을 보이고 있다.

엔비디아의 칩 아키텍트 다렐 보그스에 따르면, 덴버 칩과 32비트 테그라 K1은 동일한 192코어 케플러 그래픽 코어를 사용해 K1의 성능을 보완한다. 하지만 64비트 덴버 칩은 프로세서 최적화가 포함되어 있어 클럭 사이클 당 처리할 수 있는 명령어의 수가 7개까지 늘어난다. 32비트 버전은 최대 3개까지 처리할 수 있다. 보그스는 덴버가 콘텐츠 제작과 게임에 맞춰 설계됐다고 덧붙였다.

덴버 아키텍처의 특징 중 하나는 동적 코드 최적화(Dynamic Code Optimization)으로, 이 컴퓨팅 기법은 2000년대 초 주목을 받았던 트랜스메타(Transmeta)의 기술을 라이선스한 것이다. 트랜스메타는 코드 번역과 최적화를 사용해 기대를 모았지만, 사용자들이 기대하는 만큼의 성능 향상을 제공하지 못하면서 실패하고 말았다.

보그스는 이에 대해 네이티브 코드의 실행과 번역된 코드의 실행 간에는 이른바 ‘절벽’ 같은 것이 있다고 설명하며, 덴버는 비네이티브 코드를 실행할 좀 더 강력한 하드웨어 플랫폼을 갖춤으로써 이런 문제를 해결했다고 밝혔다.



또한 코드를 번역하는 프로세스를 시작히기 위해서는 프로세서의 코어가 대기 모드에 들어갈 때를 기다리며, 32비트 K1이 제공하는 것보다 향상된 새로운 저전력 상태도 포함되어 있다. 보그스는 “테그라에서는 트랜스메타 디바이스에서와 같은 문제를 볼 수 없을 것”이라고 강조했다.

덴버 칩은 128KB 4웨이 1레벨 명령어 캐시와 64KB 4웨이 2레벨 데이터 캐시, 그리고 2MB의 16웨이 2레벨 캐시가 포함되어 있으며, 이들 캐시는 테그라 코어와 케플러 코어 모두가 사용한다. 이와 함께 덴버는 128MB의 메인 메모리를 번역 캐시용으로 따로 두고 있는데, 주 운영체제는 이 메모리를 볼 수도 없고 메모리에 액세스할 수도 없다.

엔비디아는 64비트 덴버 프로세서와 32비트 버전, 그리고 경쟁 프로세서를 비교한 성능 벤치마크 결과를 발표했는데, 보그스는 “실질적으로 PC급의 성능을 ARM 생태계에서 구현하고 있다”고 강조했다.  editor@itworld.co.kr


2014.08.12

“PC 같은 태블릿” 엔비디아, 64비트 테그라 K1 성능 공개

Mark Hachman | PCWorld
엔비디아는 자사의 테그라 K1 프로세서의 64비트 덴버 버전이 태블릿 폼팩터로 PC와 같은 성능을 제공할 수 있을 것으로 기대하고 있다. 그리고 이런 기대를 뒷받침하는 첫 번째 벤치마크 결과를 공개했다.

미국 산호세에서 열린 핫칩 컨퍼런스에서 엔비디아는 자사의 쿼드코어 32비트 테그라 K1 프로세서와 64비트 듀얼코어 버전 간의 눈에 띄는 차이를 소개했다. 32비트 테그라 K1은 이미 출시되어 최근 에이서 크롬북 13 등에 탑재된 반면, 64비트 덴버 버전은 아직 출시 전이다. 덴버의 정식 출시 버전은 최대 2.5GHz 클럭 속도로 최대 2.3GHz인 32비트 테그라 K1보다 조금 더 빠른 속도로 동작한다.



엔비디아의 덴더 칩은 또한 ARMv8 아키텍처를 사용하는 초기 프로세서 중 하나로, 현재 시장에서 매우 귀한 제품이다. ARM은 이미 2세대 64비트 아키텍처로 옮겨가고 있지만, 아직 ARM 라이선스 업체들은 64비트 프로세서의 개발과 생산에는 더딘 움직임을 보이고 있다.

엔비디아의 칩 아키텍트 다렐 보그스에 따르면, 덴버 칩과 32비트 테그라 K1은 동일한 192코어 케플러 그래픽 코어를 사용해 K1의 성능을 보완한다. 하지만 64비트 덴버 칩은 프로세서 최적화가 포함되어 있어 클럭 사이클 당 처리할 수 있는 명령어의 수가 7개까지 늘어난다. 32비트 버전은 최대 3개까지 처리할 수 있다. 보그스는 덴버가 콘텐츠 제작과 게임에 맞춰 설계됐다고 덧붙였다.

덴버 아키텍처의 특징 중 하나는 동적 코드 최적화(Dynamic Code Optimization)으로, 이 컴퓨팅 기법은 2000년대 초 주목을 받았던 트랜스메타(Transmeta)의 기술을 라이선스한 것이다. 트랜스메타는 코드 번역과 최적화를 사용해 기대를 모았지만, 사용자들이 기대하는 만큼의 성능 향상을 제공하지 못하면서 실패하고 말았다.

보그스는 이에 대해 네이티브 코드의 실행과 번역된 코드의 실행 간에는 이른바 ‘절벽’ 같은 것이 있다고 설명하며, 덴버는 비네이티브 코드를 실행할 좀 더 강력한 하드웨어 플랫폼을 갖춤으로써 이런 문제를 해결했다고 밝혔다.



또한 코드를 번역하는 프로세스를 시작히기 위해서는 프로세서의 코어가 대기 모드에 들어갈 때를 기다리며, 32비트 K1이 제공하는 것보다 향상된 새로운 저전력 상태도 포함되어 있다. 보그스는 “테그라에서는 트랜스메타 디바이스에서와 같은 문제를 볼 수 없을 것”이라고 강조했다.

덴버 칩은 128KB 4웨이 1레벨 명령어 캐시와 64KB 4웨이 2레벨 데이터 캐시, 그리고 2MB의 16웨이 2레벨 캐시가 포함되어 있으며, 이들 캐시는 테그라 코어와 케플러 코어 모두가 사용한다. 이와 함께 덴버는 128MB의 메인 메모리를 번역 캐시용으로 따로 두고 있는데, 주 운영체제는 이 메모리를 볼 수도 없고 메모리에 액세스할 수도 없다.

엔비디아는 64비트 덴버 프로세서와 32비트 버전, 그리고 경쟁 프로세서를 비교한 성능 벤치마크 결과를 발표했는데, 보그스는 “실질적으로 PC급의 성능을 ARM 생태계에서 구현하고 있다”고 강조했다.  editor@itworld.co.kr


X