Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

추론

인공 지능을 위한 포괄적 추론 시스템의 요구와 과제

인공 지능(AI) 기술이 기업 영역에서 확산됨에 따라, 지속 가능하며 성공적인 방식으로 AI 기술을 구현하는 방법에 관한 논의가 활발하게 이뤄지고 있습니다. 한 가지 중요한 고려 사항은 특히 추론 워크로드의 규모와 복잡성이 확장되는 상황에서 AI 이니셔티브를 대규모로 구현할 때 필요한 IT 인프라입니다. 추론은 AI 프로세스에 가치를 더하는 단계지만, 실시간 의사 결정의 필요성과 추론이 수행되는 많은 위치를 고려하면 상당히 어려운 과정이 될 수 있습니다. 따라서 AI를 도입하는 기업은 차세대 추론 워크로드의 필수 요소인 속도와 유연성, 소프트웨어 지원을 제공하는 포괄적 추론 시스템을 사용하여 인프라를 강화하는 것이 중요합니다. <14p> 주요 내용 - AI 이니셔티브의 혜택과 고려할 점 - AI 프로세스 3단계:데이터, 학습, 추론 - 추론의 성장 - 대규모 추론에서의 과제 - 미래의 추론 시스템 - 결론/권장 사항

머신러닝 추론 양적추론 2021.01.06

IBM Power System IC922 : 데이터시트

조직의 AI 여정이 진행됨에 따라 AI 이니셔티브는 훈련 단계에서 추론 단계로 전환됩니다. AI를 구현하려면 단계마다 다양한 인프라 요구사항이 충족되어야 하므로 다목적 AI 서버가 훈련과 추론 둘 다에 가장 적합한 것은 아닐 수 있습니다. 조직은 IT 인프라를 평가하여 AI의 모든 단계에 적합한지 확인해야 합니다. 그렇지 않으면 AI 프로젝트가 실패로 돌아갈 위험이 있습니다. AI 추론을 위해 설계된 IBM Power System IC922는 훈련된 AI 모델에서 비즈니스 인사이트를 확보하는 데 필요한, 컴퓨팅 집약적이고 Latency가 짧은 인프라를 제공합니다. <3p> 주요 내용 - 우수한 IO 및 메모리 대역폭 - AI에 최적화된 하드웨어 및 소프트웨어 스택 지원 - 모듈식으로 비즈니스 요구에 맞게 확장 가능 - AI 여정에 필요한 엔터프라이즈급 보안 및 지원 제공

PowerSystem AI 훈련 2020.07.02

도미노 피자 배달 속도에 기여한 AI 이야기

인공지능)과 머신러닝이라는 단어를 들으면 우주 탐사와 생물 의학처럼 연구 개발에 크게 의존하는 선진 산업이 떠오른다. 그러나 사실 AI와 머신러닝은 모든 업계가 주시해야 하는 기술이다. 소매업도 마찬가지다. 현대는 고객 서비스의 시대이며, 서비스의 작은 차이로 인해 시장 점유율이 크게 달라질 수 있다. 지난 주 엔비디아는 연례 행사인 GPU 기술 컨퍼런스를 가상으로 개최했는데, 이 현장은 AI/머신러닝의 실제 사용례 쇼케이스가 되었다. 그간 이 행사는 매우 기술 중심으로 진행되었지만 이번에는 엔비디아가 수년에 걸쳐 첨단 기술로 기업 운영을 개선한 방법을 보여주는 이벤트로 발전했다.    AI/머신러닝으로 지점과 온라인 운영을 개선한 도미노 도미노는 AI와 머신러닝을 사용하는 방법을 보여준 대표적인 소매업체다. 도미노는 성공적인 운영 방식의 변화를 고안해냈다. 비법은 엔비디아의 기술로, 업계 선두의 피자 체인이 지점과 온라인 운영을 개선하고, 더 나은 고객 경험을 제공하고, 주문을 더 효율적으로 전달하게 된다.  그 결과 고객의 만족도와 함께 배달원이 받는 팁도 높아졌다. 그러나 여러 장점의 작은 일부일 뿐이다. 피자를 지점에서 주문한 사람의 집으로 배달하려면 어떤 과정을 거쳐야 할까? 대답은 꽤 복잡하다.    엔비디아 DGX-1 서버를 통한 AI/머신러닝 이니셔티브 가속화 도미노의 데이터 과학 부서는 딥 러닝 연구를 위한 통합 소프트웨어 및 하드웨어 시스템인 엔비디아의 DGX-1 서버를 활용해 사업의 속도와 효율성을 테스트했다. DGX 서버 라인에 익숙하지 않은 직원을 위해, 엔비디아는 기업이 쉽게 도입하고 즉시 사용할 수 있는 일련의 턴키 어플라이언스를 만들었다. 턴키 어플라이언스 없이는 하드웨어, 소프트웨어, AI 플랫폼을 통합하고 전체 시스템을 올바르게 조정하는 데 몇 주가 소요될 수 있다.  도미노 부서는 주문의 특성과 주문 시 직원, 관리자, 고객의 수와 같이 매장에서 발생하는 상황을 통해 ...

AI 엔비디아 도미노피자 2020.04.02

인텔, 너바나 AI 칩 개발 중단…하바나 제품군에 집중

인텔은 자사의 너바나(Nervana) 신경망 프로세서 개발을 중단하고 최근 20억 달러에 인수한 하바나 랩의 AI 제품군에 집중한다. 너바나로서는 너무 짧은 기간이었다.   인텔은 2016년 4억 달러를 주고 너바나를 인수하고 1년 후 첫 번째 신경망 프로세서를 출시했다. 너바나의 공동 설립자인 나빈 라오는 인텔에서 데이터 플랫폼 그룹의 일부인 AI 플랫폼 그룹을 맡았다. 인텔은 너바나 칩을 AI 시장에서 엔비디아 GPU의 경쟁자로 내세웠으며, 개발과 관련해 페이스북과 밀접한 협업을 진행하기도 했다. 이제 인텔은 너바나 NNP-T 칩 개발을 중단했다. 기존 고객에게는 약속대로 추론 칩인 NNP-I를 제공할 계획이다. 인텔은 이 영역에 하바나 랩의 가우디 프로세서와 고야 프로세서를 배치할 계획이다. 신경망은 학습과 추론 두 부분으로 구성된다. 학습은 컴퓨터가 이미지 인식처럼 프로세스를 배우는 과정이다. 추론은 학습된 시스템을 실제 작업에 투입하는 것이다. 학습이 추론보다 더 연산 집약적이며, 엔비디아가 뛰어난 영역이기도 하다. 인텔은 고개의 의견을 반영해 이런 결정을 내렸으며, 이번 결정이 자사의 데이터센터 AI 가속화 로드맵에 대한 전략 업데이트의 일환이라고 밝혔다. 인텔은 발표문을 통해 “하바나 제품군은 학습과 추론 모두에 통일성 있고 프로그래밍 가능한 아키텍처라는 강력하고 전략적인 이점을 제공한다. 데이터센터 AI 가속화를 단일 하드웨어 아키텍처와 소프트웨어 스택으로 교체하면서 인텔 개발팀은 힘을 합쳐서 더 많은 혁신을 더 빨리 고객에게 전달하는 데 집중할 수 있게 됐다”고 강조했다. 사실 이런 결과는 어느 정도 예상된 것이다. 티리아스 리서치의 사장 짐 맥그리거는 “한쪽은 학습용으로, 한쪽은 추론용으로 유지할지도 모른다고 생각했다. 하지만 하바나가 훨씬 더 잘 동작했고 아키텍처의 확장성도 더 좋았다. 그리고 인텔은 여전히 두 업체로부터 지적재산권과 전문 지식을 얻고 있다”고 평가했다. 희소식은 개발자가 너바나용으로 만든 것을 버릴 필...

라라비 인텔 학습 2020.02.07

올바르게 구현된 AI : 데이터-훈련-추론 AI 모델의 이해

데이터 사이언스 전문가가 아니더라도 엔터프라이즈 AI의 가장 복잡한 요소까지 이해하고 해석하여 실행에 옮길 수 있다면 어떨까요? 지금까지 엔터프라이즈 AI는 모델 개발 및 훈련에 정통한 분석 전문가들의 전유물로 여겨지곤 했습니다. 하지만 AI 중심의 이니셔티브가 비즈니스의 전 범위로 확장되면서 상황은 완전히 달라지고 있습니다. 이러한 변화의 선두에는 가치 기반의 AI 활동 프레임워크가 있습니다. 이것을 데이터-훈련-추론(Data-Train-Inference, DTI) AI 모델이라고 하는데, 본 문서에서는 이 AI 모델에 대해 설명하고자 합니다.  주요 내용 - 데이터에 관한 네 가지 진실 - 속도 및 정확성에 대한 요구와 해묵은 갈등 - 추론의 실례 - 모델의 완성

학습 인공지능 AI 2019.11.13

HPE-NVIDIA : AI 번들 오퍼링 북

인공지능 기술은 인간의 지각, 추론, 학습능력 등을 컴퓨팅 파워을 이용하여 구현하는 기술로, 자율주형, 지능형 금융서비스, 의료진단, 법률서비스 지원, 게임, 기사작성, 지능형 감시 시스템 등 다양한 산업분야에서 널리 활용되고 있습니다. HPE는 다양한 영역에서 AI 관련 연구를 지속적으로 수행해 왔습니다. 본 자료는 HPE가 제안하는 HPE Edge-to-Core AI 통합모델 구성을 살펴보고, HPE와 NVIDIA가 AI Training 및 Inference 전용으로 구성한 솔루션의 특징을 상세하게 소개합니다. <24p> 주요 내용 - 인공지능의 미래 및 HPE HPC/AI 연구여정 - HPE Edge-to-Core AI 통합 모델 구성도 - HPE-NVIDIA AI 오퍼링 - AI Training 용도 - HPE-NVIDIA AI 오퍼링 - AI Inference 용도 - HPE AI 최적화 제품 포트폴리오

학습 인공지능 에지 2019.09.30

"가능성과 역량 사이" 인텔 아이스 레이크의 AI 시연 현장

올 가을 인텔 아이스 레이크 탑재 노트북 컴퓨터를 구입하는 사용자는 곳곳에서, 그리고 점점 더 많이 ‘AI의 마법’을 체험하게 될 것이다. 아이스 레이크에서만 AI 기능을 이용할 수 있고, AI가 없으면 데스크탑 소프트웨어 성능이 크게 개선되지 않는다는 뜻은 아니다. 그러나 앱 개발자가 설계하는 놀라운 기능에는 인공 지능과 머신 러닝이 꼭 필요하다. 그리고 인텔은 10세대 코어 칩에 이 역량을 더했다. 몇 가지는 이미 공개된 적도 있는 기능이다. 마이크로소프트 사진(Photos) 앱을 예로 들 수 있다. AI 이미지 분석 기능으로 해변이나 눈 등 지금 보이는 피사체를 분석해 식별해준다. 마이크로소프트 사진 앱과 구글 포토 앱은 이미 사진에 담긴 물체를 식별해 하나의 카테고리로 묶을 수 있다. 사진 속 인물이 누구인지 인식한다. 하지만 AI라고 하면 PC의 코타나 같은 디지털 가상 비서를 떠올리고, 같은 기능을 상상하는 경우도 많다.이런 상황에서 인텔이 AI에 대한 생각을 재정립하는 시도를 하는 것이다.   AI의 역할 인텔은 컴퓨텍스 행사 전 브리핑에서 지금까지와 다른 AI 활용 사례를 제시했다. 재생되는 동안 실시간으로 영상을 꾸미는 기능이다. 스냅챗에서 필터를 적용, 통화나 채팅 때 원하지 않는 배경 노이즈를 없애는 기능과 비슷하다. 또 사이버링크 포토디렉터(CyberLink PhotoDirector) 10의 사진 블러 제거 기능을 가속화하는 시연도 있었다. 마이크로소프트의 스카이프와 팀즈 앱에는 이미 화상 통화 때 사용자를 식별하고, 배경을 바꾸거나 흐리게 만드는 기능이 들어 있다. AI는 이런 기능의 처리 속도를 높일 수 있다.   가우시안 뉴럴 엑셀러레이터(Gaussian Neural Accelerator)란? 인텔의 ‘비밀 소스’는 아이스 레이크 칩 패키지 속에 잘 조정된 논리 체계인, 이른바 가우시안 뉴럴 액셀러레이터다. 2가지 체계가 병행해 작동하는데, CPU 아키텍처가 DLB...

AI 10세대 추론 2019.05.29

엔비디아, 머신러닝 예측 스피드 가속화한 텐서RT 신제품 발표

엔비디아가 자체 GPU의 딥 러닝 모델을 사용해 추론을 제공하는 런타임 시스템 텐서RT의 새 버전을 출시했다. 훈련 모델을 통해 CPU나 GPU가 추론이나 예측을 제공한다. GPU에서의 추론은 엔비디아 프로세서 보급을 확대하려는 전략의 일환으로, 경쟁 업체 AMD가 엔비디아 머신러닝 GPU 시장 점유율 확대를 저지하기 위해 취하는 조처의 대책이기도 하다. 엔비디아는 GPU 기반 텐서RT가 CPU 전용 접근 방식보다 전반적으로 추론에 더 뛰어나다고 주장한다. 엔비디아가 제시한 벤치마크인 카페 프레임 워크의 AlexNet 이미지 분류 테스트에 따르면, 텐서RT는 넥서스 테슬라 P40 프로세서에서 실행할 때, 같은 테스트를 CPU전용 버전(초당 1만 6,041 이미지 vs.374)보다 42배 속도가 빨랐다. 엔비디아는 GPU 예측 모델은 전력 효율이 높으며 더 개선된 결과를 낸다고 주장헀다. 텐서RT는 엔비디아 자체 GPU 제품군 외의 다른 제품에서는 작동하지 않는 독점적 클로즈드소스 제품이다. 대조적으로 AMD는 머신러닝 가속화를 위해 ROCm 오픈소스 하드웨어 독립적 라이브러리를 통해 CPU를 활용한 머신러닝 애플리케이션에 대한 더 개방적인 접근 방식을 내놓고 있다. editor@itworld.co.kr  

AMD GPU 엔비디아 2017.06.28

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.