Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

딥러닝

GPU 병렬 프로그래밍 CUDA의 모든 것

CUDA와 GPU의 병렬 처리 능력을 활용하면 딥러닝을 포함한 컴퓨팅 집약적 애플리케이션을 가속화할 수 있다. CUDA 는 엔비디아가 자체 GPU에서의 일반 컴퓨팅을 위해 개발한 병렬 컴퓨팅 플랫폼이자 프로그래밍 모델이다, CUDA는 개발자가 연산의 병렬화할 수 있는 부분에 GPU의 성능을 활용해 컴퓨팅 집약적인 애플리케이션의 속도를 높일 수 있도록 해준다. OpenCL과 같이 GPU용 API도 있고, AMD 같은 다른 업체의 경쟁력 있는 GPU도 있지만, CUDA와 엔비디아 GPU의 조합은 딥러닝을 포함한 여러 애플리케이션 영역을 장악하고 있다. 이 조합은 또한 세계에서 가장 빠른 몇몇 슈퍼컴퓨터의 기반이기도 하다. 그래픽 카드는 PC만큼이나 오래 되었다고 할 수 있다. 물론, 어디까지나 1981년 IBM 모노크롬 디스플레이 어댑터를 그래픽 카드라고 간주하는 경우에 그렇다. 1988년이 되자 ATI(나중에 AMD에 인수)에가 16비트 2D VGA 원더 카드를 내놓았다. 1996년에는 3dfx 인터랙티브가 3D 그래픽 가속기를 출시해 1인칭 슈팅 게임인 퀘이크(Quake)를 최고 속도로 실행할 수 있게 되었다. 엔비디아는 1996년 다소 빈약한 제품으로 3D 액셀러레이터 시장 경쟁에 뛰어들었지만, 시간이 지나면서 그것만으로는 부족함을 알게 되었다. 1999년에 엔비디아는 처음으로 GPU라고 불린 최초의 그래픽 카드 ‘지포스 256’을 선보였다. 당시만 해도 GPU는 주로 게임을 위해서만 사용했다. 사람들이 수학, 과학, 공학에 GPU를 사용한 것은 더 시간이 지나고 나서였다. CUDA의 기원 2003년에 이안 벅이 이끄는 연구팀은 데이터 병렬 구조로 C를 확장해 최초로 널리 채택된 프로그래밍 모델인 브룩(Brook)을 공개했다. 벅은 이후 엔비디아에 합류해 2006년에 GPU 상의 범용 컴퓨팅을 위한 최초의 상용 솔루션인 CUDA의 출시를 주도한다. OpenCL vs. CUDA CUDA의 경쟁자인...

CUDA 병렬프로그래밍 딥러닝 2018.09.05

"데이터를 넣으면 인텔리전스가 나온다" 머신러닝 파이프라인 풀어보기

머신러닝(Machine Learning)을 보면 마술 상자가 생각난다. 데이터를 집어넣으면 예측이 나온다. 하지만 머신러닝에 마술은 없다. 데이터와 알고리즘, 그리고 알고리즘을 통해 데이터를 처리함으로써 만들어지는 모델이 있을 뿐이다. 머신러닝을 통해 데이터에서 실체적 인사이트를 도출하는 일을 하는 사람에게는 이 프로세스가 블랙박스처럼 느껴져서는 안 된다. 상자 내부에 대해 잘 이해할수록 데이터가 예측으로 변환되는 과정의 각 단계를 더 정확히 이해할 수 있고 예측이 갖는 힘은 더 강력해진다. 데브옵스 분야에는 소스 코드에서 배포에 이르기까지 소프트웨어의 진행 과정을 설명하는 “빌드 파이프라인”이란 것이 있다. 개발자에게 코드 파이프라인이 있다면, 데이터 과학자에게는 머신러닝 솔루션을 통해 흐르는 데이터 파이프라인이 있다. 이 파이프라인을 마스터하는 것은 머신러닝 자체를 세부적으로 파악하기 위한 효과적인 방법이다. 머신러닝을 위한 데이터 소스와 흡수 위키본 리서치(Wikibon Research)의 분석가 조지 길버트가 설명했듯이 머신러닝 파이프라인은 4개의 단계로 구성된다. 1. 데이터 흡수 2. 데이터 준비(데이터 탐색 및 거버넌스 포함) 3. 모델 학습 4. 예측 제공 머신러닝 파이프라인을 시작하기 위해서는 학습할 데이터와 학습을 수행할 알고리즘, 두 가지가 필요하다. 대부분의 경우 데이터는 다음과 같은 둘 중 하나의 형태로 제공된다. 1. 어딘가에서 이미 수집 및 집계 중인 라이브 데이터. 이 데이터를 사용해서 정기적으로 업데이트되는 예측을 수행할 계획이다. 2. 다운로드해서 그 상태 그대로 사용하거나, 기존 데이터 소스에서 ETL 작업을 통해 얻는 “동결된” 데이터 집합. 동결된 데이터의 경우 일반적으로 한 가지 종류의 처리만 한다. 이 데이터로 모델 학습을 수행하고 모델을 배포하며 필요에 따라 주기적으로 모델을 업데이트한다. 그러나 라이브 또는 &ldq...

인텔리전스 학습 예측 2018.08.14

IDG 블로그 | 헬스케어가 클라우드의 이점을 이용해야 하는 이유

최근 클라우드 서비스의 발전은 헬스케어 영역에 많은 가치를 가져다 준다. 하지만 정작 헬스케어 분야가 주목하지 않고 있다. 클라우드가 헬스케어 분야로 진출하고 있는데, 당연히 비용 절감 측면에서 상당한 파급효과를 가져다 준다. 하지만 이 분야에서 클라우드 컴퓨팅의 진정한 가치는 단순히 비용만이 아니다. 블랙북 리서치(Black Book Research)의 조사에 따르면, 93%의 병원 CIO가 HIPPA 준수 클라우드 인프라의 설정과 관리, 지원이 가능한 인력을 적극적으로 찾고 있다. 또한 블랙북의 설문조사에 응답한 병원 CIO의 91%는 클라우드 컴퓨팅이 헬스케어 데이터의 확산 속도에서 더 나은 민첩성과 환자 치료를 제공한다고 답했다. 하지만 헬스케어의 클라우드 컴퓨팅 활용은 가능한 것과 실제로 이루어진 것 사이에 엄청난 혁신 격차가 있다. 예를 들어, 환자 데이터가 있다. 대부분 헬스케어 조직과 서비스 업체, 관련 솔루션 업체는 규제와 관련되지 않은 이상, 더 나은, 더 적극적인 환자 데이터 관리를 추진하지 않는다. 운영 데이터나 비용 데이터, 전자 의료 기록(HER)에 대한 이야기가 아니다. 만약 헬스케어 시스템이 특정 방식으로 정보를 추출했다면, 의사와 환자 모두 환자의 건강과 예방 치료 및 처치에 대한 더 나은 인사이트를 얻을 수 있을 것이다. 이런 혁신적인 기능을 지원하는 클라우드 서비스는 현재 매우 저렴하다. 병원이 클라우드를 이용할 수 있는 상태가 되면서 치료와 처치, 환자 건강 분석의 완벽한 자동화를 향한 신속한 움직임에 착수할 시점이다. 이제 사후 대응 중심의 시스템에서 완전히 선제적인 시스템으로 바뀌어야 한다. 물론 헬스케어 분야에는 이런 혁신으로부터 떨어져 있는 영역이 있다. 하지만 대부분 연구개발 영역이며, 직접적인 환자 치료에 영향을 미치지는 않는다. 헬스케어 분야의 클라우드는 필자가 본 그 어떤 분야보다 더 큰 잠재력이 있다. 스마트워치나 휴대폰에서 모은 측정 정보와 모든 데이터를 딥러닝 지원 ...

병원 환자 치료 2018.08.08

바이두, 신형 칩 ‘쿤룬’으로 구글 TPU에 도전장…대형 AI 업체로 발돋움

중국 바이두가 인공지능 분야의 주요 기술업체로 빠르게 성장하고 있다. 바이두는 구글 TPU(Tensor Processing Unit)와 경쟁할 초강력 칩을 새로 발표하는 한편, 인텔과 광범위한 협력관계를 맺었다. 바이두의 신형 칩 쿤룬(Kunlun)은 클라우드에서 에지까지 폭넓게 사용할 수 있는 AI 칩으로, 다양한 AI 시나리오가 필요로 하는 성능 요구사항을 만족하는 데 중점을 두고 있다. 신형 칩의 발표도 바이두 크리에이트(Baidu Create) 행사에서 이루어졌는데, 이 행사는 내용이나 세션으로 볼 때 구글 I/O와 놀랄 만큼 비슷한 개발자 행사이다. 쿤룬은 바이두의 AI 생태계를 이용한 칩으로, 바이두의 AI 생태계는 검색 순위나 딥러닝 프레임워크 같은 AI 시라니오와 바이두 자체 오픈소스 딥러닝 프레임워크인 패들패들(PaddlePaddle)이 포함되어 있다. 쿤룬은 무인자동차부터 데이터센터까지 모든 곳에 사용할 수 있다. 현재까지 바이두는 818-300 훈련 칩과 818-100 추론 칩 2개이다. 바이두에 따르면, 쿤룬은 바이두가 지난 2011년 발표한 FPGA 기반 AI 가속칩보다 30배 이상 빠르다. 또한 100와트에 260테라플롭의 성능으로, 45테라플롭의 구글 TPU를 훨씬 앞선다고 주장했다. 쿤룬은 또한 오픈소스 딥러닝 알고리즘을 지원하는 데 더해 음성 인식이나 검색 순위, 자연어 처리, 자율 주행, 대규모 추천 등 다양한 AI 애플리케이션을 지원한다. 하지만 가장 중요한 요소, 즉 일반에 판매할 것인지 아니면 구글 TPU처럼 바이두의 서비스에서만 이용할 수 있는지는 밝히지 않았다. 바이두는 신형 칩과 함께 인텔과 다양한 AI 프로젝트를 함께 진행한다고 발표했다. 주요 프로젝트로는 FPGA 기반 워크로드 가속화, 인텔 제온 확장형 프로세서를 기반으로 한 딥러닝 프레임워크 등이 있다. 인텔은 바이두가 어떤 FPGA를 사용하는지 확인하지 않았지만, 최근 자사의 아리아(Arria) 제품군과 제온 서버 칩의 ...

인텔 AI 바이두 2018.07.12

IDG 블로그 | 흔히 저지르는 머신러닝 실수 3가지

필자는 대체로 클라우드 기반 머신러닝과 딥러닝, 그리고 AI를 적극 지지한다. 결국 사용자의 호출에 응답하고 이를 수행하는 인공지능과의 대화를 상상하지 못하면, 진정한 IT광이 될 수 없다. 그런데 필자는 클라우드 기반 머신러닝과 딥러닝을 잘못 적용하는 사례를 끊임없이 보고 있다. 분명 클라우드 기반 머신러닝은 언제든지 사용할 수 있는 기술이 되었다. 하지만 지혜롭게, 그리고 적절하게 사용해야 한다. 흔히 저지르는 머신러닝 관련 기술 세 가지를 소개한다. 지식 모델을 교육할 충분한 데이터를 제공하지 않는다 머신러닝은 학습없이는 아무런 가치가 없다. 머신러닝의 진정한 사용례는 막대한 양의 데이터에 알고리즘을 적용해 특정 패턴이 드러나면, 이런 패턴이 머신러닝 기반 애플리케이션을 훈련시키는 것이다. 따라서 데이터가 없으면 학습도 없다. 머신러닝 애플리케이션이 데이터를 수집해 점점 똑똑해질 수도 있지만, 처음에 어떻게 생각해야 하는지 시스템을 가르치기 위한 충분한 데이터가 있는 출발점이 필요하다. 예를 들어, 병원에서 사용하는 머신러닝 시스템이 있어서 환자가 병원에 머물러 있는 동안 사망할 확률을 이야기해준다고 생각해 보자. 최소한 10만 건 이상의 데이터가 없다면, 시스템이 말하는 확률은 0% 아니면 100%가 되어 아무런 도움이 되지 않을 것이다. 필요 없는 곳에 머신러닝을 사용한다 필자가 더 자주 보는 실패 사례로, 기업은 아무런 이유없이 애플리케이션 개발 비용을 서너 배 더 사용한다. 머신러닝 시스템을 사용해도 아무런 실익이 없는 사용례는 많다. 대부분 절차적 로직만으로도 충분히 잘 돌아가기 때문에, 예를 들어 회계 시스템이나 일정관리 시스템용으로 지식 기반을 구축하는 것은 과잉일 뿐이다. 게다가 이 때문에 애플리케이션은 훨씬 더 비효율적으로 돌아간다. 성능에 미치는 영향을 생각하지 않는다 애플리케이션에 머신러닝 시스템을 내장하는 것은 때로 애플리케이션을 훨씬 더 가치 있는 것으로 만들어 준다. 하지만 이 때문에 ...

애플리케이션 학습 AI 2018.07.02

파이어아이, 딥러닝에 기반한 새로운 이메일 보안기능 공개

파이어아이(www.fireeye.com)는 실제 사이버 공격에 사용된 기술 및 툴 분석을 기반으로 한층 개선된 ‘파이어아이 이메일 보안(FireEye Email Security) 솔루션’을 선보였다. 파이어아이 이메일 보안 솔루션은 흔한 악성코드부터 고도의 사이버 위협까지 다양한 공격으로부터 고객을 보호한다. 파이어아이 이메일 보안 솔루션은 딥러닝, 인공지능, 애널리틱스 기술 등 중요한 최신 기술을 기존 솔루션과 통합했다. 고객들은 파이어아이 이메일 보안 솔루션의 ▲타인 사칭 사이버 공격 탐지 및 예방 ▲피싱 사이버 공격 탐지 및 예방 ▲심층 관계 분석 ▲자동 경보 집계 ▲소급 탐지 등의 기능으로 사이버 위협에 대응할 수 있다. 파이어아이 이메일 보안제품 관리 부서 켄 배그널 부사장은 “사이버 공격자는 방어선을 피하기 위해 늘 이동하며, 새로운 기술을 개발하고 있는 만큼 이메일을 통한 진입은 기업이 가장 방어하기 어려운 경로 중 하나”라며 “파이어아이는 가장 고도화된 사이버 공격자들이 기존 솔루션들을 어떻게 우회하는지 파악하고 있으며, 이런 정보를 토대로 이메일 보안 솔루션을 개발해 고객들이 공격자들의 발전 속도에 뒤쳐지지 않고 대응할 수 있도록 지원한다”고 말했다. 파이어아이 이메일 보안 솔루션은 보안 툴과 위협 정보분석서비스를 결합한 파이어아이 힐릭스(FireEye Helix) 보안 운영 플랫폼, 자동화 시스템, 사고 관리 등을 통해 고객에게 위협 알림 경보부터 위협 요소 제거까지 사고 대응을 지원한다. editor@itworld.co.kr

파이어아이 딥러닝 2018.06.29

센서와 머신러닝 : 애플리케이션이 보고 듣고 느끼고 냄새를 맡고 맛을 보는 방법

딥 러닝과 머신러닝, 빨라진 CPU, 새로운 센서를 통해 이제 컴퓨터도 보고 듣고 느끼고 냄새를 맡고 맛을 보고 말을 할 수 있다. 모든 감각은 카메라와 같은 일종의 센서와 수학적 알고리즘, 보통 지도(supervised) 머신러닝 알고리즘과 모델의 형태로 구현된다. 컴퓨터에서 사용 가능한 감각은 다음과 같다. 보기 : 이미지 및 얼굴 인식 최근 이미지 및 얼굴 인식에 대한 연구를 통해 컴퓨터는 개체의 존재를 감지할 뿐만 아니라 여러 개의 비슷한 개체도 탐지할 수 있게 됐다. 다양한 오픈소스 릴리스를 통해 이 분야를 주도하는 기업은 페이스북과 구글이다. 페이스북은 동영상의 사물 감지를 목표로 연구 중이다. 컴퓨터 ‘시각’을 위한 기술 개체: • 페이스북 리서치: 개체 분할 학습 • 딥마스크(DeepMask) • 멀티패스 네트워크(Multipath Network) • 디텍트론(Detectron) • 텐서플로우(TensorFlow) 모델 얼굴: • 오픈페이스(OpenFace) 복합: • 오픈CV(OpenCV) 기기 사용: • 쥬부아(Jevois) 최근 많이 발전한 분야로, 이미지의 개체를 다른 개체와 분할할 수 있는 수준이다. 그러나 무언가를 발견하고 이를 다른 것으로부터 분할할 수 있다고 해서 그게 무엇인지 안다는 의미는 아니다. 무엇인지 알려면 사물을 인식하는 모델을 학습시켜야 한다. 강력한 툴이지만 극단적으로 많은 데이터를 필요로 한다. 그래서 페이스북과 구글은 경쟁에 대해서는 별로 걱정하지 않고 이러한 툴을 릴리스하고, 그 대가로 커뮤니티에서 개발되는 파생품과 연구의 혜택을 얻는다. 어차피 수백만 또는 수십억 개의 이미지뿐만 아니라 그 이미지를 처리할 컴퓨팅 성능까지 보유한 기업은 극소수에 불과하다. 본질적으로 머신러닝이나 딥 러닝을 사용한 개체 분류를 위해서는 양, 고양이 또는 무엇이든 다양...

센서 인공지능 AI 2018.04.02

텐서플로우 리뷰 : 더 좋아진 최고의 딥 러닝 라이브러리

버전 r1.5가 된 구글의 오픈소스 머신러닝 신경망 라이브러리는 더 많은 기능을 제공하고, 더 성숙해 졌으며, 배워서 사용하기도 더 쉬워졌다. 작년에 텐서플로우를 딥 러닝(Deep Learning) 프레임워크로 검토한 결과 사용하기에 너무 어렵다거나 너무 미성숙했다고 판단했다면, 다시 살펴봐야 할 때가 된 것 같다. 필자가 작년 10월 텐서플로우 r0.10을 리뷰한 이후, 구글의 딥 러닝용 오픈소스 프레임워크는 더욱 성숙해졌으며, 더 많은 알고리즘과 배치 옵션을 구현했으며, 프로그램 하기도 더 쉬워졌다. 텐서플로우는 이제 버전 r1.4.1(안정화 버전과 웹 문서), r1.5 (RC: Release Candidate), 그리고 선 공개 r1.6 (마스터 브랜치(Master Branch)와 데일리 빌드(Daily Build))까지 나와있다. 텐서플로우 프로젝트는 매우 활동적이었다. 대충 살펴보면, 깃허브(GitHub) 상의 텐서플로우 리포지토리는 현재 약 2만 7,000회의 커밋(Commit), 8만 5,000개의 스타, 그리고 4만 2,000번의 포크(Fork)를 기록하고 있다. 이런 숫자는 많은 작업과 관심을 반영하는 인상적인 수치들이며, Node.js 리포지토리의 활동을 뛰어 넘고 있다. 아마존이 강력하게 후원하고 있는, 필적할 만한 프레임워크인 MXNet은 7,000회 이하의 커밋, 약 12,000 개의 스타, 그리고 5,000번 이하의 포크로 훨씬 낮은 활동 수치를 보여주고 있다. 2017년 2월에 발표된 텐서플로우 r1.0 릴리즈에서 주목할 만한 또 다른 통계는 사람들이 6,000개 이상의 온라인 오픈소스 리포지토리에서 텐서플로우를 사용하고 있었다는 점이다. 텐서플로우의 특징 텐서플로우는 1년 전과 마찬가지로 손글씨 숫자 분류를 위한 DNN(Deep Neural Network), 이미지 인식, 워드 임베딩(Word Embedding), RNN(Recurrent Neural Network), 기계 번역을 위한 시퀀스 투 시퀀...

프레임워크 구글 딥러닝 2018.02.12

2018년 데이터 및 AI 트렌드 : 딥러닝, 데이터 거버넌스, 챗봇을 통해 과장 광고가 현실이 되다

2017년에 인공지능은 어디에서나 화제가 되었지만, 기계들의 세상이 되리라는 약속은 아직 실현되지 않았다. 화제성에 비해 실제 활용이 어느 정도 제한되었었다면, 2018년에는 달라질 것으로 보인다. 과장 광고가 현실이 되다 기업들은 이미 AI에 거액을 투자하고 있지만, 대부분은 아직 성과를 보지 못했다. 포레스터(Forrester)에 따르면, 55%의 기업이 아직 AI로부터 가시적인 사업 성과를 거두지 못했으며, 43%는 투자의 성공 여부를 판단하기에는 시기 상조라고 보고 있다고 한다. “AI 밀월 기간은 끝났다(The Honeymoon For AI Is Over)”라는 포레스터 보고서의 공동 저자 중 한 명인 미셸 고에츠는 “그 동안 많은 실험과 개념 증명이 있었지만, 현실은 이제야 AI가 무엇이고, 무엇을 할 수 있으며, 이러한 새로운 지능형 시스템 구축에 무엇이 필요한지 깨닫기 시작하고 있다”고 지적했다. 고에츠는 기업들이 기술에 투자할 때 명확한 사업 목표를 염두에 두어야 한다는 점을 파악하기 싲가했다고 덧붙였다. 이 과정에는 기업 소유주, 데이터 과학자 및 기술자들 전원이 참여해야 한다. 고에츠는 “기술의 기초를 어떻게 닦을지 뿐만 아니라 이를 통해 어떤 사업이 가능할지 고민하는 전문가를 갖추지 않으면 안될 것이다. 단순히 소규모 점진적 가치에 그치지 않는 목표를 정의할 수 없다면, AI에 대한 기회 비용이 너무 커서 투자 수익을 실현할 수 없을 것이다”라고 평가했다. AI 관련 신흥 사업 얀덱스 데이터 팩토리(Yandex Data Factory) CEO 제인 자발리쉬나도 고에츠와 의견이 같다. 그녀는 고급 데이터 과학에 대한 이해가 늘어남에 따라 디지털 위주 회사뿐만 아니라 전통적인 업계에도 성과가 날 것이라고 보고 있다. 그는 “그들은 흥미진진한 기술 투자가 전부가 아니며, AI는 사실 실용적인 사업 도구임을 이제 깨달았다. 201...

데이터 거버넌스 인공지능 2017.12.27

모든 데이터의 "미스터리"를 풀어줄 열쇠, GPU 컴퓨팅의 이해

수년 전, 벤처 투자자인 마크 앤더신은 '소프트웨어가 세상을 점령할 것'을 정확히 예측했다. 그러나 이제 데이터가 세상을 집어삼킬 예정이다. IDC에 따르면, 2025년에는 매년 생산되는 데이터가 180ZB에 달할 전망이다(2013년 4.4ZB). 최근까지 이런 데이터는 구조화 데이터로 열과 행으로 구성되어 있고, 쉽게 입력, 저장, 정렬할 수 있는 데이터다. 그러나 현재는 많은 데이터가 여러 웹사이트, 기기, 데이터베이스에서 생성된 비디오, 이미지, 그래픽 등 비구조화 데이터다. 구조화 및 비구조화 데이터는 기업과 기관이 고객을 더 잘 이해하고, 행동 패턴을 적용해 미래의 행동을 예측하고, 질병을 치료할 돌파구를 발견하고, 사회를 더 안전하게 만드는 등 여러 일에 도움을 줄 '열쇠'를 쥐고 있다. 데이터를 가지고 할 수 있는 일 이런 데이터 금광을 활용할 수 있는 인공 지능과 머신러닝이 부상했다. 알고리즘을 사용해 데이터를 훈련시켜 패턴을 찾는 기술들이다. 그런데 문제가 있다. 전통적인 CPU(Central Processing Units)는 이런 복잡하고 많은 데이터를 처리하기에 적합하지 않다. 이에 GPU(Graphics Processing Unit) 컴퓨팅이 부상하고 있다. GPU 기반의 서버가 딥 러닝 알고리즘을 중심으로 한 인공지능을 위한 데이터를 효과적으로 처리할 수 있는 필수 기술로 빠르게 부상하고 있다(CPU가 나머지 대부분을 처리하는 정도). CPU가 며칠, 또는 몇 시간에 처리할 비구조화 데이터를 GPU는 몇 분이면 충분하다. CPU는 경주용 자동차, GPU는 화물 트럭 GPU가 컴퓨팅이 '핫'한 신기술이기는 하지만, 완전히 새로운 기술은 아니다. 게임 관련 애플리케이션, 비디오 재생 및 분석과 관련해 수년 동안 사용된 기술이다. 데이터 어레이를 지원, 큰 데이터 어레이를 더 빠르게 처리할 수 있도록 만들어졌다. CPU를 경주용 자동차, GPU를 한 장소에서 다른 ...

엔비디아 머신러닝 딥러닝 2017.11.02

IDG 블로그 | 이제 클라우드에서 딥러닝에 빠질 시간

머신러닝이 여전히 인기가도를 달리고 있지만, 기업은 그 하위 영역인 딥러닝에서 더 큰 가치를 얻을 수 있다. AWS의 리인벤트(Re:invent) 컨퍼런스가 다가오면서 아마존이 발표할 내용에 대한 이런저런 예측이 쏟아지기 시작했다. 확실한 추측 중 하나는 AWS가 일종의 딥러닝 클라우드 서비스를 발표한다는 것이다. 물론 구글이나 마이크로소프트, IBM 역시 뒤를 바짝 쫓고 있다. 실제로 IBM과 마이크로소프트는 각각 브레인웨이브(Brainwave)와 분산 딥러닝(Distributed Deep Learning)이란 이름의 특별 딥러닝 프로젝트를 진행하고 있다. 그렇다면, 머신러닝과 딥러닝의 차이는 무엇인가? 간단히 말해 머신러닝은 보통 인공지능의 전략적인 애플리케이션을 다루고, 딥러닝은 대규모 데이터나 패턴에 대한 이해의 기초를 제공한다. 머신러닝은 대부분 퍼블릭 클라우드에서 이용할 수 있다. 이들 서비스는 기업이 필요로 하는 기본적인 AI 기능을 제공한다. 하지만 딥러닝을 위해서는 클라우드가 묻어둔 AI를 다시 꺼내와야 한다. 이제 기업은 컴퓨트와 스토리지를 저렴한 가격에 대여할 수 있기 때문이다. 하지만 딥러닝은 기업이 하고 있는 일을 더 잘 할 수 있도록 역량을 강화할 수 있다. 더 높은 정확성을 갖출 수 있으며, 무엇보다 중요한 것은 패턴이나 데이터 관찰을 통해 지식을 구축할 수 있는 역량을 제공한다. 더구나 딥러닝 시스템은 시간이 지날수록 더 좋아지며, 보통은 전문가팀보다 훨씬 뛰어나다. 물론 실질적인 적용 업무가 없다면 기술이 아무리 좋아도 의미가 없다. 이것이 AI의 오랜 고민거리이기도 하다. 오늘날 머신러닝은 전략 AI를 내장해 사용할 수 있도록 해 준다. 스팸메일을 인식해 쓰레기통으로 옮긴다거나 전자상거래 사이트에서 상품을 추천해 매출을 올리는 기능이 대표적이다. 하지만 딥러닝은 좀 더 중요하고 영향력이 큰 것에 중점을 두고 있다. 전형적인 딥러닝 애플리케이션은 신용도 평가이다. 비록 많은 기업이 대출...

AWS 딥러닝 리인벤트 2017.10.12

머신러닝을 마스터하는 데 필요한 13가지 프레임워크

작년 한 해 동안, 머신러닝은 성공적으로 주류로 부상했다. 머신러닝의 갑작스러운 도래가 저렴한 클라우드 환경과 예전에 비해 더욱 강력해진 GPU 하드웨어 덕분이라고만 치부될 수는 없다. 이는 머신러닝의 가장 까다로운 부분들을 추상화하고 각종 기법들을 폭넓은 개발자들이 사용할 수 있게 해주도록 설계된 오픈소스 프레임워크의 폭발 덕분이기도 하다. 작년 한 해 동안 갓 만들어지거나 개정된 13가지 머신러닝 프레임워크를 소개한다. 이들은 각 툴의 유래, 문제 영역에 대한 참신한 단순성, 머신러닝과 관련된 특정 과제에 대한 해결 방안, 또는 이 모든 사항들로 주목을 받았다.  editor@itworld.co.kr

프레임워크 라이브러리 인공지능 2017.08.23

머신러닝의 뿌리와 원리 “데이터에서 파생된 소프트웨어”

요즘 “머신러닝”이라는 용어를 흔히 듣는다. 인공 지능(AI)이라는 용어와 혼용되는 경우가 많지만, 사실 머신러닝은 AI의 부분집합이다. 머신러닝과 AI 모두 그 뿌리는 1950년대 후반 MIT로 거슬러 올라간다. 의식하든 하지 않든 사람들은 매일 머신러닝을 접한다. 시리와 알렉사 음성 비서, 페이스북과 마이크로소프트의 얼굴 인식, 아마존과 넷플릭스의 추천, 자율 운전 자동차의 충돌 방지 기술, 모두 머신러닝 발전의 결과물이다. 머신러닝 기반 시스템은 인간 두뇌 수준의 복잡함에는 아직 한참 미치지 못하지만 체스, 퀴즈(Jeopardy), 바둑, 텍사스 홀덤에서 인간 도전자를 꺾는 등 여러 가지 주목할 만한 성과를 거두었다. 수십년 동안 과장되고 비현실적인 기술로 냉대받은(이른바 “AI 겨울” 시기) AI와 머신러닝은 지난 몇 년 사이 여러 기술적 혁신과 값싼 컴퓨팅 성능의 폭발적인 향상, 머신러닝 모델이 학습할 수 있는 풍부한 데이터를 바탕으로 대대적으로 부활했다. 스스로 학습하는 소프트웨어 머신러닝의 정확한 의미는 무엇일까? 먼저 머신러닝이 아닌 것부터 시작해 보자. 사람이 수작업으로 코딩해 프로그램한 기존의 컴퓨팅 애플리케이션은 머신러닝이 아니다. 지시를 따르는 데는 탁월하지만 즉흥적 작업에는 취약한 전통적인 소프트웨어와 달리 머신러닝 시스템은 본질적으로 예제를 일반화함으로써 코드 스스로 자신의 지침을 개발한다. 전형적인 예가 이미지 인식이다. 머신러닝 시스템에 충분히 많은 수의 개 사진(“개” 레이블이 붙은 사진)과 고양이, 나무, 아기, 바나나 또는 다른 사물의 사진(“개가 아님” 레이블이 붙은 사진)을 보여주고 시스템을 적절히 교육한다면 시스템은 개가 어떻게 생겼는지 사람이 일일이 알려주지 않아도 개를 정확히 식별할 수 있게 된다. 이메일 프로그램의 스팸 필터도 머신러닝의 좋은 예다. 스팸 필터는 수억 개의 스팸 샘플과 스팸이 ...

인공지능 AI 용어 2017.08.11

“인공지능 탑재 제품 주의보” 무분별한 AI 워싱 극성

소프트웨어 업체들이 최근의 인공지능 열풍을 적극적으로 이용하고 있다. 자사 제품에 탑재된 인공지능의 범위와 역량을 과장하는 것이다. 가트너는 기술의 성장에 따라 성장과 쇠락을 측정하는 하이프 사이클(Hype Cycle)이란 툴로 제품의 과대 마케팅도 추적하는데, 가트너는 이처럼 과장된 인공지능을 “AI 워싱(AI Washing)이라고 부른다. 환경친화적인 제품을 과장하는 행태를 지적하는 “그린워싱(Green Washing)”이나 클라우드 지원 기능을 과장한 “클라우드 워싱(Cloud Washing)”과 비슷하다. 가트너는 1,000곳 이상의 업체가 자사 제품에 AI를 채택했다고 주장하지만, 이들 중 다수가 “너무 비판 없이 AI 딱지를 붙이고 있다”고 지적했다. 2016년 1월 인공지능이란 용어는 gather.com의 검색어 순위 100위에도 들지 못했다. 하지만 2017년 5월 인공지능은 7위에 올라 짧은 기간에 엄청난 인기 상승을 보여줬다. 가트너는 2020년까지 인공지능은 거의 모든 신형 소프트웨어 제품과 서비스에 구석구석에 스며들 것으로 전망했다. 가트너의 리서치 담당 부사장 짐 헤어는 “인공지능의 하이프 사이클이 가속화되면서 많은 소프트웨어 업체가 이 거대한 골드러시에서 자사의 지분을 주장할 방안을 찾고 있다”며, “인공지능은 기대되는 가능성도 있지만, 안타깝게도 대부분 업체가 수요나 잠재적인 용법, 비즈니스 가치 등은 파악하지 않고 그저 인공지능 기반의 제품을 만들어 홍보하는 데 중점을 두고 있다”고 강조했다. 현재의 인공지능 기반 제품은 대부분 과장됐다. 많은 소프트웨어 업체가 인공지능이라고 부르는 것은 그저 자동화일 뿐 특별히 지능적인 것이 아니다. 이처럼 AI 워싱이 폭넓게 사용되면서 이미 기술 투자 분야에는 악영향을 미치고 있다. 인공지능 기술에 대한 신뢰와 믿음이 손상되는 것이다. 헤어는 &l...

인공지능 AI 딥러닝 2017.07.25

"더 빠르고, 더 간편하게" 딥 러닝의 미래

머신러닝의 하위 분야들 가운데 가장 많은 기대와 관심을 받고, 또 인공지능의 정수라고 할 만한 분야가 있다면 그것은 아마도 딥 러닝(deep learning)일 것이다. 심층신경망(deep neural networks)라고 불리는 딥 러닝은 이미지 식별에서 자동 번역에 이르기까지 다양하고 복잡한 패턴을 인식해낸다. 딥 러닝은 특히 비정형 데이터 분석에서 유용하게 쓰일 것으로 기대된다. 단, 3가지 문제가 있다. 첫째, 딥 러닝을 이용한 데이터 분석이 쉽지 않다. 둘째, 그렇게 하기 위해서는 막대한 양의 데이터가 필요하다. 셋째, 아주 많은 프로세싱 파워가 소모된다. 때문에 우리 시대의 전문가들이 해결하기 위해 애쓰는 문제들도 주로 이런 것들이다. 현재 딥 러닝 분야에서 일어나는 일들은 그저 구글의 텐서플로(TensorFlow)와 바이두의 패들(Paddle)처럼 딥 러닝 프레임워크 간의 패권 다툼 정도가 아니다. 다수의 소프트웨어 프레임워크 간에 라이벌 관계가 형성되는 것은 딥 러닝이 아니어도 모든 IT 분야에서 일어나는 일이다. 근래에 주목해야 할 의문들은 하드웨어와 소프트웨어에 관한 것들이다. 향후 딥 러닝의 진일보를 이끌어 나갈 주역은 모델 훈련과 예측에 적합하게 설계된 전용 하드웨어의 발전이 될 것인가, 아니면 더 효율적이고 스마트해진 알고리즘이 하드웨어의 도움 없이도 딥 러닝 기술의 발전을 이끌어 나갈 수 있을 것인가? 앞으로 딥 러닝이 좀 더 일반인들에게 친숙한 기술이 될 수 있을까? 아니면 앞으로도 딥 러닝은 여전히 컴퓨터 과학 전문가들에게 유보된 영역으로 남아 있을 것인가? 텐서플로의 대항마, 마이크로소프트 코그니티브 툴킷 세상을 바꿀 만한 중요한 기술적 발전이 일어날 때마다 그 흐름 속에서 뒤쳐지지 않기 위한 IT 기업들의 경쟁과 노력은 매우 치열하다. NoSQL, 하둡 때도 그랬고 스파크도 마찬가지였으며, 딥 러닝 프레임워크 역시 예외는 아니다. 구글의 텐서플로는 강력한 범용 솔루션인 동시에, 딥 러닝 앱을 구글 클라우드...

머신러닝 딥러닝 2017.06.13

'구글 텐서플로우부터 MS CNTK까지' 딥러닝/머신러닝 프레임워크 6종 비교 분석 - IDG Tech Review

머신러닝과 딥러닝에 대한 열기가 뜨겁게 달아오르고 있다. 그러나 아직 관련 기술이 초기여서 다양한 프레임워크가 난립하고 있다. 이 영역에 처음 발을 내딛는 사람에게는 어떤 프레임워크를 선택할 것인지부터 혼란스럽다. 여기 현재 가장 주목받고 있는 딥러닝/머신러닝 프레임워크 6종을 모아 비교 분석했다. 카페(Caffe)와 마이크로소프트 인지 툴킷(CNTK), MX넷, 텐서플로우(TensorFlow), 사이킷런(Scikit-learn), 스파크 MLlib 등이다. 어느 정도 평가 결과가 예상되기는 하지만 이들 간의 차이를 아는 것도 머신러닝 전문가를 향한 꽤 멋진 첫걸음이 될 것이다. <주요 내용> - 딥러닝/머신러닝 프레임워크 6종 심층 리뷰 - 인공지능 분야 ‘안드로이드’ 노리는 텐서플로우 

카페 머신러닝 딥러닝 2017.03.23

빅데이터부터 블록체인까지 “떡잎부터 다른" 신규 오픈소스 프로젝트 8가지

블랙 덕 오픈소스 올해의 신인상(Black Duck Open Source Rookies of the Year)은 전년에 출범한 오픈소스 프로젝트 중 가장 혁신적이고 영향력 있는 프로젝트를 선정하는 시상식으로 지금까지 9년째 이어져오고 있다. 유망한 오픈소스 프로젝트는 늘 바뀌지만, 올해의 신인상은 항상 업계의 동향을 엿볼 수 있는 중요한 지표가 된다. 지난 10년 동안 오픈소스는 온갖 분야의 개발자들이 새로운 기술을 조리하는 가마솥 역할을 했다. 올해 수상 프로젝트로는 8개가 선정됐다. 블랙 덕 사이트를 방문하면 등외의 다른 프로젝트도 볼 수 있다. 작년에는 여러 분야에서 활발한 움직임이 있었다. 가장 흥미로운 기술 중 하나는 블록체인 기술이다. 블록체인은 암호화 화폐 교환을 넘어 데이터 생태계에서 입지를 계속 넓혀 나가는 중이다. 머신 러닝(딥 러닝과 신경망 포함) 역시 크게 부상하면서 금융 서비스부터 디자인, 제조에 이르기까지 모든 분야에 지능이 추가되고 있다. 빅데이터, 소프트웨어 정의 네트워킹(SDN), 컨테이너 관리, 보안 분야도 활발했다. 수상작에 축하 인사를 전한다. 여기 선정된 프로젝트를 통해 업계 전반의 기술 발전 방향에 대한 통찰력에 집중해보자. editor@itworld.co.kr 

오픈소스 컨테이너 블랙덕 2017.03.02

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.