Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

딥러닝

머신러닝의 뿌리와 원리 “데이터에서 파생된 소프트웨어”

요즘 “머신러닝”이라는 용어를 흔히 듣는다. 인공 지능(AI)이라는 용어와 혼용되는 경우가 많지만, 사실 머신러닝은 AI의 부분집합이다. 머신러닝과 AI 모두 그 뿌리는 1950년대 후반 MIT로 거슬러 올라간다. 의식하든 하지 않든 사람들은 매일 머신러닝을 접한다. 시리와 알렉사 음성 비서, 페이스북과 마이크로소프트의 얼굴 인식, 아마존과 넷플릭스의 추천, 자율 운전 자동차의 충돌 방지 기술, 모두 머신러닝 발전의 결과물이다. 머신러닝 기반 시스템은 인간 두뇌 수준의 복잡함에는 아직 한참 미치지 못하지만 체스, 퀴즈(Jeopardy), 바둑, 텍사스 홀덤에서 인간 도전자를 꺾는 등 여러 가지 주목할 만한 성과를 거두었다. 수십년 동안 과장되고 비현실적인 기술로 냉대받은(이른바 “AI 겨울” 시기) AI와 머신러닝은 지난 몇 년 사이 여러 기술적 혁신과 값싼 컴퓨팅 성능의 폭발적인 향상, 머신러닝 모델이 학습할 수 있는 풍부한 데이터를 바탕으로 대대적으로 부활했다. 스스로 학습하는 소프트웨어 머신러닝의 정확한 의미는 무엇일까? 먼저 머신러닝이 아닌 것부터 시작해 보자. 사람이 수작업으로 코딩해 프로그램한 기존의 컴퓨팅 애플리케이션은 머신러닝이 아니다. 지시를 따르는 데는 탁월하지만 즉흥적 작업에는 취약한 전통적인 소프트웨어와 달리 머신러닝 시스템은 본질적으로 예제를 일반화함으로써 코드 스스로 자신의 지침을 개발한다. 전형적인 예가 이미지 인식이다. 머신러닝 시스템에 충분히 많은 수의 개 사진(“개” 레이블이 붙은 사진)과 고양이, 나무, 아기, 바나나 또는 다른 사물의 사진(“개가 아님” 레이블이 붙은 사진)을 보여주고 시스템을 적절히 교육한다면 시스템은 개가 어떻게 생겼는지 사람이 일일이 알려주지 않아도 개를 정확히 식별할 수 있게 된다. 이메일 프로그램의 스팸 필터도 머신러닝의 좋은 예다. 스팸 필터는 수억 개의 스팸 샘플과 스팸이 ...

인공지능 AI 용어 2017.08.11

“인공지능 탑재 제품 주의보” 무분별한 AI 워싱 극성

소프트웨어 업체들이 최근의 인공지능 열풍을 적극적으로 이용하고 있다. 자사 제품에 탑재된 인공지능의 범위와 역량을 과장하는 것이다. 가트너는 기술의 성장에 따라 성장과 쇠락을 측정하는 하이프 사이클(Hype Cycle)이란 툴로 제품의 과대 마케팅도 추적하는데, 가트너는 이처럼 과장된 인공지능을 “AI 워싱(AI Washing)이라고 부른다. 환경친화적인 제품을 과장하는 행태를 지적하는 “그린워싱(Green Washing)”이나 클라우드 지원 기능을 과장한 “클라우드 워싱(Cloud Washing)”과 비슷하다. 가트너는 1,000곳 이상의 업체가 자사 제품에 AI를 채택했다고 주장하지만, 이들 중 다수가 “너무 비판 없이 AI 딱지를 붙이고 있다”고 지적했다. 2016년 1월 인공지능이란 용어는 gather.com의 검색어 순위 100위에도 들지 못했다. 하지만 2017년 5월 인공지능은 7위에 올라 짧은 기간에 엄청난 인기 상승을 보여줬다. 가트너는 2020년까지 인공지능은 거의 모든 신형 소프트웨어 제품과 서비스에 구석구석에 스며들 것으로 전망했다. 가트너의 리서치 담당 부사장 짐 헤어는 “인공지능의 하이프 사이클이 가속화되면서 많은 소프트웨어 업체가 이 거대한 골드러시에서 자사의 지분을 주장할 방안을 찾고 있다”며, “인공지능은 기대되는 가능성도 있지만, 안타깝게도 대부분 업체가 수요나 잠재적인 용법, 비즈니스 가치 등은 파악하지 않고 그저 인공지능 기반의 제품을 만들어 홍보하는 데 중점을 두고 있다”고 강조했다. 현재의 인공지능 기반 제품은 대부분 과장됐다. 많은 소프트웨어 업체가 인공지능이라고 부르는 것은 그저 자동화일 뿐 특별히 지능적인 것이 아니다. 이처럼 AI 워싱이 폭넓게 사용되면서 이미 기술 투자 분야에는 악영향을 미치고 있다. 인공지능 기술에 대한 신뢰와 믿음이 손상되는 것이다. 헤어는 &l...

인공지능 AI 딥러닝 2017.07.25

"더 빠르고, 더 간편하게" 딥 러닝의 미래

머신러닝의 하위 분야들 가운데 가장 많은 기대와 관심을 받고, 또 인공지능의 정수라고 할 만한 분야가 있다면 그것은 아마도 딥 러닝(deep learning)일 것이다. 심층신경망(deep neural networks)라고 불리는 딥 러닝은 이미지 식별에서 자동 번역에 이르기까지 다양하고 복잡한 패턴을 인식해낸다. 딥 러닝은 특히 비정형 데이터 분석에서 유용하게 쓰일 것으로 기대된다. 단, 3가지 문제가 있다. 첫째, 딥 러닝을 이용한 데이터 분석이 쉽지 않다. 둘째, 그렇게 하기 위해서는 막대한 양의 데이터가 필요하다. 셋째, 아주 많은 프로세싱 파워가 소모된다. 때문에 우리 시대의 전문가들이 해결하기 위해 애쓰는 문제들도 주로 이런 것들이다. 현재 딥 러닝 분야에서 일어나는 일들은 그저 구글의 텐서플로(TensorFlow)와 바이두의 패들(Paddle)처럼 딥 러닝 프레임워크 간의 패권 다툼 정도가 아니다. 다수의 소프트웨어 프레임워크 간에 라이벌 관계가 형성되는 것은 딥 러닝이 아니어도 모든 IT 분야에서 일어나는 일이다. 근래에 주목해야 할 의문들은 하드웨어와 소프트웨어에 관한 것들이다. 향후 딥 러닝의 진일보를 이끌어 나갈 주역은 모델 훈련과 예측에 적합하게 설계된 전용 하드웨어의 발전이 될 것인가, 아니면 더 효율적이고 스마트해진 알고리즘이 하드웨어의 도움 없이도 딥 러닝 기술의 발전을 이끌어 나갈 수 있을 것인가? 앞으로 딥 러닝이 좀 더 일반인들에게 친숙한 기술이 될 수 있을까? 아니면 앞으로도 딥 러닝은 여전히 컴퓨터 과학 전문가들에게 유보된 영역으로 남아 있을 것인가? 텐서플로의 대항마, 마이크로소프트 코그니티브 툴킷 세상을 바꿀 만한 중요한 기술적 발전이 일어날 때마다 그 흐름 속에서 뒤쳐지지 않기 위한 IT 기업들의 경쟁과 노력은 매우 치열하다. NoSQL, 하둡 때도 그랬고 스파크도 마찬가지였으며, 딥 러닝 프레임워크 역시 예외는 아니다. 구글의 텐서플로는 강력한 범용 솔루션인 동시에, 딥 러닝 앱을 구글 클라우드...

머신러닝 딥러닝 2017.06.13

'구글 텐서플로우부터 MS CNTK까지' 딥러닝/머신러닝 프레임워크 6종 비교 분석 - IDG Tech Review

머신러닝과 딥러닝에 대한 열기가 뜨겁게 달아오르고 있다. 그러나 아직 관련 기술이 초기여서 다양한 프레임워크가 난립하고 있다. 이 영역에 처음 발을 내딛는 사람에게는 어떤 프레임워크를 선택할 것인지부터 혼란스럽다. 여기 현재 가장 주목받고 있는 딥러닝/머신러닝 프레임워크 6종을 모아 비교 분석했다. 카페(Caffe)와 마이크로소프트 인지 툴킷(CNTK), MX넷, 텐서플로우(TensorFlow), 사이킷런(Scikit-learn), 스파크 MLlib 등이다. 어느 정도 평가 결과가 예상되기는 하지만 이들 간의 차이를 아는 것도 머신러닝 전문가를 향한 꽤 멋진 첫걸음이 될 것이다. <주요 내용> - 딥러닝/머신러닝 프레임워크 6종 심층 리뷰 - 인공지능 분야 ‘안드로이드’ 노리는 텐서플로우 

카페 머신러닝 딥러닝 2017.03.23

빅데이터부터 블록체인까지 “떡잎부터 다른" 신규 오픈소스 프로젝트 8가지

블랙 덕 오픈소스 올해의 신인상(Black Duck Open Source Rookies of the Year)은 전년에 출범한 오픈소스 프로젝트 중 가장 혁신적이고 영향력 있는 프로젝트를 선정하는 시상식으로 지금까지 9년째 이어져오고 있다. 유망한 오픈소스 프로젝트는 늘 바뀌지만, 올해의 신인상은 항상 업계의 동향을 엿볼 수 있는 중요한 지표가 된다. 지난 10년 동안 오픈소스는 온갖 분야의 개발자들이 새로운 기술을 조리하는 가마솥 역할을 했다. 올해 수상 프로젝트로는 8개가 선정됐다. 블랙 덕 사이트를 방문하면 등외의 다른 프로젝트도 볼 수 있다. 작년에는 여러 분야에서 활발한 움직임이 있었다. 가장 흥미로운 기술 중 하나는 블록체인 기술이다. 블록체인은 암호화 화폐 교환을 넘어 데이터 생태계에서 입지를 계속 넓혀 나가는 중이다. 머신 러닝(딥 러닝과 신경망 포함) 역시 크게 부상하면서 금융 서비스부터 디자인, 제조에 이르기까지 모든 분야에 지능이 추가되고 있다. 빅데이터, 소프트웨어 정의 네트워킹(SDN), 컨테이너 관리, 보안 분야도 활발했다. 수상작에 축하 인사를 전한다. 여기 선정된 프로젝트를 통해 업계 전반의 기술 발전 방향에 대한 통찰력에 집중해보자. editor@itworld.co.kr 

오픈소스 컨테이너 블랙덕 2017.03.02

'딥 러닝의 미래 예측' 6가지

딥 러닝(Deep learning)은 많은 요소가 있으며 단순하지도 않다. 인공 신경망의 기본 사항을 마스터한 데이터 과학자라 할지라도 회선, 순환, 생성을 비롯한 모든 다계층 딥 러닝 알고리듬의 복잡한 내용을 다 따라잡으려면 꽤 많은 시간을 들여야 할 것이다. 딥 러닝 혁신이 확산되면서 일반적인 개발자는 쉽게 접근하지 못할만큼 지나치게 기술이 복잡해질 위험도 커지고 있다. 그러나 필자는 2020년 정도가 되면 딥 러닝 산업이 제시하는 여러 개념이 대폭 간소화되어 보편적인 개발자도 쉽게 이해하고 활용할 수 있게 되리라고 확신한다. 딥 러닝 툴, 플랫폼, 솔루션 간소화를 향한 큰 추세를 보면 다음과 같다. 1. 딥 러닝 산업은 핵심 표준 툴 집합을 채택할 것이다 2020년 정도가 되면 딥 러닝 커뮤니티는 사실상의 표준이 될 몇 가지 핵심 툴 프레임워크 집합으로 수렴된다. 현재 딥 러닝 전문가들이 사용할 수 있는 툴 옵션은 과잉 상태이며 그 대부분은 오픈소스다. 가장 인기있는 툴에는 텐서플로우(TensorFlow), 빅DL(BigDL), 오픈딥(OpenDeep), 카페(Caffe), 씨아노(Theano), 토치(Torch), MX넷(MXNet) 등이 포함된다. 2. 딥 러닝은 스파크(Spark) 내에서 네이티브로 지원된다 스파크 커뮤니티는 향후 12~24개월 내에 스파크 플랫폼의 네이티브 딥 러닝 기능을 강화할 것이다. 최근 스파크 서밋의 세션 내용을 근거로 판단하면 스파크 커뮤니티는 텐서플로우에 대한 지원을 강화하는 것으로 보이며, 빅DL과 카페, 토치 도입도 증가하고 있다. 3. 딥 러닝은 개방형 분석 생태계 내에서 안정적인 틈새 시장을 찾을 것이다 대부분의 딥 러닝 환경은 이미 스파크, 하둡(Hadoop), 카프카(Kafka) 및 기타 오픈소스 데이터 분석 플랫폼에 의존하고 있다. 이런 다른 플랫폼이 제공하는 종합적인 빅데이터 분석 기능 없이는 딥 러닝 알고리즘을 충분히 교육하거나 관리, 구축할 수 없다는 것이 점차...

스파크 딥러닝 2017.02.28

바이두, 딥 러닝 프레임워크로 '퀴베르네시스' 채택

바이두(Baidu)의 딥 러닝 오픈소스 프레임워크 패들패들(PaddlePaddle)이 이제 쿠버네티스(Kubernetes) 클러스터 관리 시스템과 호환된다. 이를 통헤 쿠버네티스를 실행할 수 있는 어느 곳에서나 대규모 모델을 교육시킬 수 있게 됐다. 이 호환성은 단순히 패들패들 교육에 사용 가능한 시스템의 범위를 확장할 뿐만 아니라 두 프로젝트를 기반으로 한 포괄적인 종단간 딥 러닝도 제공한다. Credit: Activedia via pixabay 빅 K를 사용한 교육 딥 러닝 프레임워크가 결과를 생산하기 위해서는 주어진 데이터 집합을 사용해 교육을 시켜야 한다. 이 교육 프로세스는 프로세서 집약적인데다 시간도 많이 소비되지만 클러스터로 분산 실행하면 속도를 높일 수 있다. 바이두는 기계 번역, 검색 결과 순위 계산 등의 작업을 위한 모델을 클러스터를 통해 교육시키기 위해 패들(PArallel Distributed Deep LEarning, PADDLE, 즉 병렬 분산 딥 러닝)을 만들었다. 그리고 쿠버네티스 기여 업체인 코어OS(CoreOS)의 도움을 받아 이러한 클러스터를 관리하기 위해 쿠버네티스를 도입했다. 쿠버네티스는 수요에 따른 확장 또는 리소스 기반의 할당이 가능하므로 리소스 요구에 따라 작업을 클러스터로 묶거나 분산시켜 패들패들의 효율성을 높여준다. 바이두는 이번 변화에 대한 블로그 글에서 "GPU가 필요한 패들패들 작업과 큰 메모리 또는 디스크 I/O 처리량 등 다른 리소스가 필요한 작업을 동일한 물리적 컴퓨터 집합에서 조합할 수 있다"고 전했다. 바이두의 패들패들 기술 책임자인 위 왕은 쿠버네티스가 내고장성(fault tolerance)도 제공한다고 강조했다. 왕은 "스케일링 가운데 일부 작업의 컨테이너/프로세스에 장애가 발생하더라도 이런 작업이 보류되거나 멈추지 않도록 하고자 했다. 우리가 원하는 것은 속도가 느려지더라도 계속 실행되는 것"이라고 말했다. 진보적인 ...

바이두 머신러닝 딥러닝 2017.02.14

스마트 기계, 친구일까 적일까?

전 세계 지식 근로자들은 이제 정신을 바짝 차려야 합니다. 곧 일자리 경쟁이 고조될 것이기 때문입니다. 새로운 경쟁자는 사회성이 부족하지만, 순수한 능력만으로 이를 만회하며, 상호작용을 할 때마다 그 능력은 향상됩니다. 경쟁자는 여러분보다 똑똑하고 빠르며 24시간 내내 일할 수도 있습니다. 음식과 물, 잠도 필요 없습니다. 스마트 기계의 시대란 이런 것입니다. 공상과학 소설 이야기가 절대 아닙니다. 가트너의 예측에 따르면 2018년에는 고속 성장 기업의 50%에서 스마트 기계의 수가 인간 직원을 넘어서게 될 것이라고 합니다. 기계 인식은 데이터 분석, 모바일, 데이터 센터 인프라, IoT와 같이 계속 진화 중인 여러 기술을 취합한 것입니다. 규모와 관계없이 첨단 분석을 지원할 수 있는 새로운 IT 인프라와 더불어, 데이터 양의 폭발적인 증가로 인해 기계 인식은 당장이라도 돌풍을 일으킬 태세입니다. 한 예로, 인지 시스템은 인공지능(AI)의 엔진 역할을 합니다. 인지 시스템은 먼저 막대한 분량의 데이터를 받아들입니다. 그런 다음 연관성이나 패턴을 찾아 측정하고 그러한 패턴을 기초로 답변이나 조언을 제공합니다. 끝으로 새로운 데이터가 도착하면 실시간으로 조정하고 향상시키며 학습합니다. 이를 통해 수술실 일정 관리를 강화하거나 은퇴 계획에 대한 조언을 할 수도 있고 자연 재해 발생 후 전체 운송편의 경로를 수정할 수도 있습니다. 인지 시스템은 학습과 이해가 가능한 인공 시스템으로 컴퓨터 또는 딥러닝 알고리즘을 실행하는 신경망에 구축될 수도 있고, 뉴로모픽 칩을 하드웨어로 이용하게 될 수도 있습니다. 물론 이 모두를 한꺼번에 갖출 수도 있습니다. 인지 시스템은 센서, 스트리밍되는 생체인식 정보, 컴퓨터 비전 기술, 데이터 피드 등 수많은 출처에서 데이터를 얻을 수 있습니다. 미래에는 로봇과 드론 자체가 인지 시스템이 될 것입니다. 사고 및 학습이 가능한 시스템에 팔과 다리, 날개가 달리는 셈입니다. 하지만 만약 기존 컴퓨팅 시스템을...

알고리즘 인지시스템 딥러닝 2017.01.17

AMD, 머신러닝용 라데온 인스팅트 GPU 발표…AI 시장 추격 나선다

AMD가 라데온 인스팅트(Radeon Instnct) 제품군을 발표하며 엔비디아와 인텔의 뒤를 쫓아 머신러닝 시장에 뛰어들었다. AMD는 2017년에 새로운 브랜드로 세 가지 제품을 출시할 계획이다. 라데온 인스팅트 GPU를 탑재한 AMD의 머신러닝 서버 수동 냉각 방식의 라데온 인스팅트 MI6는 폴라리스 아키텍처를 기반으로 할 예정이며, 최고 5.7테라플롭의 성능, 224Gbps의 메모리 대역폭에 150와트의 전력을 소비한다. 좀 더 작은 폼팩터의 피지 기반 라데온 인스팅트 MI8은 8.2테라플롭의 성능과 512GB의 메모리 대역폭에 175와트의 전력을 소비한다. 라데온 책임자 라자 코두리가 신형 라데온 인스팅트 MI6을 소개하고 있다. 마지막 GPU인 MI25는 AMD의 새로운 베가(Vega) 아키텍처를 기반으로 하며, 300와트의 전력을 소비한다. 새로운 고대역 캐시와 컨트롤러가 특징이다. AMD는 MI25의 구체적인 성능은 공개하지 않았지만, 엔비디아의 최고 성능 GPU보다 더 높은 성능을 제공할 것이라고 주장했다. 하지만 MI6가 5.7테파플롭, MI8이 8.2테라플롭인 점으로 미루어, MI25는 최고 25테라플롭의 성능을 제공할 것으로 짐작할 수 있다. 이는 현재 엔비디아의 최고 성능 GPU인 타이탄 X 파스칼 카드의 11테라플롭을 능가하는 성능이다. AMD는 자사의 라데온 인스팅트 GPU가 이미 엔비디아의 타이탄 X 파스칼 카드의 성능을 능가하고 있다고 주장한다. 머신러닝은 무인자동차부터 인공지능 챗봇까지 다양한 영역에 활용되고 있으며, 구글, 엔비디아, 인텔 등의 주요 업체는 AI에 중점을 둔 하드웨어 개발에 적지 않은 자원을 투자하고 있다. 라데온 인스팅트는 이 시장을 노린 AMD의 승부수가 될 것으로 보인다. 문제는 상대적으로 자금력이 부족한 AMD가 이 시장에서 제대로 경쟁할 수 있을지이다. 엔비디아는 이미 몇 세대에 걸쳐 제품을 출시하며 앞서가고 있으며, 구글은 지난 5월 TPU(Ten...

AMD GPU 인텔 2016.12.13

2017년을 넘어 이어질 9가지 엔터프라이즈 기술 동향

올해 엔터프라이즈 기술을 한 단어로 요약하자면 명확성(clarity)이다. 컨테이너, 마이크로서비스, 클라우드 확장성, 데브옵스, 애플리케이션 모니터링과 스트리밍 분석을 둘러싼 새로운 생태계가 일시적 유행이 아니라는 점은 밝혀졌다. 미래의 기술로서, 이미 실리콘 밸리와 시애틀의 최첨단 기업들을 움직이고 있다. 동시에 이 신세계와 대부분의 기존 엔터프라이즈 IT 운영 사이의 간격이 더 커지고 있음도 사실이다. 열기가 식긴 했어도 "디지털 트랜스포메이션"이라는 용어가 아직 사라지지 않은 이유도 그래서다. 레거시에서 현대적 시스템으로 도약하기 위해서는 여러 단계에 걸친 방대하고 전반적인 변화가 필요하다. 그렇다면 2017년은 어떨까? 엔터프라이즈 기술의 현재 상태를 알면 앞을 예견하기도 그만큼 쉽다. 그래서 필자는 내년과 그 이후의 9가지 엔터프라이즈 기술 동향을 예측했다. 가장 확실한 것부터 차례로 살펴보자. 1. 진보된 협업 몇 년에 걸친 "비즈니스 소셜 네트워킹"의 실패 이후, 슬랙(Slack)과 슬랙을 중심으로 한 생태계는 채팅 기반 협업을 핵심 비즈니스 애플리케이션으로 부상시켰다. 물론 힙챗(HipChat)부터 플록(Flock)에 이르기까지 많은 경쟁업체들이 있고, 마이크로소프트 팀(Teams)이 슬랙을 격파할 수 있을지에 대해서도 큰 관심이 쏠리고 있다. 특히 팀은 오피스 365에 무료로 제공된다. 필자 개인적으로는 단순한 채팅 기반 협업이 이렇게 부상했다는 사실이 신기하다. 채팅방이라는 개념은 IRC 시절부터 항상 있었기 때문이다. 개발자들은 리누스 토발즈가 리눅스 커널 리버전을 관리하기 위한 방편으로 깃(Git)을 제안했을 때부터 더 심층적인 형태의 협업을 수행해왔다. 현재 가장 널리 사용되는 깃 구현은 깃허브(GitHub)와 비트버킷(Bitbucket), 깃랩(GitLab)이다. 존 유델 등은 깃허브가 코드를 넘어 온갖 것의 협업을 위한 토대를 제공할 수 있다고 주장한다. 더 흥미...

전망 SQL 엔터프라이즈 2016.12.07

아마존이 MXNet을 딥러닝 플랫폼으로 선택한 이유

아마존 CTO 워너 보겔스는 MXNet이 “아마존이 선택한 딥러닝 프레임워크”가 될 것이라고 밝혔다. 아마존이 MXnet을 선택했다는 것은 일부에게는 놀라운 일로 여겨질 수 있는데, 텐서플로우부터 테아노(Theano), 토치(Torch), 카페(Caffe) 등 더 잘 알려져 있는 프레임워크가 많기 때문이다. 아마존은 MXNet이 확장성이 좋고 다른 어떤 프레임보다 빠르게 구동할 수 있기 때문이라고 설명했다. 하지만 다른 동기도 작용했을 것으로 보인다. MXNet는 올해 초 인포월드가 선정한 2016년 오픈소스 루키로 선정될 만큼 주목을 받고 있는 프레임워크이다. 여러 가지 장점 중 작은 크기와 크로스 플랫폼 이식성이 가장 두드러지는데, 보겔스 역시 이 두 가지 특징을 칭찬했다. 보겔스는 “코어 라이브러리가 단일 C++ 소스 파일에 들어가며, 안드로이드와 iOS용으로 컴파일할 수 있다”고 강조했다. 개발자가 다양한 프로그래밍 언어를 사용할 수 있다는 것도 장점인데, 파이썬, C++, R, 스칼라, 줄리아, 매트랩, 자바스크립트를 사용할 수 있다. 하지만 아마존아 가장 주목한 것은 확장성이다. 보겔스는 인셉션 v3 이미지 분석 알고리즘을 사용한 MXNet의 학습 처리량 벤치마크를 발표하고, 여러 대의 GPU를 사용하면 선형적인 성능 향상 효과를 얻을 수 있다고 주장했다. 128개의 GPU를 사용했을 때 MXNet은 단일 GPU를 사용한 것보다 109배 빠른 성능을 보였다. 아마존의 장기적인 계획에는 MXNet을 클라우드 서비스로 제공해 수익화하는 것도 포함됐다고 보는 것이 맞을 것이다. 이 서비스는 아마존의 기존 머신러닝 서비스를 통해 이루어질 필요도 없다. 아마존이 이미 판매하고 있는 기존 딥러닝 AMI와 같은 공식 지원 머신 이미지로 구현할 수도 있다. 전자는 쉽게 사용할 수 있는 소비자 제품을 원하는 고객에게, 그리고 후자는 모든 것을 직접 제어하기를 원하는 고객에게 적합하다. 한편 아마존...

아마존 딥러닝 텐서플로우 2016.11.24

“입 모양 읽고, 희귀병 진단하고” AI가 인간보다 뛰어난 분야들

수백만 년 동안, 인간은 거의 모든 분야에서 지구상의 다른 생명체들보다(예컨대 돌고래나 오랑우탄 같은) 뛰어난 능력을 보여왔다. 물론 수영이나 나무 오르기 같은 것은 예외지만 말이다. 최근 몇 년 사이 인류는 여러 분야에서 그 자신을 능가하는 새로운 형태의 지능을 만들어냈다. 이러한 인공지능(AI)중에서 가장 유명한 것이 아마도 딥마인드(Deepmind)가 개발한 알파고 일 것이다. 알파고는 불과 몇 년 만에 그 역사가 4,000년에 이르는 바둑의 전략을 학습해 2 명의 세계 정상급 기사들과의 대국에서 승리를 거두었다. 딥마인드가 개발한 소프트웨어 중에는 8비트 비디오 게임 '브레이크아웃(Breakout)을 플레이 할 수 있는 인공 지능도 있다. 방망이로 공을 쳐서 벽돌을 떨어뜨리는 게임이다. 이 AI는 별도의 지시 없이 화면만 보고 게임 플레이 방식을 익혔다고 딥마인드 CEO 데미스 하사비스는 자랑스레 말했다. 먼저 화면의 숫자를 읽는 법과 숫자 세는 법을 가르쳐준 후 점수를 최대한 높게 받으라는 명령을 줬을 뿐이었다. 아무리 똑똑한 AI여도 최초의 룰과 동기 부여에 관한 힌트는 필요했던 것 같다. 하지만 AI가 할 수 있는 일이 이게 전부일까? AI가 인간과 비슷한, 혹은 더 우수한 역량을 보여주는 다섯 가지 분야를 소개한다. 나무 블록으로 탑 쌓기 AI라고해서 비디오 게임만 하는 것은 아니다. 가끔은 실제 장난감도 가지고 논다. 마치 인간 아기들처럼, AI도 나무 블록을 쌓아 올리고 무너지는 모습을 보며 기본적인 물리 지식을 익힌다. 페이스북 리서치팀은 회선 신경망(convolutional neural network)을 이용한 AI를 개발했다. 이 AI는 블록으로 쌓은 탑이 무너지는 영상만을 보여주었을 뿐인데 이 정보로부터 인간과 비슷한 수준으로 실제 블록이 무너질 상황을 정확히 예측해내기도 했다. 입 모양 읽기 다른 사람의 입 모양만 보고 그 사람이 무슨 말을 하고 있는지 추측하는 건 결코 쉽지 않은 일이지만...

인공지능 AI 머신러닝 2016.11.18

페이스북, 딥러닝으로 뉴스피드 관련성 높여

하루 10억 명 이상의 사용자들에게 서비스를 제공하는 페이스북은 사용자에게 맞춤형 뉴스피드를 제공하기 위해 딥 러닝을 사용하고 있다. 페이스북 소프트웨어 엔지니어인 앤드류 툴로치는 최근 @스케일 컨퍼런스에서 사용자에게 최고로 개인화된 콘텐츠를 찾는 것이 도전 과제 중 하나라고 말했다. 그는 “지난 몇 년간 점점 더 많은 딥러닝 기술을 사용자들이 보는 피드를 구성하는 머신러닝 모델에 적용하고 있다”고 말했다. 신경 네트워크 같은 개념을 적용하기 위해서 딥러닝은 이벤트 예측, 기계 번역 모델, 자연어 이해, 컴퓨터 시각 서비스 등에 사용된다. 특히 이벤트 예측은 페이스북의 가장 큰 머신러닝 과제 중 하나로, 사용자를 위해 수천개 중에서 2개의 게시물을 몇 초 안에 꼽아야한다. 툴로치는 “관련성을 예측하는 것은 큰 도전 과제며, 텍스트, 이미지나 동영상의 픽셀, 소셜 맥락 등 여러 콘텐츠 요소의 이해를 통해서 이루어진다”고 설명했다. 페이스북은 또한 매일 100개 이상의 언어로 올라오는 게시물을 처리해야 하는 문제도 안고 있다. 툴로치에 따르면, 이는 전통적인 머신 러닝을 더욱 복잡하게 만드는 요소다. 텍스트 이해를 위해서 페이스북은 딥텍스트(DeepText) 텍스트 이해 엔진을 활용하고 있다. 추가로 페이스북은 시각적인 콘텐츠도 다뤄야 한다. 툴로치는 “사진이나 동영상을 픽셀을 통해서 이해하는 것은 굉장한 도전 과제다”라고 전했다. 페이스북은 딥러닝을 통해 컴퓨터 시각 처리를 발전시키고 있다고 설명했다. 또한, 페이스북은 이미지에 필터 적용을 위해 콘볼루션(convolution)을 적용한다. 페이스북은 고도의 시맨틱(semantic) 이해를 위해 콘볼루션을 최적화해왔다. 톨루치는 딥러닝이 포괄적인 기술을 의미하며, 페이스북 내에 다양한 접근법을 통해 구체화되고 있다고 덧붙였다. editor@itworld.co.kr

페이스북 뉴스피드 딥러닝 2016.09.05

토픽브리핑 | "가상현실과 인공지능에 승부수" 인텔 IDF 2016 정리

인텔의 연례 최대 행사인 IDF(Intel Developer Forum)가 이번 주 열렸다. 가상현실과 증강현실, 인공지능 등에 관한 주요 발표가 있었던 이번 행사를 통해 인텔이 PC가 아닌 가상현실과 인공지능에 주력할 것임을 분명히 했다. 최초의 오픈소스 서드파티 홀로렌즈 인텔 ‘프로젝트 앨로이’…가상현실로 영역 확대 MS “모든 윈도우 10 PC에 홀로그래픽 혼합현실 구현 예정” IDG 블로그 | 인텔 프로젝트 앨로이, PC의 구세주 될 것인가 우선 IDF 현장에서 가장 주목을 받은 것은 프로젝트 앨로이(Project Alloy) 가상현실 헤드셋이다. 앨로이 헤드셋을 착용한 연주자가 무대에 올라 가상의 드럼을 연주했는데, 현재 나와있는 가상현실 헤드셋과는 달리 PC나 스마트폰에 연결되지 않았고, 컨트롤러가 없어도 손동작을 정확히 인식했다. 프로젝트 앨로이는 마이크로소프트와의 합작으로 만들어진 것이다. 윈도우 홀로그래픽(Windows Holographic)으로 구동되며, 한 쌍의 리얼센스 카메라로 외부 세계를 탐지한다. 마이크로소프트는 IDF에서 2017년 중 윈도우 10 업그레이드를 통해 모든 윈도우 10 PC에서 홀로그래픽 혼합현실을 구현할 수 있도록 할 것이라고 발표했다. 인텔이 프로젝트 앨로이 헤드셋을 실제로 출시할지, 아니면 협력 업체에게 레퍼런스 디자인으로 제공할지는 확실치 않다. 하지만 인텔이 가상현실을 통해 PC의 부활을 꿈꾸고 있는 것은 확실해 보인다. 인텔, AI 전략 주도할 메가칩 나이츠 밀 공개 고성능 GPU의 부재… 인텔 AI·VR 전략의 걸림돌 될까 한편, 인텔은 다소 조용했던 머신러닝 및 인공지능 영역의 전략도 나이츠 밀(Knights Mill) 칩과 함께 공개했다. 나이츠 밀은 이 영역의 경쟁자인 엔비디아나 AMD의 고성능 GPU와는 다른 접근법을 취한다. CPU에 기반을 두고 있기 때문에 별도의 CPU가 필요 없...

인텔 가상현실 인공지능 2016.08.19

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.