2017.02.28

'딥 러닝의 미래 예측' 6가지

James Kobielus | InfoWorld
딥 러닝(Deep learning)은 많은 요소가 있으며 단순하지도 않다.



인공 신경망의 기본 사항을 마스터한 데이터 과학자라 할지라도 회선, 순환, 생성을 비롯한 모든 다계층 딥 러닝 알고리듬의 복잡한 내용을 다 따라잡으려면 꽤 많은 시간을 들여야 할 것이다.
딥 러닝 혁신이 확산되면서 일반적인 개발자는 쉽게 접근하지 못할만큼 지나치게 기술이 복잡해질 위험도 커지고 있다.

그러나 필자는 2020년 정도가 되면 딥 러닝 산업이 제시하는 여러 개념이 대폭 간소화되어 보편적인 개발자도 쉽게 이해하고 활용할 수 있게 되리라고 확신한다. 딥 러닝 툴, 플랫폼, 솔루션 간소화를 향한 큰 추세를 보면 다음과 같다.

1. 딥 러닝 산업은 핵심 표준 툴 집합을 채택할 것이다
2020년 정도가 되면 딥 러닝 커뮤니티는 사실상의 표준이 될 몇 가지 핵심 툴 프레임워크 집합으로 수렴된다. 현재 딥 러닝 전문가들이 사용할 수 있는 툴 옵션은 과잉 상태이며 그 대부분은 오픈소스다. 가장 인기있는 툴에는 텐서플로우(TensorFlow), 빅DL(BigDL), 오픈딥(OpenDeep), 카페(Caffe), 씨아노(Theano), 토치(Torch), MX넷(MXNet) 등이 포함된다.

2. 딥 러닝은 스파크(Spark) 내에서 네이티브로 지원된다
스파크 커뮤니티는 향후 12~24개월 내에 스파크 플랫폼의 네이티브 딥 러닝 기능을 강화할 것이다. 최근 스파크 서밋의 세션 내용을 근거로 판단하면 스파크 커뮤니티는 텐서플로우에 대한 지원을 강화하는 것으로 보이며, 빅DL과 카페, 토치 도입도 증가하고 있다.

3. 딥 러닝은 개방형 분석 생태계 내에서 안정적인 틈새 시장을 찾을 것이다
대부분의 딥 러닝 환경은 이미 스파크, 하둡(Hadoop), 카프카(Kafka) 및 기타 오픈소스 데이터 분석 플랫폼에 의존하고 있다. 이런 다른 플랫폼이 제공하는 종합적인 빅데이터 분석 기능 없이는 딥 러닝 알고리즘을 충분히 교육하거나 관리, 구축할 수 없다는 것이 점차 명확해지고 있다.
특히 스파크는 다양한 툴 내에서 딥 러닝 알고리즘을 확장하고 가속화하기 위한 필수 플랫폼으로 자리잡고 있다. 최근 기사에서 필자가 언급했듯이 많은 딥 러닝 개발자가 하이퍼파라미터 최적화, 고속 메모리 내 데이터 교육, 데이터 클린징, 전처리와 같은 특수한 파이프라인 작업을 위해 스파크 클러스터를 사용 중이다.

4. 딥 러닝 툴은 빠른 코딩을 위해 간소화된 프로그래밍 프레임워크를 도입할 것이다
애플리케이션 개발자 커뮤니티는 더 적은 코드로 더 빠르게 코어 알고리즘 기능을 코딩하기 위해 API와 기타 프로그래밍 추상화를 요구하게 된다. 나아가 딥 러닝 개발자들은 끼워 넣을 수 있는 완제품 형태의 다양한 알고리즘 라이브러리에 대한 접근을 제공하는 통합된 개방형 클라우드 기반 개발 환경을 채택할 것이다. 이를 통해 API 기반의 딥 러닝 애플리케이션을 합성 가능한 컨테이너화된 마이크로서비스로 개발할 수 있게 된다.
툴은 더 많은 딥 러닝 개발 파이프라인 기능을 자동화하고 노트북 지향의 협업 및 공유 패러다임을 제공한다. 이런 추세가 강화됨에 따라 '코드 50라인으로 만드는 생성 대립 네트워크(파이토치)'와 같은 글 제목도 흔해질 것이다.

5. 딥 러닝 툴킷은 재사용 가능한 구성 요소의 시각적 개발을 지원한다
딥 러닝 툴킷은 기존 빌딩 블록을 사용해 새로운 모델을 손쉽게 시각적으로 설계, 구성 및 교육하기 위한 모듈형 기능을 채택하게 된다. 이런 재사용 가능한 구성 요소의 상당수는 비슷한 사용 사례를 다룬 이전 프로젝트에서 '전이 학습'을 통해 가져온다.
표준 라이브러리와 인터페이스에 도입된 재사용 가능한 딥 러닝 아티팩트는 특징 표현, 신경 노드 계층화, 가중치, 교육 방법, 학습 속도를 비롯한 이전 모델의 관련 특징으로 구성된다.

6. 딥 러닝 툴은 모든 디자인 표면에 내장된다
"보편화된 딥 러닝"은 결코 먼 이야기가 아니다. 향후 5~10년 내에 딥 러닝 개발 툴, 라이브러리, 언어는 모든 소프트웨어 개발 툴킷의 표준 구성 요소가 된다. 사용자 친화적인 딥 러닝 개발 기능이 신경망과는 거리가 먼 예술가와 디자이너, 건축가, 제작자들이 사용하는 생성 설계 툴에 내장된다는 것도 중요하다.
이미지 검색, 자동 태깅, 사실적 렌더링, 해상도 향상, 스타일 변형, 가공의 상 개시(fanciful figure inception), 작곡 등의 분야를 위한 딥 러닝 기반 툴에 대한 인기가 높아지면 이런 추세도 강화될 것이다.

딥 러닝 시장은 대중적인 도입을 향해 발전하면서 데이터 시각화, 비즈니스 인텔리전스, 예측 분석 시장의 전례를 따르게 될 것이다. 이런 모든 분야의 솔루션은 기술적 복잡함에 시달리기를 싫어하는 사용자에게 빠른 가치를 제공하는 셀프 서비스 클라우드 기반 제공 모델로 전환됐다. 기술은 그렇게 발전한다. editor@itworld.co.kr  


2017.02.28

'딥 러닝의 미래 예측' 6가지

James Kobielus | InfoWorld
딥 러닝(Deep learning)은 많은 요소가 있으며 단순하지도 않다.



인공 신경망의 기본 사항을 마스터한 데이터 과학자라 할지라도 회선, 순환, 생성을 비롯한 모든 다계층 딥 러닝 알고리듬의 복잡한 내용을 다 따라잡으려면 꽤 많은 시간을 들여야 할 것이다.
딥 러닝 혁신이 확산되면서 일반적인 개발자는 쉽게 접근하지 못할만큼 지나치게 기술이 복잡해질 위험도 커지고 있다.

그러나 필자는 2020년 정도가 되면 딥 러닝 산업이 제시하는 여러 개념이 대폭 간소화되어 보편적인 개발자도 쉽게 이해하고 활용할 수 있게 되리라고 확신한다. 딥 러닝 툴, 플랫폼, 솔루션 간소화를 향한 큰 추세를 보면 다음과 같다.

1. 딥 러닝 산업은 핵심 표준 툴 집합을 채택할 것이다
2020년 정도가 되면 딥 러닝 커뮤니티는 사실상의 표준이 될 몇 가지 핵심 툴 프레임워크 집합으로 수렴된다. 현재 딥 러닝 전문가들이 사용할 수 있는 툴 옵션은 과잉 상태이며 그 대부분은 오픈소스다. 가장 인기있는 툴에는 텐서플로우(TensorFlow), 빅DL(BigDL), 오픈딥(OpenDeep), 카페(Caffe), 씨아노(Theano), 토치(Torch), MX넷(MXNet) 등이 포함된다.

2. 딥 러닝은 스파크(Spark) 내에서 네이티브로 지원된다
스파크 커뮤니티는 향후 12~24개월 내에 스파크 플랫폼의 네이티브 딥 러닝 기능을 강화할 것이다. 최근 스파크 서밋의 세션 내용을 근거로 판단하면 스파크 커뮤니티는 텐서플로우에 대한 지원을 강화하는 것으로 보이며, 빅DL과 카페, 토치 도입도 증가하고 있다.

3. 딥 러닝은 개방형 분석 생태계 내에서 안정적인 틈새 시장을 찾을 것이다
대부분의 딥 러닝 환경은 이미 스파크, 하둡(Hadoop), 카프카(Kafka) 및 기타 오픈소스 데이터 분석 플랫폼에 의존하고 있다. 이런 다른 플랫폼이 제공하는 종합적인 빅데이터 분석 기능 없이는 딥 러닝 알고리즘을 충분히 교육하거나 관리, 구축할 수 없다는 것이 점차 명확해지고 있다.
특히 스파크는 다양한 툴 내에서 딥 러닝 알고리즘을 확장하고 가속화하기 위한 필수 플랫폼으로 자리잡고 있다. 최근 기사에서 필자가 언급했듯이 많은 딥 러닝 개발자가 하이퍼파라미터 최적화, 고속 메모리 내 데이터 교육, 데이터 클린징, 전처리와 같은 특수한 파이프라인 작업을 위해 스파크 클러스터를 사용 중이다.

4. 딥 러닝 툴은 빠른 코딩을 위해 간소화된 프로그래밍 프레임워크를 도입할 것이다
애플리케이션 개발자 커뮤니티는 더 적은 코드로 더 빠르게 코어 알고리즘 기능을 코딩하기 위해 API와 기타 프로그래밍 추상화를 요구하게 된다. 나아가 딥 러닝 개발자들은 끼워 넣을 수 있는 완제품 형태의 다양한 알고리즘 라이브러리에 대한 접근을 제공하는 통합된 개방형 클라우드 기반 개발 환경을 채택할 것이다. 이를 통해 API 기반의 딥 러닝 애플리케이션을 합성 가능한 컨테이너화된 마이크로서비스로 개발할 수 있게 된다.
툴은 더 많은 딥 러닝 개발 파이프라인 기능을 자동화하고 노트북 지향의 협업 및 공유 패러다임을 제공한다. 이런 추세가 강화됨에 따라 '코드 50라인으로 만드는 생성 대립 네트워크(파이토치)'와 같은 글 제목도 흔해질 것이다.

5. 딥 러닝 툴킷은 재사용 가능한 구성 요소의 시각적 개발을 지원한다
딥 러닝 툴킷은 기존 빌딩 블록을 사용해 새로운 모델을 손쉽게 시각적으로 설계, 구성 및 교육하기 위한 모듈형 기능을 채택하게 된다. 이런 재사용 가능한 구성 요소의 상당수는 비슷한 사용 사례를 다룬 이전 프로젝트에서 '전이 학습'을 통해 가져온다.
표준 라이브러리와 인터페이스에 도입된 재사용 가능한 딥 러닝 아티팩트는 특징 표현, 신경 노드 계층화, 가중치, 교육 방법, 학습 속도를 비롯한 이전 모델의 관련 특징으로 구성된다.

6. 딥 러닝 툴은 모든 디자인 표면에 내장된다
"보편화된 딥 러닝"은 결코 먼 이야기가 아니다. 향후 5~10년 내에 딥 러닝 개발 툴, 라이브러리, 언어는 모든 소프트웨어 개발 툴킷의 표준 구성 요소가 된다. 사용자 친화적인 딥 러닝 개발 기능이 신경망과는 거리가 먼 예술가와 디자이너, 건축가, 제작자들이 사용하는 생성 설계 툴에 내장된다는 것도 중요하다.
이미지 검색, 자동 태깅, 사실적 렌더링, 해상도 향상, 스타일 변형, 가공의 상 개시(fanciful figure inception), 작곡 등의 분야를 위한 딥 러닝 기반 툴에 대한 인기가 높아지면 이런 추세도 강화될 것이다.

딥 러닝 시장은 대중적인 도입을 향해 발전하면서 데이터 시각화, 비즈니스 인텔리전스, 예측 분석 시장의 전례를 따르게 될 것이다. 이런 모든 분야의 솔루션은 기술적 복잡함에 시달리기를 싫어하는 사용자에게 빠른 가치를 제공하는 셀프 서비스 클라우드 기반 제공 모델로 전환됐다. 기술은 그렇게 발전한다. editor@itworld.co.kr  


X