2017.06.23

구글, 오픈소스 텐서플로우 교육 도구 'T2T' 공개

Serdar Yegulalp | InfoWorld
텐서투텐서(Tensor2Tensor, T2T)는 딥러닝 모델 훈련을 간소화해 개발자가 머신러닝 워크플로우를 좀더 쉽게 만들 수 있게 한다.

지난 한해 동안 구글의 텐서플로우(TensorFlow)는 딥 러닝을 위해 널리 사용되는 오픈소스 툴킷으로 자리잡아왔다. 그러나 텐서플로우 모델을 교육하는 것은 번거롭고 느린 것이 단점이었다. 특히 누군가가 사용한 데이터세트를 가져와 교육 프로세스를 개선하려 할 때 그러하다. 모델 교육 프로세스의 변형만으로도 딥러닝 전문가들을 난감하게 만들기에 충분하다.

이번주 구글은 교육을 위한 딥 러닝 모델 구성 작업량을 줄이기 위한 프로젝트를 공개했다. 간단히 말하면, T2T는 텐서플로우 교육 작업을 위한 파이썬(Python) 기반 워크플로우 조직 라이브러리다. 이를 통해 개발자는 텐서플로우 모델에 사용된 핵심 요소를 지정하고 이들 간의 관계를 정의할 수 있다.

T2T의 핵심 요소는 다음과 같다.
- 데이터 세트 : T2T에는 교육을 위한 여러가지 일반 데이터세트가 내장되어 있다. 사용자는 개별 워크플로우에 새로운 데이터세트를 추가하거나 끌어오기를 요청해 핵심 T2T 프로젝트에 추가할 수 있다.

- 문제와 양식 : 음성인식과 같은 것이 어떤 종류의 작업인지를, 그것으로 생성되는 데이터 종류가 어떤 것인지 설명한다. 예를 들어, 이미지 인식 시스템은 이미지들을 가져와 텍스트 레이블로 돌려준다.

- 모델 : 일반적으로 많이 사용되는 모델은 이미 T2T에 등록되어 있지만, 사용자는 더 추가할 수 있다.

- 하이퍼파라미터(hyperparameter) : 교육 프로세스를 제어하는 다양한 설정 세트를 만들 수 있다. 그래서 사용자는 필요할 때마다 그것들을 교환하거나 배치할 수 있다.

- 강사 : 실제 교육 바이너리에 전달된 파라미터를 개별적으로 지정할 수 있다.

T2T는 각 요소에 대해 기본값이 제공되기 때문에 즉각적으로 유용하게 쓰일 수 있다. T2T에는 수개의 일반적인 모델과 데이터세트가 담겨져 있어 기존 모드를 재사용하거나 확장해 신속하게 시작할 수 있으며, 필요에 따라 기본값과 수정값 가운데 하나를 배포할 수 있다.

다만 T2T는 딥 러닝 프로젝트를 구성하는 방법에 대해 텐서플로우 이외에 더 큰 콘텍스트는 제공하지 않는다. 이론적으로는 머신러닝 솔루션을 개발하기 위한 데이터에서 예측 시스템까지, 엔드투엔드의 일부가 될 수 있지만 지금은 텐서플로우를 사용하는 작업을 간단하게 만드는 것에 절대적인 가치를 두고 있다. editor@itworld.co.kr  


2017.06.23

구글, 오픈소스 텐서플로우 교육 도구 'T2T' 공개

Serdar Yegulalp | InfoWorld
텐서투텐서(Tensor2Tensor, T2T)는 딥러닝 모델 훈련을 간소화해 개발자가 머신러닝 워크플로우를 좀더 쉽게 만들 수 있게 한다.

지난 한해 동안 구글의 텐서플로우(TensorFlow)는 딥 러닝을 위해 널리 사용되는 오픈소스 툴킷으로 자리잡아왔다. 그러나 텐서플로우 모델을 교육하는 것은 번거롭고 느린 것이 단점이었다. 특히 누군가가 사용한 데이터세트를 가져와 교육 프로세스를 개선하려 할 때 그러하다. 모델 교육 프로세스의 변형만으로도 딥러닝 전문가들을 난감하게 만들기에 충분하다.

이번주 구글은 교육을 위한 딥 러닝 모델 구성 작업량을 줄이기 위한 프로젝트를 공개했다. 간단히 말하면, T2T는 텐서플로우 교육 작업을 위한 파이썬(Python) 기반 워크플로우 조직 라이브러리다. 이를 통해 개발자는 텐서플로우 모델에 사용된 핵심 요소를 지정하고 이들 간의 관계를 정의할 수 있다.

T2T의 핵심 요소는 다음과 같다.
- 데이터 세트 : T2T에는 교육을 위한 여러가지 일반 데이터세트가 내장되어 있다. 사용자는 개별 워크플로우에 새로운 데이터세트를 추가하거나 끌어오기를 요청해 핵심 T2T 프로젝트에 추가할 수 있다.

- 문제와 양식 : 음성인식과 같은 것이 어떤 종류의 작업인지를, 그것으로 생성되는 데이터 종류가 어떤 것인지 설명한다. 예를 들어, 이미지 인식 시스템은 이미지들을 가져와 텍스트 레이블로 돌려준다.

- 모델 : 일반적으로 많이 사용되는 모델은 이미 T2T에 등록되어 있지만, 사용자는 더 추가할 수 있다.

- 하이퍼파라미터(hyperparameter) : 교육 프로세스를 제어하는 다양한 설정 세트를 만들 수 있다. 그래서 사용자는 필요할 때마다 그것들을 교환하거나 배치할 수 있다.

- 강사 : 실제 교육 바이너리에 전달된 파라미터를 개별적으로 지정할 수 있다.

T2T는 각 요소에 대해 기본값이 제공되기 때문에 즉각적으로 유용하게 쓰일 수 있다. T2T에는 수개의 일반적인 모델과 데이터세트가 담겨져 있어 기존 모드를 재사용하거나 확장해 신속하게 시작할 수 있으며, 필요에 따라 기본값과 수정값 가운데 하나를 배포할 수 있다.

다만 T2T는 딥 러닝 프로젝트를 구성하는 방법에 대해 텐서플로우 이외에 더 큰 콘텍스트는 제공하지 않는다. 이론적으로는 머신러닝 솔루션을 개발하기 위한 데이터에서 예측 시스템까지, 엔드투엔드의 일부가 될 수 있지만 지금은 텐서플로우를 사용하는 작업을 간단하게 만드는 것에 절대적인 가치를 두고 있다. editor@itworld.co.kr  


X