먼저, 기사를 시작하기도 전에 분노의 트윗과 이메일을 보내려 준비하고 있는 텐서플로우 사용자들에게 할 말이 있다. 물론 파이토치가 아닌 텐서플로우를 선택할 이유는 많고, 특히 모바일 또는 웹 플랫폼을 대상으로 작업할 경우에는 텐서플로우가 확실히 유리하다. 이 기사의 주제는 “텐서플로우가 열등하고 파이토치가 뛰어나다”는 것이 아니라, 필자가 파이토치를 가장 먼저 선택하는 이유를 정리하는 것이다. 텐서플로우가 그 나름대로 훌륭하다는 점은 필자도 인정하므로, 너무 분노하지 말기를 바란다.
파이토치는 파이썬이다
사람들이 파이토치를 선택하는 주된 이유 중 하나는 코드를 이해하기가 쉽기 때문이다. 파이토치 프레임워크는 파이썬과 씨름하는 것이 아니라, 함께 작동하도록 설계, 제작되었기 때문이다. 모델과 계층뿐 아니라 다른 모든 것, 옵티마이저, 데이터 로더, 손실 함수, 변환 등도 다름아닌 파이썬 클래스다.파이토치는 전통적인 텐서플로우의 정적 실행 그래프가 아닌 즉시 실행 모드로 작동하므로(텐서플로우 2.0은 즉시 실행을 제공하지만 매끄럽지 않은 부분이 있음) 맞춤형 파이토치 클래스를 추론하기가 매우 쉽고 텐서보드(TensorBoard) 또는 print() 문에 이르기까지의 표준 파이썬 기법으로 디버깅하고 스택 트레이스 샘플에서 플레임(flame) 그래프를 생성할 수 있다. 덕분에 판다스(Pandas), 사이킷-런(Scikit-learn)과 같은 다른 데이터 과학 프레임워크에서 딥 러닝으로 넘어온 사람들에게도 상당히 친숙하게 느껴진다.
초기 릴리스에서 버전 1.3에 이르기까지 중대한 변경이 하나뿐인(변수에서 텐서로의 변화) 안정적인 API도 파이토치의 장점이다. 물론 가장 큰 이유는 파이토치가 아직 젊은 프레임워크라는 데 있지만, 어쨌든 작성된 버전에 관계없이 대다수 파이토치 코드를 알아보고 이해할 수 있다.
파이토치는 즉시 사용할 수 있다
“바로 사용 가능” 철학이 파이썬의 전유물은 아니지만 파이토치를 설정하고 실행하기는 무척 쉽다. 파이토치 허브를 사용하면 다음과 같은 한 줄의 코드로 된 사전 학습된 ResNet-50 모델을 얻을 수 있다.
model = torch.hub.load('pytorch/vision', 'resnet50', pretrained=True)
또한 파이토치 허브는 여러 영역에 걸쳐 통합되므로 텍스트와 오디오, 비전을 모두 다룰 수 있는 원스톱 아키텍처로 적합하다.
파이토치에는 모델 외에 풍부한 손실 함수와 옵티마이저도 기본으로 제공된다. 특징은 데이터를 로드하고 내장 변환을 연결하기가 쉽다는 점이다. 또한 자기만의 로더 또는 변환을 만들기도 비교적 간단하다. 모든 것이 파이썬이므로 표준 클래스 인터페이스를 구현하기만 하면 된다.
한 가지 사소하지만 주의할 점은 파이토치에 포함된 많은 편의 기능이 비전 문제(토치비전 패키지에서 발견된 문제)에 편향되며 텍스트 및 오디오 지원 중 일부는 부족하다는 점이다. 다행히 1.0 이후부터 토치텍스트와 토치오디오 패키지가 상당히 개선되고 있다.
연구에 주도적으로 사용되는 파이토치
파이토치는 연구자들에게는 천국과 같다. 모든 주요 딥 러닝 컨퍼런스의 자료에서도 그 사실을 알 수 있다. 파이토치는 2018년에도 빠르게 성장했지만 2019년에는 CVPR, ICLR, ICML 등의 주요 프레임워크로 부상했다. 이러한 전면적인 도입의 이유는 위에 언급한 점, 즉 파이토치가 곧 파이썬이라는 데 기인한다.표준 파이썬 클래스의 간편하고 안정적인 하위 클래스로 새 맞춤형 구성요소를 만들 수 있으므로 새로운 개념을 실험하기가 훨씬 더 쉽다. 또한 유연하므로 텐서보드, 일래스틱서치(ElasticSearch) 또는 아마존 S3 버킷으로 매개변수 정보를 보내는 계층을 간단히 만들 수 있다. 난해한 라이브러리를 가져와서 네트워크 학습과 함께 사용하거나 학습 루프에서 특이한 새로운 시도를 하고자 하는가? 여기서도 파이토치가 걸림돌이 되는 경우는 없다.
그동안 파이토치의 발목을 잡은 한 가지는 연구에서 프로덕션에 이르는 명확한 경로의 부재다. 파이토치가 연구 분야에서 강세라 해도, 실제로 프로덕션 용도는 여전히 텐서플로우가 주도하고 있다. 그러나 파이토치 1.3이 나오고 토치스크립트가 확장되면서 JIT 엔진을 사용해 연구 코드를 그래프 표현으로 컴파일하는 파이썬 주석을 사용하기가 쉬워졌으며 그 결과 속도가 향상되고 C++ 런타임으로 쉽게 내보낼 수 있게 됐다. 또한 지금은 파이토치와 셀던 코어(Seldon Core), 큐브플로우(Kubeflow)의 통합이 지원되므로 텐서플로우에 미치진 못해도 거의 필적할 만큼 간편하게 쿠버네티스에 프로덕션 배포가 가능하다.
딥 러닝을 쉽게 배울 수 있다는 장점
딥 러닝 교육 과정은 많지만 그 중에서 fast.ai 과정이 가장 좋다. 게다가 무료다! 과정의 첫 해에는 케라스(Keras)에 상당히 집중했지만 fast.ai 팀(제레미 하워드, 레이첼 토마스, 실바인 구거)은 두 번째 해에 파이토치로 전환했고 그 이후 지금까지 이어오고 있다. (참고로 fast.ai는 텐서플로우용 스위프트에도 상당히 긍정적이다.)fast.ai의 최근 교육 과정에서는 텍스트 및 비전 영역에서 분류, 세그먼테이션, 예측과 같은 작업에 대한 최신 결과를 달성하는 방법을 알아보고, GAN에 대한 모든 것을 배우고 전문가도 눈이 번쩍 뜨일 만한 풍부한 트릭과 통찰력을 찾을 수 있다.
fast.ai 과정은 파이토치 위에서 부가적인 추상화를 더 제공하는 fasi.ai의 자체 라이브러리를 사용하지만(덕분에 딥 러닝을 배우기가 더욱 쉬움), 기초적인 부분에 대해서도 심층적으로 다루면서 파이토치와 비슷한 라이브러리를 처음부터 새로 만든다. 따라서 파이토치가 내부적으로 어떻게 움직이는지 잘 이해할 수 있게 된다. fast.ai 팀은 이 과정에서 주 파이토치의 몇 가지 버그도 수정한다.
우수한 커뮤니티도 장점
마지막으로, 파이토치 커뮤니티는 정말 유익하다. pytorch.org 웹사이트에는 파이토치 릴리스와 충실히 보조를 맞추는 문서와 함께, 파이토치의 주 기능부터 맞춤형 C++ 연산자를 통해 라이브러리를 확장하는 세부적인 방법에 이르기까지 모든 주제에 관한 자습서도 준비돼 있다. 이 자습서는 학습/검증/테스트 스플릿과 학습 루프 등에 대한 표준화 측면에서 다소 아쉬운 면이 있지만 특히 새로운 기능이 도입될 때 매우 유용한 리소스로 활용할 수 있다.공식 문서 외에, discuss.pytorch.org의 디스코스(Discourse) 기반 포럼은 핵심 파이토치 개발자와 손쉽게 대화하고 도움을 받을 수 있는 훌륭한 리소스다. 매주 1,500개 이상의 글이 올라오며 분위기가 우호적이고 활발하다. 이 포럼에서는 주로 fast.ai의 자체 라이브러리지에 대해 토론하지만 forums.fast.ai에 있는 비슷한 포럼 역시 텃세(슬픈 일이지만 많은 딥 러닝 토론장의 문제) 없이 초보자를 적극적으로 도와주는 훌륭한 커뮤니티이며, 다른 주제도 많이 다룬다.
파이토치의 현재와 미래
여기까지 파이토치를 사용할 5가지 이유를 살펴봤다. 처음에 언급했듯이 이 중에는 경쟁 프레임워크 대비 파이토치의 전유물이 아닌 요소도 있지만 이러한 모든 이유의 조합은 필자가 딥 러닝 프레임워크로 파이토치를 선택하는 근거가 된다. 파이토치가 현재 부족한 영역도 있다. 예를 들어 모바일, 희소 네트워크, 쉬운 모델 양자화 등이다. 그러나 빠른 개발 속도를 감안하면 올해 말 정도면 이러한 영역에서도 파이토치가 지금보다 훨씬 더 강세를 보이게 될 것이다.마무리하기에 앞서 두 가지 예만 더 살펴보자. 첫째, 지난 12월에 실험적 기능으로 도입된 파이토치 일래스틱이다. 파이토치의 기존 분산 학습 패키지를 확장해서 대규모 모델 학습을 더 강화한다. 이름에서 알 수 있듯이 이를 위해 탄력성 있는 여러 머신에서 실행되며, 전체 작업을 멈추거나 중단하지 않으면서 언제든 학습 작업에서 노드를 넣고 뺄 수 있다.
두 번째는 오픈AI가 주 개발 플랫폼으로 파이토치를 도입한다고 발표한 것이다. 파이토치에는 매우 중대한 성과다. 오픈AI가 파이토치를 채택했다는 것은 GPT-2(질문에 답하기, 기계 번역, 독해, 요약을 위한 최신 언어 모델)를 만든 사람들이 아이디어를 반복 개발하는 데 있어 파이토치가 텐서플로우보다 더 생산적인 환경을 제공한다고 여긴다는 것을 의미하기 때문이다.
프리퍼드 네트웍스(Preferred Networks)가 딥 러닝 프레임워크인 체이너를 유지보수 모드로 전환하고 파이토치로 이전한 데 이어 오픈AI가 파이토치를 도입하기로 결정한 것은 파이토치가 지난 2년 사이 얼마나 많이 발전했는지 잘 보여주며, 파이토치가 앞으로도 계속 개선을 거듭하면서 사용자를 흡수할 것임을 예고한다. AI 영역을 주도하는 이들이 파이토치를 선호한다면 다른 사람들에게도 파이토치가 좋다는 의미일 것이다. editor@itworld.co.kr
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.