Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

딥러닝

“게임 체인저인가 범죄 도구인가” 딥페이크 기술의 명암 - IDG Tech Report

과학 기술에는 어두운 이면이 존재한다. 인간의 이미지를 실제와 유사하게 합성하는 ‘딥페이크(Deepfake)’도 이런 논란이 있는 대표적인 기술이다. 가장 널리 알려진 사용례가 가짜 뉴스와 디지털 성범죄 영상 제작일 정도로 딥페이크의 역기능을 우려하는 목소리가 크다. 하지만 순기능도 간과해서는 안 되는 부분이다. 딥페이크로 그리운 사람의 생전 모습을 재현하거나 고품질 합성 영상을 제작해 영화 산업의 효율을 높일 수 있으며, 질병 진단에 활용하기도 한다. 특히 최근에는 적은 양의 데이터에 AI 알고리즘을 적용해 데이터양을 늘리는 ‘데이터 증강’ 분야에서 새로운 게임 체인저로 주목받고 있다. 다양한 활용사례를 통해 딥페이크의 명암을 살펴보고, 의미 있는 발전 방향을 모색해 본다. 주요 내용 - “AI가 낳은 괴물?” 딥페이크의 탄생 - 딥페이크의 핵심 기술 ‘GAN’ - 그리고 시작된 가짜와의 전쟁 - 산업 전반의 혁신을 가져올 ‘게임 체인저’로서의 딥페이크 - 딥러닝을 활용한 딥페이크 탐지 기술 동향 - 딥페이크를 감당할 사회적 역량이 필요한 시점

딥페이크 인공지능 딥러닝 2022.02.23

의료 인공지능 기업 LUNIT : 데이터 사이언스를 위한 HP Z 워크스테이션 CASE STUDY

대한민국 딥러닝 1호 스타트업 기업 루닛의 대표 제품인 ‘루닛 인사이트(Lunit INSIGHT)’는 딥러닝 기반 인공지능 기술을 활용한 의료AI 제품으로 두 종류가 있다. 하나는 흉부 X레이를 분석해 폐 관련 질환을 빠르고 정확히 진단하는 ‘루닛 인사이트 CXR’, 다른 하나는 유방암 등이 의심되는 이상 부위를 알려주는 ‘루닛 인사이트 MMG’다. 이 의료영상 검출 보조 소프트웨어 제품의 개발과 활용에 HP 워크스테이션 모델이 중요한 역할을 수행했다. <8p> 주요 내용 - HP 기술의 정점을 현장에서 구현한 루닛(Lunit)사의 워크스테이션 실사용기 - 극한의 환경에서도 안정적으로 구동 가능한 HP의 내구성과 편의성  - 루닛의 향후 행보에도 든든한 파트너가 될 HP - 무한대의 가능성을 담은 HP 워크스테이션     인텔® 제온® W-11955M 프로세서의 탁월한 설계를 경험해보세요. Ultrabook, 울트라북, Celeron, 셀러론, Celeron Inside, Core Inside, Intel, 인텔, Intel 로고, 인텔 로고, Intel Atom, 인텔 아톰, Intel Atom Inside, Intel Core, 인텔 코어, Intel Inside, Intel Inside 로고, Intel vPro, 인텔 v프로, Intel Evo, 인텔 Evo, Pentium, 펜티엄, Pentium Inside, vPro Inside, Xeon, 제온, Xeon Inside, Intel Agilex, 인텔 Agilex, Arria, Cyclone, Movidius, eASIC, Iris, Killer, MAX, Select Solutions, 셀렉트 솔루션, Stratix, Tofino, Intel Optane 및 인텔 Optane은 인텔사 또는 그 자회사의 상표입니다.

데이터과학 인공지능 루닛 2021.12.01

글로벌 칼럼 | ‘머신러닝은 만능이 아니다’ ML 대신 SQL 쿼리를 써야하는 이유

때때로 머신러닝을 하는 가장 좋은 방법은 어떠한 머신러닝도 하지 않는 것이다. 아마존 응용 과학자 유진 얀은 “머신러닝의 첫 번째 규칙은 머신러닝 없이 시작하는 것”이라고 말했다. 무슨 뜻일까?   몇 달 동안 고된 노력을 투입해 머신러닝 모델을 공들여 만드는 것은 물론 멋진 일이다. 하지만 더 간단하고 편한 방법이 있을 때는 꼭 그렇게 할 필요가 없다. 지나친 단순화일 수도 있지만, 데이터 과학자 노아 로랑은 몇 년 전 “데이터 과학자는 대부분 산수만 한다”라고 말했다. 아주 틀린 말은 아니다. 데이터 연산 과정을 아무리 복잡하게 만들고 싶어도 시작은 간단한 것이 더 낫다는 점에서 얀과 로랑의 말은 정확하다.  과장된 복잡함 데이터 과학자는 많은 급여를 받는다. 복잡한 전문 용어로 된 예측 분석과 다루기 힘든 모델로 고액 연봉을 정당화하고 싶어할지도 모른다. 하지만 그러지 말자. 데이터 과학에 대한 로랑의 몇 년 전 견해는 오늘날에도 유효하다. 로랑은 “기업이 겪고 있는 문제 가운데 머신러닝이 최고의 해결책이 되는 경우는 극히 일부다. 대부분은 좋은 데이터와 그 데이터가 의미하는 바만 이해하면 해결된다”라고 말했다. 로랑은 “SQL 쿼리로 데이터를 얻고, 백분위나 차이점 계산과 같은 기본적인 연산, 결과 그래프화, 결과 해석 혹은 개선사항 작성 등 간단한 방법을 추천한다”라고 덧붙였다. 이런 방법이 쉽다는 말이 아니다. 데이터로부터 통찰을 얻고 싶을 때 머신러닝이 그 시작이 되서는 안 된다는 의미다. 데이터 양이 방대할 필요도 없다. 헬스케어 업체 엘리저블(Eligible) CEO 케이틀린 글리슨은 “눈에 띄는 변칙만 관찰해도 최선의 결과를 도출할 수 있기 때문에 적은 양의 데이터로 시작하는 것이 중요하다”라고 말했다. 가끔은 뻔한 패턴을 확인하기 위한 방법만으로도 충분할 때가 있다. 인간이 패턴을 감지하고 통찰을 얻는 데에는 작은 데이터도 충분하다. 아이로봇(iRobot) 데이터 과학자 브랜든 로러의 뻔뻔스러운 제안도 놀랄 일...

머신러닝 딥러닝 2021.09.29

클라우드 머신러닝 플랫폼 선택 기준 12가지

효과적인 머신러닝과 딥 러닝 모델을 구축하려면 방대한 양의 데이터, 데이터 정제 및 특성 엔지니어링을 수행할 방법, 그리고 적절한 시간 내에 데이터를 사용해 모델을 학습할 방법이 필요하다. 이후에는 모델을 배포하고 시간 경과에 따른 모델 이탈을 모니터링하고 필요에 따라 재학습할 방법도 필요하다.   컴퓨팅 리소스 및 GPU와 같은 가속기에 투자했다면 위의 모든 작업을 온프레미스에서 할 수 있지만, 리소스가 충분하다는 말은 대부분의 시간 동안 그 리소스가 유휴 상태임을 의미하기도 한다. 필요에 따라 대량의 컴퓨팅 리소스와 가속기를 사용해서 전체 파이프라인을 클라우드에서 실행한 후 해제하는 방식이 비용 측면에서 더 효과적인 경우가 있다.     주요 클라우드 제공업체(일부 비주류 업체도)는 프로젝트 계획부터 프로덕션의 모델 유지관리에 이르기까지 머신러닝 라이프사이클 전체를 지원하기 위한 머신러닝 플랫폼을 세심하게 구축했다. 이와 같은 클라우드 중에서 자신의 요구 사항에 맞는 클라우드를 어떻게 확인해야 할까? 엔드투엔드 머신러닝 플랫폼이라면 꼭 제공해야 하는 12가지 기능을 살펴보자.   데이터와 가까울 것 정확한 모델을 구축하는 데 필요한 많은 양의 데이터가 있다 해도 그 데이터를 가져오기 위해 지구 반바퀴를 돌아야 한다면 효용이 떨어진다. 문제는 거리가 아니라 시간이다. 데이터 전송 속도의 최대 한계는 빛의 속도다. 무한한 대역폭을 가진 완벽한 네트워크라 해도 그 속도를 넘어설 수는 없다. 긴 거리는 지연을 의미한다.   데이터 집합이 매우 클 때 이상적인 것은 데이터가 있는 위치에 모델을 구축해서 대량 데이터를 전송할 필요가 없도록 하는 것이다. 제한된 범위에서 이런 서비스를 제공하는 데이터베이스는 몇 가지 있다.   차선책은 데이터가 모델 구축 소프트웨어와 동일한 고속 네트워크에 위치하는 형태로, 일반적으로 같은 데이터센터 내에 위치하는 경우가 여기에 해당한다. 데이터의 용량이 테라바이트 이상인 경우 한...

머신러닝 딥러닝 주피터랩 2020.08.12

“자동화 기회 포착부터 봇 생성까지 한 번에” RPA 통합 프로세스 디스커버리 솔루션에서 답을 찾다 - IDG Summary

‘기회를 한 번도 만나지 않은 이는 없다. 포착하지 못했을 뿐이다’라는 말이 있다. 이는 RPA 여정에서도 해당되는 이야기다. 자동화의 효용성을 목격했거나 혹은 직접 입증한 기업들이 RPA 확대에 나서고 있다. 문제는 바로 ‘무엇을 자동화해야 하는가?’다. 막상 자동화 기회를 발견하기가 어렵기 때문이다. 운 좋게 발견하더라도 제대로 구현하지 못하거나 혹은 기대한 성과를 달성하지 못하는 경우도 많다. 프로세스 디스커버리가 정확하게 이뤄지지 않은 탓이다. 수많은 프로세스 중에서 어떻게, 그리고 정확하게 자동화 기회를 포착할 수 있을까? 한 플랫폼에서 프로세스 디스커버리부터 봇 생성, 배포에 이르기까지 엔드투엔드 자동화 구현 경험을 제공하는 오토메이션애니웨어의 ‘디스커버리 봇(Discovery Bot)’을 살펴본다. 주요 내용  - 무엇을 자동화해야 하는가?  - 처음부터 끝까지 한 플랫폼에서 이뤄지는 RPA 여정 - 자동화 주기를 획기적으로 앞당기다

오토매이션애니웨어 Automation Anywhere RPA 2020.07.24

토픽 브리핑 | "폭발적 성장에도 걸림돌은 있다" 딥 러닝의 현황과 과제

지난 10년 간 인공지능(Artificial Intelligence)의 세계는 엄청난 발전을 보여 각 산업계에서 잘 활용하고 있을뿐만 아니라 IT 산업의 모든 분야에서 없어서는 안될 요소가 됐다. 애플리케이션, 개발 툴, 컴퓨팅 플랫폼, DBMS, 미들웨어, 관리 및 모니터링 툴 등 거의 모든 IT 분야에 영향을 미치고 있다. 심지어 AI를 개선하는 데도 사용힌다.  2020년대 인공지능 기술 동향 예측 하지만 일반 기업이 인공지능이나 머신러닝(Machine Learning)을 사용하기에는 아직도 기술 장벽이 높다(사실 높을 것으로 오해하는 측면이 많다). 특히 딥 러닝(Deep Learning)은 더욱 그그렇다.  “비즈니스 결과물로 직결되는” AI, 머신러닝, 딥 러닝 이해와 활용 가이드 딥 러닝은 서로 연결된 한계 스위치(Threshold switches)를 통해 만든 인공 신경망(Artificial Neural Network)을 학습시켜, 동물의 뇌와 신경계처럼 패턴을 인식할 수 있게 만들 수 있다는 개념이다. 그래서 딥 러닝은 일반적으로 인공지능, 머신러닝을 거론할 때 떠오르는 인간의 머리, 두뇌와 같은 이미지에 가장 적합한 용어다. 딥 러닝은 데이터에 존재하는 패턴을 복잡한 다계층 네트워크로 모델화하는 머신러닝의 일종으로, 상당히 풀기 어려운 컴퓨터 비전이나 자연어 처리와 같은 문제를 해결하는데 사용한다. 하지만 학습과 배포에 있어 일반적인 컴퓨팅 역량으로는 감당하지 못해 GPU, TPU, FPGA 같은 하드웨어 엑셀레이터(가속기)가 필요하다.   폭발적인 발전을 거듭하는 "딥 러닝" 이해하기 딥 러닝과 머신러닝의 차이점 이해하기  딥 러닝이 좋다고 해서 머신러닝의 모든 영역을 차지하는 것은 아니다. 컴퓨터 비전과 같이 딥 러닝이 필수적인 영역도 있지만, 표 형태의 데이터와 같이 딥 러닝과 잘 맞지 않는 영역도 있다. 성능 좋은 노트북에서 몇 분이면 학습이 가능한 머신러닝 방식을 놔두고 비슷한 정확...

딥러닝 머신러닝 인공지능 2020.06.05

AI 확장 준비와 코어 기아 현상으로 인한 어려움 : IDC 백서

지난 몇 년 동안 IDC는 많은 기업이 광범위한 AI 기능 개발을 시작하는 것을 목격했습니다. 이와 동시에 IT 부서 역시 AI를 실행하는 인프라 측면에서 학습 곡선을 경험하게 되었습니다. 이제 딥 러닝 학습 또는 추론 작업을 위한 인프라 요구 사항 및 제품화 환경을 위한 확장 방법은 매우 명백합니다.  딥 러닝 학습에는 다른 워크로드과 구별되는 특정한 인프라가 필요합니다. 딥 러닝 학습에는 강력한 프로세서, 대용량 코프로세서, 고속 상호 연결, 대규모 I/O 대역폭, 대규모 메모리가 준비된 클러스터드 노드가 필요합니다. 이제 IT 부서가 해야 할 최선의 의사 결정은 AI 워크로드에 사용할 노드당 성능을 어떻게 할지 결정하는 것입니다. <16p> 주요 내용 - 클라우드 대비 온프레미스 - 코어 기아 현상 - AI 인프라 고려 사항 - IBM POWER SYSTEM AC922 - 당면 과제와 기회, 향후 전망

코어 인공지능 AI 2020.04.08

딥러닝에 대한 10가지 질문

데이터 과학 문제, 더 구체적으로는 인공 지능(AI) 영역에서 성공적으로 딥러닝(Deep Learning)을 사용하기 위한 전략을 설명하는 기사는 흔히 볼 수 있다. 그러나 딥러닝 자체와 딥러닝이 그렇게 강력한 이유, 그리고 실제 사용 환경에서 딥러닝이 취하는 다양한 형태에 대한 명확한 설명은 찾기가 쉽지 않다. 딥러닝, 신경망, 중요한 혁신, 가장 널리 사용되는 패러다임, 딥러닝이 효과적인 분야와 그렇지 않은 분야, 그리고 딥러닝의 간략한 역사에 대해 더 자세히 알기 위해 몇 가지 질문을 던지고 답을 구했다.   딥러닝이란 정확히 무엇인가? 딥러닝은 전통적인 신경망의 현대적 발전이다. 실제로 고전적인 피드 포워드(feed-forward), 완전 연결, 역전파(backpropagation) 학습, 다층 퍼셉트론(MLP)에 “더 깊은” 아키텍처가 추가된 것이다. 더 깊다는 것은 순환망, 합성곱망의 경우와 같이 숨겨진 층이 더 많고 몇 가지 새로운 신경 페러다임이 더 있다는 것을 의미한다. 딥러닝과 신경망의 차이는 무엇인가? 차이점은 없다. 딥러닝 네트워크가 곧 신경망이고, 단지 1990년대에는 학습이 불가능했던 수준의 더 복잡한 아키텍처가 추가됐을 뿐이다. 예를 들어 순환신경망(RNN)의 장단기 메모리(LSTM) 유닛은 1997년 호크라이터와 슈미트후버에 의해 고안됐지만 계산 시간이 길고 계산 리소스의 요건이 높았던 탓에 오랜 시간 도입되지 못했다. 두 개 이상의 숨겨진 층이 있는 다층 퍼셉트론 역시 나온 지 오래된 개념이고 그 혜택도 이미 명확히 알려졌다. 중대한 차이점은 현대의 연산 자원 덕분에 이제 이와 같은 개념을 실제로 구현할 수 있게 됐다는 것이다. 딥러닝을 좌우하는 요소는 결국 더 강력한 컴퓨팅 자원인가? 일반적으로 더 빠르고 더 강력한 연산 자원은 더 강력하고 유망한 신경 아키텍처의 구현과 실험을 가능하게 해준다. 신경망 학습에 며칠씩 소비하는 방식은 같은 신경망을 GPU 가속의 도움을 받아 몇 분만에 학습시키는 방법과 경쟁할 수...

인공지능 딥러닝 신경망 2020.03.16

"GPU 성능 파워업!" LMS기술 테스트 결과

딥러닝(Deep learning)이든 전통적인 HPC(High Performance Computer)든 GPU(Graphics Processing Unit)를 사용하시는 모든 분들이 골치 아파하시는 것 중 하나가 바로 ‘GPU 메모리’입니다. GPU에서 무언가를 연산하기 위해서는 해당 로직과 데이터를 CPU 메모리에서 GPU 메모리로 복사(Copy)부터 해야했습니다. 그런데 보통 12GB~24GB 정도인 작은 GPU 메모리 때문에 원하는 데이터를 다 복사해 올 수도 없고 속도도 느려 성능상 만족스럽지 못했죠. IBM은 이를 보완하기 위해 획기적인 솔루션, LMS(Large Model Support)을 개발했습니다. 그리고 테스트를 통해 월등히 나아진 성능을 확인할 수 있었습니다. 주요 내용 - GPU 메모리 부족(out of memory) 문제 해결 - ‘유니파이드 메모리(UM)’ 개발... 편리하지만 활용도 낮아 - IBM, 새로운 돌파구 ‘LMS’로 GPU 성능 끌어올린다 - 경희대 MLVC Lab, 고해상도 영상 위해 IBM LMS 테스트 - LMS 테스트 결과, 눈에 띄게 향상된 GPU 성능  

메모리 HPC gpu 2019.12.03

AI 개발을 위한 최적의 프로그래밍 언어 6+2선

인공 지능(Artificial Intelligence, AI)는 애플리케이션 개발자에게 무한한 가능성을 제공한다. 머신러닝 또는 딥 러닝을 활용해 훨씬 더 정확한 사용자 프로필, 개인 맞춤 설정, 추천을 만들거나 더 스마트한 검색, 음성 인터페이스 또는 지능형 비서를 구현하거나 그 외의 다양한 방법으로 앱을 개선할 수 있다. 심지어 예전에는 생각지도 못했던, 보고 듣고 상황에 반응하는 애플리케이션을 만들 수도 있다.   AI를 온전히 활용하기 위해서는 어떤 프로그래밍 언어를 배워야 할까? 물론 좋은 머신러닝, 딥 러닝 라이브러리가 풍부한 언어가 좋다. 또한 우수한 런타임 성능, 충실한 툴 지원, 대규모 프로그래머 커뮤니티, 건강한 지원 패키지 생태계도 필요하다. 요구사항이 많지만 괜찮은 선택지 역시 풍부하다.  AI 개발을 위한 6가지 최적의 프로그래밍 언어와, 이 목록에는 들지 못했지만 살펴볼 만한 2가지 언어를 소개한다. 이 가운데에는 인기 상승 중인 언어도 있고 하락세인 언어도 있고 딥 러닝 아키텍처와 애플리케이션의 역사에 관심이 있는 경우에만 알면 되는 언어도 있다. 이제부터 각각의 장단점을 살펴보자. 파이썬(Python) 선두는 여전히 파이썬이다. 사실 다른 언어가 이 자리를 뺏기도 쉽지 않다. 파이썬에도 나름의 골치 아픈 문제는 있지만 AI 작업을 한다면 어느 시점에는 거의 무조건 파이썬을 사용하게 된다. 또한 파이썬의 투박한 부분들도 그동안 어느정도 개선됐다. 2020년을 목전에 둔 지금, 주요 라이브러리 대부분이 파이썬 3.x를 지원하고 파이썬 2.x에 대한 지원을 속속 중단하고 있음을 감안하면 파이썬 2.x냐, 파이썬 3.x냐의 논란은 거의 무의미하다. 즉, 모든 새로운 언어 기능을 마침내 본격적으로 활용할 수 있게 됐다. 모든 솔루션이 각자 다른 방법으로 조금씩 문제가 있는 악몽 같은 파이썬의 패키징은 여전하지만 95%의 상황에서는 별다른 걱정 없이 아나콘다(Anaconda)를 사용할 수 있다. 그럼에도 파이썬 측...

자바 줄리아 루아 2019.11.22

"파이토치"냐 "텐서플로우"냐, 딥 러닝 프레임워크 선택 가이드

모든 회귀(regression) 또는 분류(classification) 문제를 딥 러닝(deep learning)으로 풀어야 할 필요는 없다. 그렇게 따지면 모든 회귀 또는 분류 문제를 머신러닝으로 풀어야 할 필요도 없다. 결국 많은 데이터 집합은 분석적으로, 또는 간단한 통계적 절차를 사용해 모델링할 수 있기 때문이다.    반면 딥 러닝 또는 심층 전이 학습(deep transfer learning)이 다른 방법으로 만들 수 있는 모델보다 더 정확한 모델을 학습시키는 데 도움이 되는 경우도 있다. 이런 경우, 특히 필요한 모델과 비슷한 학습된 모델이 프레임워크의 모델 라이브러리에 이미 존재한다면 파이토치(PyTorch)와 텐서플로우(TensorFlow)가 매우 효과적이다. 파이토치 파이토치는 예전의 토치(Torch) 및 카페2(Caffe2) 프레임워크를 기반으로 한다. 이름에서 짐작하겠지만 파이토치는 파이썬을 스크립팅 언어로 사용하며, 진화된 토치 C/CUDA 백엔드를 사용한다. 카페2의 프로덕션 기능은 현재 파이토치 프로젝트로 편입되는 중이다. 흔히 파이토치를 “강력한 GPU 가속이 적용되는 파이썬으로 된 텐서와 동적 신경망”이라고 한다. 이것이 무슨 뜻일까? 텐서(Tensors)는 물리학과 공학에 많이 사용되는 수학적 구조다. 랭크 2의 텐서는 특수한 종류의 행렬로, 벡터의 내적(inner product)을 취하고 텐서는 새로운 크기와 새로운 방향으로 다른 벡터를 산출한다. 텐서플로우는 시냅스 무게의 텐서가 네트워크 모델을 따라 흐른다는 데서 이름을 따왔다. 넘파이(NumPy) 역시 텐서를 사용하지만 ndarray라는 명칭을 사용한다. GPU 가속(GPU acceleration)은 대부분의 현대 심층 신경망 프레임워크에 있는 기능이다. 동적 신경망(dynamic neural network)은 반복할 때마다 변경이 가능한 신경망으로, 예를 들어 파이토치 모델이 학습 중 숨은 계층을 추가하거나 제거해서 정확성과 일반성을 개선할 ...

머신러닝 딥러닝 신경망 2019.08.28

패턴 찾기·노이즈 추적에 효과적인 비지도 학습 알아보기

지도(supervised) 머신 러닝과 딥 러닝이 성공적인 결과를 거두고 있다. 동시에 비지도(unsupervised) 학습의 잠재력이 더 크다는 주장도 있다. 지도 학습 시스템의 학습은 훈련으로 제어된다. 즉, 지도 학습 시스템은 훈련된 학습 대상의 작업만 학습할 수 있다. 반면 비지도 시스템은 이론적으로는 인간이 학습할 수 있는 모든 작업을 학습하는 능력을 의미하는 “인공 일반 지능(artificial general intelligence)”에 도달할 수 있다. 다만 아직 기술이 그 수준까지 발전하지는 않았다.   지도 학습의 가장 큰 문제가 트레이닝 데이터의 레이블링 비용이라면, 데이터가 레이블링되지 않는 비지도 학습의 가장 큰 문제는 제대로 작동하지 않는 경우가 많다는 점이다. 그러나 비지도 학습에도 적합한 용도가 있다. 비지도 학습은 데이터 집합의 차원을 축소하고 데이터의 패턴과 구조를 탐색하고 비슷한 개체 그룹을 찾고 데이터에서 이상점과 노이즈를 찾는 데 효과적인 경우가 있다.   일반적으로 연구를 위한 데이터 분석에서 패턴과 군집을 찾고 데이터의 차원을 축소하고 잠복 특징을 발견하고 이상점을 제거하기 위해 비지도 학습 방법을 시도할 가치는 충분하다. 그런 다음 목표와 데이터에 따라 지도 학습으로 전환해서 계속 연구를 진행하거나 사전 학습된 모델을 사용해서 예측을 수행하면 된다.   비지도 학습이란? 인간 어린이가 학습하는 방법을 생각하면 된다. 부모나 교사가 어린이에게 개와 고양이를 알아보는 방법을 가르치기 위해 모든 품종의 개와 고양이를 보여줄 필요는 없다. 어린이는 많은 설명 없이 몇 개의 예시만으로 학습하고 스스로 일반화할 수 있다. 물론 치와와를 처음 보는 아이는 고양이라고 착각할 수도 있지만 그 정도는 비교적 신속하게 교정할 수 있다.   어린이는 자신이 보는 사물을 직관적으로 그룹으로 분류한다. 비지도 학습의 목표 중 하나는 기본적으로 컴퓨터가 이와 같은 능력을 개발하도록 하는 데 있다. 딥마인드(De...

AI 머신러닝 딥러닝 2019.08.09

리뷰 | 텐서플로우 2, "더 쉬워진 머신러닝"

이제 머신러닝과 딥 러닝의 중요함에 대해서는 반론의 여지가 없다. 수십 년 동안 반복된 약속과 허황된 기대, 실망 끝에 두 기술 모두 마침내 실무에 활용되는 수준에 이르렀다. 머신러닝이나 딥 러닝 애플리케이션은 아직 완벽함에는 이르지 못했지만 많은 경우 상당히 우수하다.   여러 우수한 머신러닝과 딥 러닝 프레임워크 중에서도 텐서플로우(TensorFlow)는 가장 성숙하고 연구 논문에서 가장 많이 인용되며(구글 직원들의 인용을 제외하더라도) 프로덕션 사용사례도 가장 견실하다. 배우기 가장 쉬운 프레임워크라고 할 수는 없지만 2016년에 비하면 훨씬 더 문턱이 낮아졌다. 텐서플로우는 많은 구글 서비스의 기반이다. 텐서플로우 2.0 웹사이트는 텐서플로우 프로젝트를 “종합적인 오픈소스 머신러닝 플랫폼”으로 소개한다. 그러나 지금의 텐서플로우는 더 포괄적으로, “연구자들이 AI 기반 애플리케이션을 구축하고 배포하는 데 도움이 되는 툴과 라이브러리, 커뮤니티 리소스의 생태계”로 발전했다. 텐서플로우 2.0의 네 가지 주요 구성 요소는 다음과 같다. - 텐서플로우 코어(TensorFlow core): 머신러닝 모델을 개발하고 학습시키기 위한 오픈소스 라이브러리 - TensorFlow.js: 브라우저와 Node.js에서 모델을 학습 및 배포하기 위한 자바스크립트 라이브러리 - 텐서플로우 라이트(TensorFlow Lite): 모바일 및 임베디드 디바이스에 모델을 배포하기 위한 가벼운 라이브러리 - 텐서플로우 익스텐디드(TensorFlow Extended, TFX): 대규모 프로덕션 환경에서 데이터를 준비하고 모델을 학습, 검증, 배포하기 위한 플랫폼   과거 필자는 텐서플로우 r0.10(2016)과 텐서플로우 1.5(2018)를 리뷰한 적이 있다. 처음의 텐서플로우는 데이터 흐름 그래프를 기반으로 하는 머신러닝 및 신경망 라이브러리였으며 배우기가 어렵고 저수준 API를 사용했다.  그러나 이후 발전을 거듭해 텐서플로우 2.0은 보통 ...

리뷰 파이썬 머신러닝 2019.07.04

폭발적인 발전을 거듭하는 "딥 러닝" 이해하기

딥 러닝(Deep Learning)은 데이터에 존재하는 패턴을 복잡한 다계층 네트워크로 모델화하는 머신러닝의 일종이다. 딥 러닝은 문제를 모델화하는 가장 총체적인 방법이기 때문에, 컴퓨터 비전과 자연어 처리 같은 어려운 문제를 해결할 잠재력을 갖고 있다. 또 전통적인 프로그래밍, 기타 머신러닝 기법보다 낫다.   어렵지만 유용한 딥 러닝  딥 러닝을 이용하면 다른 방법으로는 불가능한 유용한 결과를 얻을 수 있다. 또 다른 방법보다 더 정확한 모델을 만들 수 있고, 유용한 모델을 만드는 데 소요되는 시간을 줄일 수 있다. 그러나 딥 러닝 모델 트레이닝에는 아주 높은 컴퓨팅 성능이 필요하다. 또 다른 단점은 딥 러닝 모델 해석이 어렵다는 것이다.  딥 러닝은 아주 중요한 특징 한 가지를 갖고 있다. 트레이닝 할 모델의 인풋과 아웃풋 사이에 숨겨진 계층(hidden layer)이 한 개 이상 존재해야 한다는 것이다. 대부분의 담론에서 딥 러닝은 심층신경망(Deep Neural Networks, DNN)을 사용하는 것을 의미한다. 그러나 신경망 외에도, 다른 종류의 숨겨진 계층을 사용해 딥 러닝을 구현하는 알고리즘들이 소수 존재한다. 딥 러닝 대 머신러닝 딥 러닝은 머신러닝의 한 종류다. 필자는 많이 사용되는 용례에 부합하게 딥 러닝과 관련이 없는 머신러닝을 전통적 머신러닝으로 지칭할 것이다. 일반적으로 전통적 머신러닝 알고리즘이 딥 러닝 알고리즘보다 더 빠르게 실행된다.  하나 이상의 CPU로 전통적 모델을 트레이닝시키기 충분한 경우가 많다. 딥 러닝 모델의 경우, 트레이닝과 대규모 배포에 GPU, TPU, FPGA 같은 하드웨어 엑셀레이터(가속기)가 필요한 때가 많다. 엑셀레이터가 없다면, 모델 트레이닝에 몇 달이 소요될 수도 있다. 일부 전통적 머신러닝 알고리즘은 많은 문제에서 ‘충분히 좋은’ 모델을 생산해줄 것이다. 그러나 과거를 비춰봤을 때, 전통적 머신러닝 모델이 적합하지 않은 문제들도...

머신러닝 딥러닝 심층망 2019.05.28

“비즈니스 결과물로 직결되는” AI, 머신러닝, 딥 러닝 이해와 활용 가이드 - IDG DeepDive

머신러닝, 딥 러닝은 2019년 현재 가장 뜨거운 관심을 모으는 분야인 동시에, 개별 기술 간 경계를 넘어 전 산업 분야에 커다란 파급 효과를 미칠 변화로 여겨진다. 그러나 실제 기업 내 AI 개발 및 활용 프로젝트가 수익 등 구체적인 성과로 연결되는 경우는 흔치 않다. 지금 가장 필요한 것은 복잡하게 연결된 각 기술의 개념 정의를 내리고 기업에서 바로 쓸 수 있는 머신러닝 알고리즘 사례를 선별하는 작업일 것이다. 여기에 더해 세 기술의 접점을 통해 기술 프레임워크와 기업의 성과를 연결하는 법, 기업 내 AI 프로젝트의 실패 원인까지 파악하면, 성과와 연결되는 구체적인 AI 활용 전략을 세울 수 있을 것이다. 주요 내용 - 왜 AI인가 : 비즈니스 맥락에서의 AI - AI 정의 : BI에서 AI로의 자연스러운 진전 - AI, 머신러닝, 딥 러닝은 어떻게 다른가 - 머신러닝 모델 성능 측정 방법 - 머신러닝 모델 구축이 어려울 수 있는 이유 - AI 프로젝트가 실패하는 이유

AI 개발자 머신러닝 2019.03.21

딥러닝에 대한 전문 지식 없이 AI 솔루션 작성 : IBM PowerAI Vision

PowerAI Vision은 딥러닝 기능이 있는 컴퓨터 비전의 액세스 가능성과 성능을 높여줍니다. PowerAI Vision 소프트웨어를 가속화된 IBM® Power Systems™와 결합하면, 강력한 성능을 지니고 완전히 최적화되어 있으며 전문적 지원을 받을 수 있는 플랫폼을 신속하게 배치할 수 있습니다. PowerAI Vision에는 해당 분야별 전문가가 코딩이나 딥러닝에 대한 전문 지식이 없어도 Vision 모델을 생성할 수 있도록 해주는 직관적인 툴셋이 포함되어 있습니다. 또한, 가장 인기 있는 딥러닝 프레임워크와 이에 부속되는 종속 항목들을 포함합니다. PowerAI Vision은 쉽고 빠른 배치와 팀 생산성 향상을 목적으로 구축되었습니다. 주요 내용 - 모두를 위한 AI: - 데이터 레이블링의 가속화 - 어디서나 학습 및 배치 가능한 융통성 - 더 빠른 통찰과 더 높은 정확도 보장 - 엔터프라이즈급 제품

인공지능 AI 딥러닝 2019.02.13

IDC 백서 : AI 구현을 위한 효율적인 딥 러닝 애플리케이션 개발 방식

오늘날 경쟁이 매우 치열한 비즈니스 환경에서 기업은 점점 증가하는 대용량 데이터와 함께 다양한 자동화 방식을 통해 판매량을 늘리고 비용을 절감하면서 비즈니스 프로세스를 효율화함으로써 고객을 보다 잘 이해할 수 있는 새로운 방법을 모색하고 있습니다. 이를 위해 많은 기업이 딥 러닝(Deep Learning)이라는 인공지능(Artificial Intelligence, AI) 구축 방법을 애플리케이션 및 비즈니스 프로세스에 실제 적용하기 시작했습니다. 기계 학습(Machine Learning, ML)은 사람이 프로그래밍하지 않더라도 다양한 유형의 데이터를 기반으로 기계가 똑똑한 작업을 해내는 정교한 통계 모델을 생성하는 과정입니다. 그 중에도 딥 러닝은 대용량 데이터를 신경망 알고리즘을 기반으로 학습하는 기계학습의의 한 유형이며 보다 정확한 통찰, 추천 및 예측을 하는 데 사용하고 있습니다. 본 백서는 딥 러닝을 위한 프레임워크와 도구에는 어떤 것들이 있으며 인공지능 구현 애플리케이션을 개발하는 데 도움이 되는 도구와 기술 유형을 소개합니다. <12p> 주요 내용 - 시장 상황 개요 - AWS 기반 기계 학습 및 딥 러닝 서비스 활용 - 과제와 기회 - 결론

인공지능 idc AWS 2018.10.15

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.