강화학습

로봇의 AI에 '안전'을 학습시키는 방법

다른 능력처럼 안전(Safety) 또한 로봇 지능에 바탕이 되는 인공 지능(AI)으로 구현하고 트레이닝해야 한다. 자주 사람과 부딪히고, 자율주행 자동차에 탑승한 승객을 위험하게 만들고, 소유자의 허가 없이 온라인에서 제품을 주문하는 로봇을 용납할 사...

로봇 인공지능 AI 2021.04.16

어렵지만 도전할 가치 있는 '강화학습 알고리즘' 직접 실험하기

1990년대 대학원에 다닐 때, 필자가 가장 좋아하는 수업은 신경망이었다. 그 당시에는 텐서플로우(TensorFlow)나 파이토치(PyTorch), 케라스(Keras)가 존재하지 않았으므로, 교재의 공식대로 뉴런과 신경망, 학습 알고리즘을 직접 프로그...

강화학습 비지도학습 2021.02.22

IDG 블로그 | 머신러닝의 다음은 더 큰 다양성과 유연성

머신러닝은 이제 손쉬운 물건이 됐다. 퍼블릭 클라우드 컴퓨팅 덕분에 저렴해지면서 이제 모든 클라우드 기반 애플리케이션이 머신러닝을 효과적으로 적용하고 있다.   현재 사용되고 있는 머신러닝은 크게 세 가지 종류로 나눌 수 있다. -&nb...

강화학습 지도학습 라벨링 2020.01.02

"알파고를 만든" 강화 학습 이해하기

구글 딥마인드(DeepMind)의 알파고(AlphaGo)는 사람들에게 친숙한 이름이다. 알파고는 2015년 프로 2단 바둑 기사와의 시합에서 승리하면서 유명세를 탄 이후, 개선된 알파고 버전은 세계적인 프로 바둑 기사인 이세돌 9단과의 시합에서도 승리...

머신러닝 알파고 reinforcement learning 2019.06.11

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.