2018.11.28

파괴적 망각(CF)이란? AI 개발에 어떤 영향 끼치나?

Thomas Macaulay | Techworld
기억 상실 때문에 고통받고 있는 사람들과 파괴적 망각(CF: Catastrophic Forgetting)으로 알려진 상태를 겪는 기계 사이의 공통점을 찾을 수도 있다는 주장이 제기됐다. 파괴적 망각은 신경망이 새로운 과업을 완수하도록 교육을 받을 때 발생한다.
 
ⓒ Getty Images Bank

동영상에서 인간을 감지하는 방식을 배우기 위해 프로필 사진을 스캔하는 안면인식 소프트웨어나, 무엇을 피해야 하는지 배우기 위해 도로에서 장애물을 연구하는 자율주행 자동차 등의 시스템은 미래의 정보를 해석하는 데 도움이 되는 훈련 데이터를 분석하면서 학습한다.

새로운 과업에 대한 교육을 받으면 이를 해결하기 위해 파라미터를 조정해야 한다. 이런 것들이 이전에 학습한 파라미터를 덮어쓰고 이전에 획득한 지식을 ‘잊게’ 된다.

이 현상은 지속적인 학습, 즉 새로운 과업을 순차적으로 배우는 과정을 없애기 때문에 범용 인공지능(AGI: Artificial General Intelligence)을 개발할 때 가장 큰 장벽이다.

텔레포니카 R&D에서 딥러닝 및 머신러닝을 담당하는 연구 과학자 조앤 세라는 "AGI가 항상 변화하는 새로운 것을 찾고 이런 변화에 적응해야 하기 때문에 변화하는 세계에서 이런 순차 학습 능력을 확보해야 한다"며 "이런 변화에 적응함으로써 잊게 되어 더 이상 정보가 아니게 된다"고 말했다. 

컴퓨터 공학자들은 이 문제와 수십 년 동안 씨름했다. 세라의 연구팀은 해결책을 찾았는지도 모른다.


기억력 개선

바르셀로나에 있는 텔레포니카 연구팀은 알고리즘에 필요한 메모리의 양을 최소화함으로써 CF의 문제를 해결하는 시스템을 개발했다.

그 메커니즘은 2가지의 파라미터로 구성된다. 하나는 신경망이 필요로 하는 정보를 정확도를 해치지 않으면서 가능한 가장 적은 뉴런으로 압축하며, 다른 하나는 과거의 과업을 완수하는 데 필수적이었던 장치를 보호한다.

세라는 "우리의 해결책은 새로운 과업을 학습하는 동안 공간을 최소화하면서 이와 동시에 이 지식을 넣는 축소된 공간에서 이전에 학습한 것을 바꾸지 않는 것이다"고 밝혔다.

이 연구는 입증된 아이디어를 효과적인 시스템으로 재탄생시켰다.

세라는 "우리는 뉴런을 건드리지 않으면 잊지 않는다는 사실을 알고 있다"고 말했다. 이어서 "신경망과 머신러닝 분야에서는 이런 매우 발전된 신경망을 위한 초소형 모델을 자동차나 휴대전화 등의 자원이 부족한 기계나 메모리나 용량이 매우 작은 기계에 배치하기 위해 시도하는 추세기 때문에 이런 신경망을 압축하려 하고 있다. 우리는 이 2가지를 스마트하게 결합했을 뿐이다"고 덧붙였다. 

그의 팀은 현재 이 압축 능력을 이용해 자동차나 휴대전화 등의 자원이 부족한 장치에 발전된 알고리즘을 배치할 수 있기를 바라고 있다.

"이런 알고리즘을 배치하기 위해 과거에 사용했던 기법 일부를 재활용할 수 있다고 생각한다"고 그는 말했다.


대체 시스템

CF를 위한 해결책을 개발한 조직은 텔레포니카의 R&D팀만이 아니다. 구글 딥마인드 연구원들은 최근 하나의 가상 환경에서 발견한 것이 다른 가상 환경에서는 어떤 모습일지 상상할 수 있는 AI 에이전트를 개발했다.

이 시스템은 객체의 정체 그리고 다른 각도 또는 다른 조명 환경에서 어떻게 보일 수 있는지 학습하기 위해 다른 각도에서 어떻게 보이는지에 대한 5가지 예를 도출한다. 다른 가상 세계에서는 어떤 모습일지 상상하고 그것과 이전에 본 것을 구분하여 이전의 학습 내용을 기억할 수 있다.

텔레포니카의 시스템이 최초는 아닐 수 있지만 세라는 이것이 최고라고 생각했다.

많은 대안이 제한된 수량과 유형의 데이터로만 시스템을 시험한 후 이런 데이터세트로부터 과업을 인공적으로 생성한 반면에 텔레포니카의 팀은 수기 숫자 식별부터 안면인식까지 다양한 과업에 대해 다양한 데이터세트를 시험했다.

"이렇게 더욱 엄격한 평가 환경에 알고리즘을 적용하면 그 중 일부가 정말로 기량을 제대로 발휘하지 못하는 모습을 보이며 여전히 개선의 가능성이 존재한다. 지금도 무엇인가를 잊고 있다"고 세라는 이야기했다.


남은 장벽

세라는 텔레포니카의 시스템만으로는 CF를 해결할 수 없음을 인정했다.

그는 신경망이 이용하는 정보의 단위를 더욱 효율적으로 사용할 수 있다고 생각하지만, 이것만으로는 역전달을 이용해 신경망을 훈련하는 근본적인 문제를 해결하지 못한다. 이 방법의 문제는 고정된 대상에 대해서는 네트워크를 최적화하며 새로운 정보를 입력할 때 방해를 받을 수 있다는 점이다.

세라는 추가적인 압축이 가능하다는 사실을 알고 있지만, 궁극적인 해결책은 더 이상 역전달에 의존하지 않는 완전히 새로운 기억 방법일 것으로 생각했다.

"핵심은 더욱 생물학적으로 탁월하고 과거의 정보를 지우는 것에 기초하지 않은 훈련 알고리즘을 찾는 것으로 생각한다. 하지만 쉽지 않은 일이다"고 그는 덧붙였다. ciokr@idg.co.kr


2018.11.28

파괴적 망각(CF)이란? AI 개발에 어떤 영향 끼치나?

Thomas Macaulay | Techworld
기억 상실 때문에 고통받고 있는 사람들과 파괴적 망각(CF: Catastrophic Forgetting)으로 알려진 상태를 겪는 기계 사이의 공통점을 찾을 수도 있다는 주장이 제기됐다. 파괴적 망각은 신경망이 새로운 과업을 완수하도록 교육을 받을 때 발생한다.
 
ⓒ Getty Images Bank

동영상에서 인간을 감지하는 방식을 배우기 위해 프로필 사진을 스캔하는 안면인식 소프트웨어나, 무엇을 피해야 하는지 배우기 위해 도로에서 장애물을 연구하는 자율주행 자동차 등의 시스템은 미래의 정보를 해석하는 데 도움이 되는 훈련 데이터를 분석하면서 학습한다.

새로운 과업에 대한 교육을 받으면 이를 해결하기 위해 파라미터를 조정해야 한다. 이런 것들이 이전에 학습한 파라미터를 덮어쓰고 이전에 획득한 지식을 ‘잊게’ 된다.

이 현상은 지속적인 학습, 즉 새로운 과업을 순차적으로 배우는 과정을 없애기 때문에 범용 인공지능(AGI: Artificial General Intelligence)을 개발할 때 가장 큰 장벽이다.

텔레포니카 R&D에서 딥러닝 및 머신러닝을 담당하는 연구 과학자 조앤 세라는 "AGI가 항상 변화하는 새로운 것을 찾고 이런 변화에 적응해야 하기 때문에 변화하는 세계에서 이런 순차 학습 능력을 확보해야 한다"며 "이런 변화에 적응함으로써 잊게 되어 더 이상 정보가 아니게 된다"고 말했다. 

컴퓨터 공학자들은 이 문제와 수십 년 동안 씨름했다. 세라의 연구팀은 해결책을 찾았는지도 모른다.


기억력 개선

바르셀로나에 있는 텔레포니카 연구팀은 알고리즘에 필요한 메모리의 양을 최소화함으로써 CF의 문제를 해결하는 시스템을 개발했다.

그 메커니즘은 2가지의 파라미터로 구성된다. 하나는 신경망이 필요로 하는 정보를 정확도를 해치지 않으면서 가능한 가장 적은 뉴런으로 압축하며, 다른 하나는 과거의 과업을 완수하는 데 필수적이었던 장치를 보호한다.

세라는 "우리의 해결책은 새로운 과업을 학습하는 동안 공간을 최소화하면서 이와 동시에 이 지식을 넣는 축소된 공간에서 이전에 학습한 것을 바꾸지 않는 것이다"고 밝혔다.

이 연구는 입증된 아이디어를 효과적인 시스템으로 재탄생시켰다.

세라는 "우리는 뉴런을 건드리지 않으면 잊지 않는다는 사실을 알고 있다"고 말했다. 이어서 "신경망과 머신러닝 분야에서는 이런 매우 발전된 신경망을 위한 초소형 모델을 자동차나 휴대전화 등의 자원이 부족한 기계나 메모리나 용량이 매우 작은 기계에 배치하기 위해 시도하는 추세기 때문에 이런 신경망을 압축하려 하고 있다. 우리는 이 2가지를 스마트하게 결합했을 뿐이다"고 덧붙였다. 

그의 팀은 현재 이 압축 능력을 이용해 자동차나 휴대전화 등의 자원이 부족한 장치에 발전된 알고리즘을 배치할 수 있기를 바라고 있다.

"이런 알고리즘을 배치하기 위해 과거에 사용했던 기법 일부를 재활용할 수 있다고 생각한다"고 그는 말했다.


대체 시스템

CF를 위한 해결책을 개발한 조직은 텔레포니카의 R&D팀만이 아니다. 구글 딥마인드 연구원들은 최근 하나의 가상 환경에서 발견한 것이 다른 가상 환경에서는 어떤 모습일지 상상할 수 있는 AI 에이전트를 개발했다.

이 시스템은 객체의 정체 그리고 다른 각도 또는 다른 조명 환경에서 어떻게 보일 수 있는지 학습하기 위해 다른 각도에서 어떻게 보이는지에 대한 5가지 예를 도출한다. 다른 가상 세계에서는 어떤 모습일지 상상하고 그것과 이전에 본 것을 구분하여 이전의 학습 내용을 기억할 수 있다.

텔레포니카의 시스템이 최초는 아닐 수 있지만 세라는 이것이 최고라고 생각했다.

많은 대안이 제한된 수량과 유형의 데이터로만 시스템을 시험한 후 이런 데이터세트로부터 과업을 인공적으로 생성한 반면에 텔레포니카의 팀은 수기 숫자 식별부터 안면인식까지 다양한 과업에 대해 다양한 데이터세트를 시험했다.

"이렇게 더욱 엄격한 평가 환경에 알고리즘을 적용하면 그 중 일부가 정말로 기량을 제대로 발휘하지 못하는 모습을 보이며 여전히 개선의 가능성이 존재한다. 지금도 무엇인가를 잊고 있다"고 세라는 이야기했다.


남은 장벽

세라는 텔레포니카의 시스템만으로는 CF를 해결할 수 없음을 인정했다.

그는 신경망이 이용하는 정보의 단위를 더욱 효율적으로 사용할 수 있다고 생각하지만, 이것만으로는 역전달을 이용해 신경망을 훈련하는 근본적인 문제를 해결하지 못한다. 이 방법의 문제는 고정된 대상에 대해서는 네트워크를 최적화하며 새로운 정보를 입력할 때 방해를 받을 수 있다는 점이다.

세라는 추가적인 압축이 가능하다는 사실을 알고 있지만, 궁극적인 해결책은 더 이상 역전달에 의존하지 않는 완전히 새로운 기억 방법일 것으로 생각했다.

"핵심은 더욱 생물학적으로 탁월하고 과거의 정보를 지우는 것에 기초하지 않은 훈련 알고리즘을 찾는 것으로 생각한다. 하지만 쉽지 않은 일이다"고 그는 덧붙였다. ciokr@idg.co.kr


X