이 연구는 새로운 예시에 기반해 학습 과정을 단축하고 인간의 지식 습득 및 적용 과정과 조금 더 유사하게 만드는 것이 목표로 하며, 베이시언 프로그램 학습 모델(BPL)을 개발하고 컴퓨터에 필기체 글씨를 인식하는 법을 가르쳤다.
일반적인 패턴 인식 알고리즘은 픽셀 배열이나 특징 집합으로 개념을 나타낸다. BPL은 알고리즘, 즉 이 실험의 경우에는 샘플 문자에 제공된 데이터를 ‘설명’하는 것에 주안을 두고 학습에 접근했다. 컴퓨터 프로그램과 알고리즘이 컴퓨터가 시각적으로 인식하는 글자를 생성하기 위해 코드를 만들면서 자체적으로 프로그램한다. 또, 컴퓨터는 주어진 문자를 각기 다른 사용자들이 그리는 다양한 방식을 인식할 수 있다.
이 알고리즘 학습을 통해 컴퓨터가 시각적 튜링 테스트에 통과했다는 것은 무척 놀라운 결과다. 특히 연구자들이 사람과 컴퓨터에게 각각 단일 샘플을 보여준 이후 그 문자를 필기체로 따라 쓰게 했을 때, 인간과 컴퓨터로 이뤄진 피험자 일부는 이전에 보여준 방식에서 완전히 새로운 글자를 만들어냈고, 인간의 눈으로는 어느 것이 컴퓨터가 따라 쓴 글씨이고 어느 것이 사람이 쓴 글씨인지 분간할 수 없었다.
연구자들은 학습 모델을 산스크리트 문자, 티벳 문자, 구자라트 문자, 글라골루 문자, 심지어는 TV 시리즈 ‘퓨처라마’에 등장하는 가상 문자까지 50개 필기 시스템의 1,600가지 이상의 손글씨 문자에 적용했다.
연구에 참여한 토론토 대학 살라쿠디노프 교수는 “새로운 개념을 익힐 때 인간처럼 짧은 학습 시간이 필요한 머신러닝 프로세스를 구현하는 것은 무척 어렵다. 인간의 학습 능력을 복제하는 것은 머신 러닝, 통계, 컴퓨터 비전, 인지 과학을 연결하는 흥미진진한 연구 영역”이라고 밝혔다. editor@itworld.co.kr