Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
미래기술

글로벌 칼럼 | 마이크로소프트의 얼굴 인식 서비스 중단이 주는 교훈 

Evan Schuman | Computerworld 2022.07.12
마이크로소프트가 얼굴 인식 기능을 포함해 AI 기반 서비스 일부를 중지하기로 결정했다. 공식 블로그를 통해 마이크로소프트는 서비스 중지 소식과 더불어 그동안 AI 기술이 일으켰던 차별과 정확성 문제를 인정하기도 했다.
 
ⓒ Getty Images Bank

하지만 관련 문제를 고칠 수 있는 시간이 몇 년이나 있었음에도 마이크로소프트는 이 문제를 해결하지 않았다. 지금의 결정은 마치 자동차 제조업체가 차량을 수리하는 대신 리콜하는 것과 비슷하다. 사람들은 마이크로소프트의 기술이 차별적이라고 지적하곤 하지만 사실 그보다 큰 문제는 결과의 부정확성이다. 

6월 21일부터 마이크로소프트의 신규 고객은 애저 페이스(Azure Face) API, 컴퓨터 비전(Computer Vision), 비디오 인덱서(Video Indexer)에서 얼굴 인식 기능을 사용하려면 접근 신청을 따로 해야 한다. 기존 고객은 각자 제시한 용도에 따라 1년 이내에 다시 접근 신청을 하고 승인을 받아야 한다. 흐릿함, 노출, 안경, 머리 자세, 주요 지형지물, 잡음, (치아) 교합, 얼굴 바운딩 박스를 포함한 얼굴 감지 기능은 따로 신청할 필요 없이 누구나 이용할 수 있다.

마이크로소프트 애저 AI 수석 그룹 제품 관리자 사라 버드는 지난달 “책임 있는 AI를 실현하고 사용자와 사회에 높은 가치를 제공하기 위해서 얼굴 인식 기술의 사용과 배포를 ‘제한된 접근(Limited Access)’ 방식을 운영하려 한다”라며 “얼굴 인식 서비스와 관련해서는 사용 용도를 확인하고 고객 자격 요건을 확인할 계획”이라고 밝혔다. 

사용자와 사회에 가치를 제공하기 위함을 강조한 점에 주목하자. 그럴듯한 이야기지만 과연 정말 높은 가치를 제공하기 위해서일까? 아니면 부정확한 마이크로소프트의 기술을 이용하는 사용자를 줄이려는 방편으로 이런 정책을 시행하는 걸까? 

마이크로소프트는 이번 발표문에서 음성 인식 기술을 언급했다. 마이크로소프트의 책임 있는 AI 부문 최고 책임자 나탸샤 크램튼은 “음성을 문자로 변환하는 기술을 흑인 및 아프리카계 미국인이 이용할 경우, 백인 사용자에 비해 오류가 약 2배 더 발생하는 것으로 나타났다”라며 “원인을 조사한 결과, 테스트 과정에서 사용된 음성 데이터에 다양한 배경과 출신의 목소리를 반영하지 못했다는 걸 알았다”라고 밝혔다. 그뿐만 아니라 배경과 출신을 막론하고 사람들은 격식을 차린 상황과 그렇지 않은 상황에서 목소리가 달라지는 부분도 음성 인식 결과에 문제를 야기하기도 했다. 

정말 마이크로소프트 개발자들이 이 부분을 미리 알아채지 못했을까? 분명히 알았지만 아무 조처를 취하지 않을 경우 생길 결과를 심사숙고하지 못했다고 본다.

문제를 해결하려면 데이터 수집 과정을 재점검해야 한다. 음성 분석 용도로 목소리를 녹음하는 사람은 약간 긴장해서 경직되고 딱딱하게 말할 가능성이 높다. 따라서, 최대한 편안한 환경에서 기존보다 훨씬 긴 시간을 두고 녹음하는 것이 좋다. 오래동안 녹음할 경우, 어떤 사람은 녹음 중이라는 사실까지 잊어버리고 자연스러운 패턴으로 말하게 된다. 

필자는 사람이 음성 인식 기술을 사용할 때 이런 현상이 나타나는 것을 확인한 바 있다. 처음에는 다들 천천히, 그리고 지나치게 또렷하게 발음하려고 한다. 그리고 시간이 지나면서 익숙해지면서 평소 말투대로 돌아오게 된다. 

음성뿐만 아니라 감정 인식 기술에도 비슷한 문제가 발견됐다. 마이크로소프트는 같은 발표문에서 얼굴 분석 기능 중에서 감정 상태를 추론하고 성별, 연령, 미소, 수염, 머리카락, 화장 등과 같은 속성을 식별하는 기능을 폐지하겠다고 밝혔다. 버드는 “감정 분류의 경우, 사생활 침해 문제가 발생하는 것은 물론 나이, 성별, 지역, 상황 등에 따라 감정이나 표정에 대한 해석이 제각각이어서 결과를 일반화하기 어렵다는 문제가 제기됐다. 민감한 속성 예측 기능을 API로 공개하면, 차별적이거나 사람을 정형화하거나 또는 부당하게 서비스를 거부하는 식으로 오용될 가능성이 매우 크다”라고 설명했다. 

감정 인식은 얼굴 인식을 활용하게 되는데, 지금까지 나온 연구에 따르면 얼굴 인식의 정확도는 음성 인식보다 훨씬 낮다. 반면에 음성 감정 인식은 콜센터 애플리케이션에서 상당히 효과가 있는 것으로 입증되었다. 화가 많이 난 목소리의 고객을 인식하면, 즉시 고위 관리자로 연결해주는 시스템을 만들어도 될 정도이다. 

마이크로소프트는 제한이 필요한 대상은 데이터 사용 방식이라고 주장했는데, 어느 정도 맞는 말이다. 만약 콜센터에서 음성 인식 기술 결과가 잘못된 경우, 즉 고객이 사실 화가 난 것이 아니었다면 아무런 문제가 없다. 고위 관리자가 전달받은 통화를 잘 끝마치면 그만이다. 단, 필자가 콜센터 음성 인식 결과에서 고객이 화를 낸 경우를 봤는데, 그때는 소프트웨어가 고객이 말하는 간단한 문장도 이해하지 못할 때였다. 자신한테 화를 내는지도 모르고 소프트웨어는 고객이 회사에 화가 나 있다고 분석해서 알려준다. 충분히 있을 수 있는 일이다. 그러나 이번에도 역시 소프트웨어가 틀린 것이라면 아무런 문제가 없다.

버드는 이런 AI 기능이 여전히 책임 있게 활용될 수 있는 용도도 있다고 주장했다. 버드는 “애저 코그니티브 서비스(Azure Cognitive Services) 고객은 이제 오픈소스 페어런(Fairlearn) 패키지와 마이크로소프트 페어니스 대시보드(Fairness Dashboard)를 활용해 자신의 데이터에 대한 마이크로소프트의 얼굴 인식 알고리즘의 공정성을 측정할 수 있다”라며 “기술 배포에 앞서 다양한 인구통계학적 집단에 영향을 미칠 수 있는 공정성 문제 발생 가능성을 파악하여 해결할 수 있는 것”이라고 설명했다. 

버드는 실제로 기술적 문제가 분석 결과의 부정확성에 일조했다고도 말했다. 버드는 “애초에 공정성 문제로 발생했다고 분석된 오류가 사실 사용한 이미지 품질이 낮아서 생겼다는 것을 알게 되었다”라며 “예를 들어 제출된 이미지가 너무 어둡거나 흐릿하면 모델이 정확히 매칭할 수 없다. 마이크로소프트는 저품질 이미지 때문에 일부 인구통계학적 집단을 반영하지 않은 불공정성이 생겼다고 본다”라고 밝혔다.

하지만 버드가 말한 일부 인구통계학적 집단을 반영하지 않았다는 정확한 설명이 아니다. 누구나 어떤 인구통계학적 집단에 속한다. 특정 그룹만 빼기는 어렵다. 이 말은 여전히 백인이 아닌 사람은 분석하기 어렵다는 의미로 들린다. 이래서 사법기관이 AI 도구를 법 집행에 사용하는 것은 문제가 매우 많다. 정확한 결과를 담보하지 못하기 때문이다. 

IT 부서는 ‘소프트웨어가 잘못된 경우 어떤 결과가 뒤따라오는가? 그 소프트웨어는 그저 사용 중인 수많은 도구 중 하나에 불과한가, 아니면 유일하고 절대적으로 필요한 소프트웨어인가?’ 같은 질문을 던져야 한다. 마이크로소프트는 문제를 새 도구로 해결 중이라고 밝혔다. 버드는 “앞으로 마이크로소프트는 고객에게 새로운 레코그니션 퀄리티(Recognition Quality) API를 제공한다”라며 “이 API는 얼굴 인식 목적으로 제출된 이미지 내의 조명, 흐릿함, 교합, 머리 각도의 문제를 표시한다”라고 밝혔다. 마이크로소프트는 결과의 정확성을 높이는 데 도움이 되는 고품질 이미지를 활용할 수 있는 앱도 제공한다.

크램튼은 ‘뉴욕 타임즈’와의 인터뷰에서 “시스템은 성별 분류 기준이 이분법적이어서 우리가 사는 세상의 가치와 어긋나는 문제도 있다”라고 지적했다. 즉 시스템은 대상을 남자 아니면 여자로만 생각하고 그 밖의 성별로 본인의 정체성을 확인하는 사람들은 쉽게 분류하지 못했다. 이런 경우에 마이크로소프트는 그냥 성별을 추측하지 않는 쪽을 택했다. 애매하지만 차라리 잘한 결정이다.  
editor@itworld.co.kr
 Tags 얼굴인식
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.