윈도우

블로그 | 윈도우 AI 기능에서 발견한 마이크로소프트의 조급함과 성급함

Michael Crider | PCWorld 2023.10.04
AI는 업무 방식을 바꿀 것이다. AI 기술을 적극적으로 보급하는 여러 기업이 그렇게 말한다. 마이크로소프트도 여기에 포함된다. 하지만 최신 버전의 윈도우 11과 오피스, 마이크로소프트 365 플랫폼에 통합된 챗GPT, 달리(Dall-E) 및 기타 AI 시스템을 사용해 본 필자는 이런 말에 동의하지 않는다.
 
ⓒ Microsoft

마이크로소프트는 기업 및 수억 명의 사용자에게 필수적인 시스템과의 통합으로 코파일럿과 같은 새로운 도구를 열심히 밀어붙이고 있다. 하지만 파워 유저로서 말하자면, 그리고 파워 유저가 아닌 많은 사람의 제한된 관점을 받아들여서 말하자면 필자는 이런 새로운 도구가 ‘가끔씩 호기심을 자극하는 기능’ 이상의 것이라고 생각하지 않는다.

윈도우의 AI 기능은 필자의 업무 방식을 바꾸지 않을 것이며, 가장 큰 이점을 볼 수 있는 사람조차 시도를 주저할 것이라고 생각한다. 


효과가 없을 때까지만 효과가 있다

코파일럿과 같은 시스템에는 확실히 도움 되는 요소가 있다. 챗GPT 기반의 AI 텍스트 생성 기능은 매우 뛰어나서 타자에 익숙한 사람이 키보드로 입력하는 것보다 훨씬 빠른 1~2분 만에 몇 페이지 분량의 정보를 채워 넣을 수 있다. 이미지 생성도 인상적이다. 몇 줄의 텍스트 명령을 입력만으로 놀라울 정도로 상세하고 사실적인 이미지를 만들어 낸다. 타고난 작가가 아니거나 그림판 사용이 서투른 사람에게 이런 기능은 유명 SF 작가 아서 C. 클라크의 과학 3법칙에 나오는 ‘마법과 구별할 수 없는 과학 기술’처럼 느껴진다. 단, 효과가 없을 때까지만이다.
 


‘AI’이라는 용어는 스타트렉의 안드로이드 장교 데이터 같은 SF 소설 등장인물을 떠올리게 한다. 하지만 이는 부적절한 비유이며, 필자는 의도적으로 오해하게 만든 것이라고 생각한다. 현재 AI가 내놓는 가장 인상적인 결과물조차도 기존 알고리즘 기반이다. 놀랍도록 복잡하고 거의 이해할 수 없을 정도로 복잡한 알고리즘이지만, 알고리즘은 알고리즘일 뿐이다. 그리고 알고리즘은 한 세기 동안 변하지 않은 컴퓨팅 법칙을 따른다. 즉, 설계되거나 지시되지 않은 이상 아무것도 할 수 없다.

AI가 적용된 새로운 그림판을 예로 든다. 뉴욕에서 열린 마이크로소프트의 가을 서피스 이벤트에서 필자는 전경과 배경을 자동으로 구분해 해변을 뛰어다니는 강아지 사진에서 해변을 손쉽게 흐림 처리하는 그림판 기능을 보았다. 인상적이었다. 포토샵에 익숙하지 않은, 혹은 비용을 지불하고 싶지 않은 사람에게 유용한 기능이다. 하지만 이런 기능은 모바일 앱이 수년 동안 사용해 온 기법이다. 원격 데이터센터의 방대한 리소스와 상시 연결될 필요가 없다. 
 
ⓒ Microsoft

“큰 도구(big iron)”가 필요한 상황은 이미지 생성이다. 필자는 새로운 레이어링 도구를 사용해 몇 번의 클릭만으로 크고 화려한 건물 사진을 하늘과 분리하고 그 뒤에 다른 요소를 추가할 수 있었다. 토네이도를 요청했더니 텍사스 설화에서나 나올 법한 회오리바람 이미지가 바로 생성됐고, 필자는 조명과 원근감이 전혀 다른 2개의 이미지를 배치해 각 요소들이 전혀 어울리지 않는 새로운 이미지를 만들었다. 전문 VFX 스튜디오의 작업물처럼 기존 건물 이미지에 토네이도를 배치하는 것은 AI가 적용된 그림판으로는 할 수 없었다.

AI 이미지 생성 도구의 한계는 중급 사용자도 유튜브와 이미지 검색을 통해 30분 정도만 배우면 충분히 도달할 수 있는 수준이다. 기껏해야 30분 정도의 시간을 단축하는 것이다. 30분만 투자하면 그림판에서 30분 정도 작업한 것처럼 보이는 결과물을 얻을 수 있다. 그래픽 디자인 도구를 매일 사용하는 사람이지만 인간이 무능해진다는 두려움은 느껴지지 않았다. 


말뭉치 살펴보기

이번에 다룰 것은 텍스트 생성 기능이다. 엄청난 양의 텍스트 정보를 집어삼키고 뱉는 챗GPT의 능력은 정말 인상적이다. 하지만 텍스트로 미묘한 작업, 즉 사람이 많은 시간과 주의를 기울여야 하는 작업을 수행할 때는 성능이 떨어진다. 한 시연자가 5,000단어로 작성된 문서를 가져와서 워드로 요약해 달라고 코파일럿에 요청했다. 그 결과 2,000단어 조금 넘는 분량으로 줄었는데, 이는 동료들이 앉은 테이블 앞 또는 줌 회의에서 읽기에는 여전히 많은 양이었다. 

1,000단어 미만으로 줄여 달라고 요청하자 시스템이 멈췄다. 핵심을 잃지 않고 압축하기에는 정보가 너무 많았다. 말뭉치에서 실행 가능하고 즉각적인 정보를 선별할 수 있을 만큼 숙련된 사람이 필요할지라도 사람이라면 할 수 있는 일이다. 반면 코파일럿은 요청하지 않은 결과를 여러 번 거의 동일하게 제공했다. 시연자는 마이크로소프트 애저 서버가 내놓은 결과가 정확한지 확인하려면 텍스트 결과를 읽어야 한다고 지적했다. 아마도 더 큰 문제는 존재하지 않는 정보를 만들어 내지 못한다는 점이다.
 


아웃룩 데모에서는 수백 단어로 자동 생성된 대답을 통해 인간 운영자가 전혀 생각하지 못한 아이디어를 만들었다. 이를 자신이 직접 작성했다고 주장하면 곤경에 처할 수도 있고, 나중에 기억하지 못할 수도 있다. 생성형 AI의 답변을 자신의 답변인 양 꾸미는 사례는 이미 목격했다. 

그렇다면 시스템의 한계가 인간 작업자의 한계보다 훨씬 낮고 출력물을 여전히 사람이 직접 확인해야 한다면 실제로 얼마나 많은 작업량을 줄일 수 있겠는가? 관리자가 자신 있게 인력을 감축하기에는 충분하지 않으며, 경영진이 기대하는 결과와는 거리가 멀다. 원격 서버에서 오류를 반환하지 않고 시스템이 계속 작동하는 시나리오에 해당한다. 필자가 행사장에서 본 모든 데모에서 적어도 한 번 이상 발생했다. 

코파일럿의 시간 절약 기능에 놀라기도 했다. 예를 들어, 동일한 5,000단어 문서로 작업하는 데모 시연자는 관련 글머리 기호가 포함된 20개 슬라이드의 파워포인트 데크를 생성할 수 있었다. 심지어 저작권이 없는 이미지를 배경으로 사용해 구체적이지 않지만 흑백 슬라이드를 멋지게 구분하는 등 상당히 매력적인 서식을 만들었다. 이런 시스템은 자동 생성된 이미지, 빙 검색에서 찾은 라이선스 없는 이미지 또는 로컬 폴더에 저장된 이미지를 삽입한다.
 


확실히 시간이 절약되기는 한다. 이 시스템은 전문가가 한 시간 정도 걸리는 파워포인트 프레젠테이션을 단 몇 분 만에 생성했다. 하지만 수작업으로 확인하는 데 거의 비슷한 시간이 소요됐고, 결과를 신뢰하거나 반복할 수 없었다. 신뢰할 수 없는 시스템은 때때로 업무를 보조할 수는 있어도 인간 작업자를 대체할 수 없다. 하위 직급의 인력도 마찬가지다.  


윈도우 8의 교훈을 기억하는가?

여기서 또 다른 의문이 생긴다. 마이크로소프트는 많은 기능이 누락된 것이 분명한데도 왜 이 모든 신기술을 시연하고 기업용 도구에 그토록 빠르게 적용하려는 것일까? 비슷한 사례가 있다. 바로 윈도우 8이다. 마이크로소프트는 아이패드가 출시되면 터치 기반 태블릿으로 작업하는 사람이 늘어날 것으로 예상해 윈도우 8에서 터치 기반 인터페이스로 빠르게 전환했다. 

10년이 지났지만 아직 오지 않은 세상이다. 윈도우는 다시 이전의 시작 버튼과 메뉴로 돌아갔다. 윈도우 작업은 여전히 마우스와 키보드 중심으로 이뤄진다. 터치에 대한 인상적인 지원도 커서나 스크롤 휠과 같은 기존 도구를 그대로 답습하고 있다. 모바일에서 영감을 받은 혁명은 결코 오지 않았다.

그렇다면 마이크로소프트는 윈도우 8 실패 경험을 통해 많은 것을 배웠고 윈도우 10에서 많은 개념을 되살렸는데 왜 또 다른 불확실한 기술 절벽에서 뛰어내리려는 것일까? 확실하게 말하지는 못하겠다. 필자가 IT 애널리스트라면, IT 시장에 부는 뜨거운 바람을 탓하고 싶을 것이다.
 
ⓒ Microsoft

AI 트렌드에 편승하고 싶고 가장 환상적인 약속이 실현되기를 바라는 투자자들이 마이크로소프트 경영진의 귀를 사로잡은 것이 아닌가 생각된다. 이런 약속에는 사무실 공간과 의료 보험 혜택과 같은 불합리한 비용을 요구하며 자격을 갖춘 인간으로 채워진 일자리의 상당 부분을 대체하는 것이 포함된다. 하위 직급의 일부만 애저 클라우드로 대체해도 엄청난 비용을 절감할 수 있으며, 수익화만 제대로 이뤄진다면 마이크로소프트는 엄청난 잠재적 이익을 거둘 수 있을 것이다.

거의 모든 경쟁업체에서 활용도가 의심스러운 AI 도구가 등장하면서 마이크로소프트와 투자자들은 ‘뒤처질까 봐 두려워하는(FOMO)’ 상황에 처해 있을 수 있다. 아마도 수십 년 동안 사용되어 온 대규모 숫자 처리 시스템이 차세대 알고리즘 처리의 이점을 누릴 수 있는 애플리케이션은 기업 수준에 더 많을 것이다. 하지만 사용자 수준에서 가장 큰 변화이자 두려움의 대상은 중하위 직급의 인간 노동자를 대체하는 AI다.

이미 이런 시도가 있었다. 그리고 지금까지 이런 시도는 예측 가능한 문제를 야기해 왔기 때문에 챗GPT 자체가 이런 문제가 발생할 것을 미리 알 수 있었을 것이다. 이런 도구가 인상적으로 발전하고 있고 앞으로 더 개선되겠지만, 수많은 인간 작가와 애널리스트, 아티스트 등을 효과적으로 대체할 수 있을 것이라고 생각하지는 않는다.

사람들이 노력하지 않는다는 의미는 아니다. 자금을 쥐고 있는 사람이 노력하지 않는다는 뜻은 더더욱 아니다. 최종 결정을 내리는 사람이 인건비를 절약하기 위해 품질 저하를 얼마나 감수할 의향이 있는지로 귀결될 것이다. 설령 인간 직원에게 주는 월급보다 저렴할지라도 결과물을 얻는 데 드는 비용이 얼마나 될지도 관건이다. 애저 데이터센터는 저절로 운영되는 것이 아니며, 이를 실행하는 데에는 테라와트까지의 전력도 필요 없다.


어디로 가든 전속력으로

마이크로소프트 경영진은 이런 모든 문제를 훨씬 더 미묘한 수준까지 잘 알고 있다. 하지만 누군가가 실제 기능과 결과를 무시하고 AI를 전속력으로 추진하라고 지시한 것 같다. 위에서는 압박이 계속되고 있으며 마이크로소프트 제품팀과 기업 고객 모두는 어느 정도 고통을 감내해야 할 것이다. 적어도 몇 년 동안은 그렇다. 

윈도우 코파일럿을 비롯한 마이크로소프트의 AI 기능은 하지 말아야 할 것에 대한 고통스러운 교훈으로 기억되는 윈도우 8처럼 될까? 아니면 필자가 틀렸다는 것이 증명돼 AI가 모든 노동자의 디지털 필수 도구가 될 수 있을까? AI가 많은 노동자를 대체한 후에는 어떤 노동자들이 남을 것인가? 이에 대한 답은 시간이 말해줄 것이다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.