글로벌 칼럼 | 인공지능, 머신러닝, 그리고 봇의 숨겨진 진실
AI(Artificial intelligence)는 주기적으로 반복해서 관심을 끌지만 현실 세계에서는 느리게 발전하는 기술 가운데 하나다. 필자는 1980년대 IBM, MIT, 카네기 멜론, 씽킹 머신(Thinking Machine) 등이 열었던 요란한 AI 전시회와, 당시 "옴니(Omni)" 등의 선정적인 잡지의 표지를 장식하곤 했던 재론 래니어와 같은 테크노히피 지지자들을 기억한다.
AI는 과학적 토대는 대부분 확보되었지만 구현이 아직 성숙하지 못한 분야다. 벌거벗은 임금님 수준을 겨우 벗어난 속옷만 입고 있는 상황이라고 할 수 있다. 아직 만들어야 할 옷이 많이 남아 있다.
따라서 요즘 난무하는 지능이 있는 기계/소프트웨어에 관한 꿈 같은 이야기들은 적당히 가감해서 듣는 것이 좋다. 스티븐 스필버그의 "A.I."에 나오는 정도의 인공지능은 물론이고 "스타 트렉" 수준의 대화형 컴퓨터도 아직 수십년 후의 이야기일 뿐이다.
아무튼 전반적인 AI 분야에서 많은 일이 일어나고 있긴 하다. 똑똑한 개발자와 기업들은 당장 현실적으로 가능성 있는 구체적인 분야에 집중할 것이다. 나머지는 아직 SF 작가나 선정적인 미디어의 몫이다.
로봇 공학(Robotics)과 AI는 별도의 분야
영화 "지구가 멈추는 날(The Day the Earth Stood Still)"의 고트부터 미국 드라마 "배틀스타 갤럭티카(Battlestar Galactica)"의 사일론, 아이작 아시모프의 "아이 로봇(I Robot)"에 등장하는 인간형 로봇과 "스타 트렉: 넥스트 제네레이션(Star Trek: The Next Generation)"의 데이터에 이르기까지 인공지능을 가진 로봇은 소설의 단골 소재다.
그러나 로봇은 인공지능이 아니라 이전까지 사람이 했던 작업을 기계적으로, 많은 경우 더 빠르고 안정적으로, 임금이나 복지도 요구하지 않고 수행하는 기계다.
로봇은 제조 분야에서 흔히 사용되며 병원에서도 약물 취급에 사용되고 있다(로봇은 자기가 사용하기 위해 약을 훔치는 일이 없으므로). 그러나 일반 사무실이나 가정에서는 아직 찾아보기 어렵다.
최근 바이오닉스 분야에서 큰 발전이 이루어졌는데, 이런 발전의 주 원동력은 지난 20년 동안 여러 전쟁에서 팔이나 다리를 잃은 참전 용사들이다. 마치 원래 신체의 일부인 것처럼 신경 충동과 뇌파에 반응하는 인공 팔다리가 등장했으며, 머지 않아 지금의 거추장스러운 전선과 외장 컴퓨터 없이도 작동하게 될 것이다.
AI와 로봇을 결합해 결국 사람이 사일론과 같은 기계의 노예가 될 날이 올지도 모르겠지만, 그 정도는 먼 미래에나 논할 이야기다. 그 때까지는 일단 AI의 발전으로 소프트웨어가 더 정교화되고, 그 결과 로봇도 더 정밀하게 작동하게 될 것이다.
현재 초점은 패턴 매칭이지만 정교함은 떨어진다
현재 AI로 언급되는 대부분의 기술, 예를 들어 아마존의 제품 추천, 페이스북의 콘텐츠 추천, 애플 시리의 음성 인식, 구글 지도의 길안내 등은 단순한 패턴 매칭(pattern matching)에 불과하다.
클라우드 컴퓨팅으로 가속화된 데이터 스토리지와 연산 성능의 지속적인 발전 덕분에 더 많은 패턴을 저장, 식별하고 처리할 수 있게 됐다. 지금 하는 작업의 대부분은 패턴 매칭을 기반으로 한다.
즉, 문제를 해결하기 위해 문제에 대해 이미 알고 있는 것을 파악한 다음 이미 알고 있는 해결책을 시도한다. 패턴 매칭이 적절한 행동 또는 결과로 빨리 이어질수록 시스템 지능도 더 높은 것처럼 보인다.
그러나 아직은 초기 단계다. 내비게이션과 같이 상당히 높은 수준까지 발전한 시스템도 있다. 어느 정도로 발전했냐 하면 사람들이 스스로 볼 수 있는 표지판보다 GPS 지시를 더 추종할 정도다. 그래서 공항 활주로와 호수, 눈으로 뒤덮인 시골 도로 등으로 들어가곤 한다.
아무튼 이런 인공지능 시스템은 거의 대부분 멍청하다. 아마존을 방문해서 어떤 제품을 보면, 이후 방문하는 웹사이트의 광고에 이런 제품들이 표시되는 경우가 많다. 사용자가 아마존에서 그 제품을 이미 구입했거나 구입하지 않기로 결심했다면 이 광고는 정말 멍청한 광고다.
그러나 시스템이 아는 것은 오로지 사용자가 X라는 제품을 봤다는 것뿐이고, 그래서 계속 똑같은 제품을 보여준다. 사용자가 기대하는 지능적인 시스템과는 거리가 멀다. 아마존 제품 광고뿐만 아니라 애플의 지니어스 음악 매칭(Genius music-matching) 기능과 구글 나우 추천 기능(Now recommendations) 역시 맥락(context)을 모르긴 마찬가지고, 그래서 매번 똑같은 결과를 반복해서 도출한다.
애플의 자동 수정 기능(autocorrection)과 같이 오히려 역효과를 일으킨다. 이 기능은 사람들의 틀린 문법 습관, 복수형이나 아포스트로피 사용 방법에 대한 무지, 일관성 없는 대/소문자 사용, 오타 따위가 다른 모든 사람에게 강제로 적용되는, 크라우드소싱의 실패를 전형적으로 보여주는 사례다(입력이 극단적으로 서툰 필자와 같은 사람도 이 기능을 끌 때 오히려 오타가 적게 나온다).
사용자가 무엇을 사고 무엇을 거절했는 지와 같은 전후 맥락 파악이 없기 때문에 사용자는 더 관심이 있을 법한 다른 상품에 대한 광고가 아니라 계속 똑같은 광고만 보게 된다.
음악도 마찬가지다. 사용자의 재생 목록이 다양한 곡으로 구성되어 있다면 추천 곡도 다양해야 한다. 구글 나우가 제시하는 추천 음식점도 다를 바 없다. 필자는 인도 음식을 좋아하지만 외식할 때마다 인도 음식점을 가고 싶지는 않다. 좋아하지만 최근에 가지 않은 음식점은 어디인가? 나와 함께 식사할 사람들의 패턴과 기호는 어떻게 처리되는가?
자동 수정도 전후 맥락에 대한 인식이 필요한 영역이다. 첫째, 누군가 애플에게 "its"와 "it's"의 차이점을 알려주고, 영어에는 문법적으로 정확한, 따라서 마땅히 허용되어야 할 여러 변형이 있다는 사실도 알려줘야 한다.
예를 들어 접두사는 단어의 일부가 될 수도 있고(예: preconfigured), 하이픈으로 연결될 수도 있으며(예: pre-configured) 따라서 사용자는 자신의 기호에 따라 둘 중 하나를 사용할 수 있어야 한다("pre configured"와 같이 접두사 뒤에 공백을 넣는 것은 잘못인데, 하이픈으로 연결하지 않으면 애플 자동 수정 기능이 이렇게 입력한다).
자동 수정과 같은 문제 영역이 제대로 작동하기 전까지는 봇(모니터링한 데이터를 기반으로 사용자 대신 작업을 수행하는 자동화 소프트웨어 비서)에게 가장 단순한 작업 이상의 것을 기대하면 안 된다. 사실 봇 역시 자동 수정과 같은 유형의 문제를 겪고 있다.
패턴 식별(Pattern identification)이 머신러닝으로 부상
패턴 매칭은 풍부한 맥락이 포함된다 해도 충분하지 않다. 패턴 매칭에는 사전 정의가 필요하기 때문이다. 그래서 패턴 식별(Pattern identification)이라는 것이 등장했다. 패턴 식별은 소프트웨어가 사용자의 행동을 모니터링함으로써 새로운 패턴 또는 변경된 패턴을 감지하는 것을 의미한다.
즉, 이런 시스템을 뒷받침하는 규칙을 위한 매개변수를 정의해야 하는데, 이는 쉽지 않은 일이다. 너무 큰 단위로 인해 구별되지 않는 무의미한 덩어리에 그치거나 너무 잘게 쪼개져 실제 환경에서 쓸모가 없게 되기 십상이다.
더 많은 클릭과 더 많은 상품 구매 유도, 복사기와 항공기 엔진의 장애 진단, 기상 및 교통 현황에 따른 배송 트럭 경로 수정, 운전 중 위험 대처(미국 자동차에서 충돌 회피 기술은 곧 표준이 됨) 등 목적이 무엇이든, 현재 머신러닝에서는 이러한 식별 작업이 큰 부분을 차지한다.
머신러닝은 어려운 만큼, 특히 세부적으로 정의되고 설계되는 분야를 제외하면 발전 속도는 느리다. 시스템은 계속 개선되지만 그 차이를 인지할 정도가 되려면 꽤 많은 시간이 필요하다.
음성인식이 대표적인 예다. 전화기 기반 도움말 시스템이었던 최초의 음성 인식 시스템은 형편없었지만 지금의 시리, 구글 나우, 코타나의 음성 인식 기능은 많이 발전했다.
여전히 복잡한 구문과 틈새 영역 이해에 서툴고, 여러 억양과 발음 패턴에도 취약함을 드러내는 등 오류가 많긴 해도 실제로 사용할 수 있는 수준은 된다. 사람에 따라서는 실제 필사자의 받아쓰기와 차이가 없다고 느낄 정도다.
그러나 기계는 맥락이 복잡할수록 모델이 불완전하거나 주변 환경에 의해 지나치게 왜곡되므로 학습에 어려움을 겪는다.
자율 주행 자동차가 좋은 예다. 자동차는 도로 패턴과 신호, 다른 자동차를 기반으로 운전하는 방법을 학습할 수 있지만 날씨, 보행자, 자전거 이용자, 2중 주차된 자동차, 도로 공사 등의 외부 요인으로 인해 학습에 큰 혼란이 발생하게 된다. 이러한 요인들은 특이성과 변동성이 커서 식별하기도 어렵다.
이런 모든 장애물을 극복하는 것이 가능할까? 가능하긴 하겠지만 사람들이 생각하는 것만큼 빠른 속도는 아니다.
머신러닝을 뒤따르는 예측 분석
IT는 오랫동안 예측 분석(predictive analytics)이라는 개념을 팔아왔다(운영 비즈니스 인텔리전스(operational business intelligence) 역시 예측 분석의 또 다른 이름이다). 예측 분석은 훌륭한 개념이지만 이를 위해서는 패턴 매칭과 머신러닝, 그리고 인사이트가 필요하다. 인사이트는 새로운 영역으로 사고를 비약할 수 있게 해주는 요소다.
예측 분석은 판에 박힌 사고가 아니라 특이한 패턴과 결과를 식별하고 수용하는 것이다. 이것이 어려운 이유는 패턴 기반의 "인텔리전스"는 다수의 패턴과 경로가 곧 최선의 패턴과 경로라는 가정을 전제로 하기 때문이다. 다수가 아니라는 것은 사람들이 그다지 많이 사용하지 않는다는 의미다.
대부분의 보조 시스템은 현재 조건을 사용해 검증된 경로로 사용자를 안내한다. 예측 시스템은 온갖 종류의 확률 수학을 사용해 현재 조건과 추론 가능한 미래의 조건을 조합한다. 그나마 이것은 쉬운 예측이다.
정말 어려운 문제는 여러 가지 이유로 인해 눈에 잘 띄지 않는 것들이다. 대부분의 사람이 이해할 수 없을 정도로 문맥이 너무 복잡하거나, 계산된 경로가 경계를 벗어나서 알고리즘 또는 사용자에 의해 거부되는 경우가 이에 속한다.
지금까지 살펴본 바와 같이 머신러닝에는 아직 해결해야 할 문제가 많으므로, 자극적인 언론 보도나 구글 I/O 등의 전시회에서 흔히 접하게 되는 놀라운 미래에 관한 이야기는 적당히 걸러서 들어야 한다. 미래는 분명히 다가오지만 느리게, 균일하지 않게 온다. editor@itworld.co.kr
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.