익스피디아의 머신러닝, "10여 년 전부터 우리의 심장"
Credit: Flickr Creative Commons/Alec Wilson
현재 머신러닝은 가트너 하이프 곡선의 정점에 다다랐지만, 여행 검색 선도업체인 익스피디아(Expedia)는 10여 년 전부터 자체 핵심 비즈니스에 머신러닝을 구축하고 있었다. 익스피디아는 항공권 검색 엔진을 훌쩍 넘어 현재 트리바고(Trivago), 호텔닷컴(Hotels.com)을 포함한 여행 브랜드만 10여 개 이상의 자회사를 보유하고 있다.
익스피디아 글로벌 제품 부사장 데이비드 플라이슈만은 "그러나 익스피디아의 심장은 언제나 머신러닝이었다"고 말했다. 플라이슈만은 "항공권 검색 결과를 전달하는 비즈니스는 힘들다"며, "이 비즈니스는 무한한 컴퓨터 문제라고 볼 수 있다"고 설명했다.
항공 여행일정표와 스케줄은 끊임없이 바뀌고 있기 때문에 익스피디아는 독자적인 BFS(best fare search)을 항상 학습하고 적용해야 했다. 이에 대해서는 하나의 도표로 요약할 수 있다. 플라이슈만은 "익스피디아 항공권 검색 평균 시간은 3초가 걸린다. 사용자의 질의에 대한 결과를 전달하는데 3초가 걸린다는 말이다. 사용자는 평균적으로 1만 6,000건의 항공 예약 상황을 가격 또는 시간대 별로 검색해 그 결과를 보게 된다"고 말했다.
플라이슈만은 "주말에 익스피디아의 팀은 하나의 질의에 대해 이틀 동안 BFS를 실행하도록 한다. 예를 들어, 미국의 시애틀과 애틀랜타 간 왕복 여행이라는 질의를 던져놓고 주말을 보낸 후, 월요일 출근하면 이 알고리듬은 엄청나게 빠른 속도로 결과를 전달하게 된다"고 설명했다.
이처럼 이 알고리듬은 익스피디아 머신러닝팀에 의해 항상 테스트되고 수정된다. 이 알고리듬의 서로 다른 다양한 버전과 튜닝을 통해 수정한 것들을 테스트한다. 또한 서로 다른 버전들의 전체 편향을 시도하고 해당 결과물을 보며, 좀더 나은 결과물을 요구한다. 플라이슈만은 "익스피디아는 좀더 나은 결과를 제공하기 때문에 사람들이 좀더 많은 항공권을 구매한다는 전제에 대해 테스트를 했고 그 결과치를 보고있다"고 설명했다.
익스피디아의 또다른 머신러닝 애플리케이션
또한 익스피디아는 700명의 데이터과학자들과 직원들이 사기 탐지를 위한 알고리듬을 만들기 위한 자체 제작한 머신러닝 애플리케이션을 사용하고 있다.
플라이슈만과 그의 팀의 차세대 프로젝트는 바로 자연어 검색 처리다. 근본적으로 이는 '질의에 대한 올바른 결과를 전달한다'는 익스피디아의 근본 목적으로 돌아온다. 이 질의는 사용자의 일정, 목적, 그리고 가격 범위와 같은 것이 조건 셋이 될 수도 있고, 또는 “나는 이번 주말에 좋은 곳으로 떠나길 원한다”와 같은 자연어 질의가 될 수 있다.
익스피디아의 다음 도전
플라이슈만은 "익스피디아의 주요 목표는 여행객 질문에 대답하는 것이며 발견한 문제를 해결하기 위해 머신러닝을 사용한다"고 말했다.
플라이슈만은 한 블로그 게시물에서 모바일용 자연어 검색 질의의 중요성에 대해 상세하게 설명했다. "지난 수년간 익스피디아는 자연어 처리에 대해 상당히 많은 경험을 했다. 표준 여행 검색 프레임워크가 모바일 기기에서는 그닥 좋게 동작하지 않는다는 것을 알아차렸다"고.
이는 개인화다. 머신러닝 알고리듬은 시간이 지남에 따라 사용자의 선호와 여행 습관을 학습할 수 있는가? 구매 절차 단계를 단축시킬 수 있는가?
플라이슈만은 "이 비즈니스는 개인화에 대한 실험을 실행하고 있다"며, 개인적인 생각을 전제로 "이는 우리가 조사하기 위해 필요한 것이지만 사람들은 단지 구경하는 것만을 원한다는 점을 아는 것은 그리 중요하지 않다. 그래서 익스피디아는 좀더 고객 맞춤에 대해 생각해 사용자가 자신이 생각하는 곳이 어딘지 인지시켜주는 것을 생각하고 있다"고 말했다.
적어도 현 시점에서 익스피디아에게는 해당 사용자가 통로쪽 좌석을 좋아하는지 여부보다 구매 프로세스가 좀더 중요하다.
머신러닝 재능을 키우는 방법
데이터과학자들을 고용하기 위해 익스피디아는 문제 해결 능력에 대해 가치를 부여했다. 플라이슈만은 머신러닝을 수정한다는 것에 대해 "사람들은 코드가 아니다. 중요한 것은 고객 문제를 이해한다는 것이다"고 말했다.
이 말은 익스피디아 데이터과학 책임자 누노 카스트로의 관점에서 이해할 수 있다. 최근 카스트로는 "(데이터과학자들은) 상업적인 측면에서 조직을 이해할 수 있는 사람들과 조직 내에서 적절한 관계를 창출하는 사람들은 좀더 성공적일 것이다"고 말한 바 있다.
일반적으로 기술전문가와 제품관리자, UX 디자이너로 구성되어 있는 익스피디아 머신러닝 팀은 에자일 팀에 속해있다. 플라이슈만에 따르면, 머신러닝 전문가들은 그들의 핵심 문제를 해결하는 팀의 구성원이다. 익스피디아는 그들이 사용하는 툴이나, 그들이 문제를 접근하는 방법에 대해서는 지시하지 않는다.
카스트로는 "일반적으로 행위의 원인에 대한 설명하는 것이 상위 목표로 설정될 것이다. 불행하게도 다른 분야와는 달리 데이터 과학에서는 레시피가 없다. 종종 한 질문에 대한 올바른 해답을 발견하기 위해 노력하지 않고 우선적으로 질문을 위한 질문을 파악하려고 노력하는 모습을 볼 수 있다"고 충고했다. editor@itworld.co.kr
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.