AIㆍML / BI|분석 / 데이터ㆍ분석 / 애플리케이션

익스피디아의 머신러닝, "10여 년 전부터 우리의 심장"

Scott Carey | Computerworld UK 2016.08.16
모든 이들이 기업 내 머신러닝에 대해 논의하고 있을 때, 익스피디아는 10여 년 전부터 이를 해왔다.


Credit: Flickr Creative Commons/Alec Wilson

현재 머신러닝은 가트너 하이프 곡선의 정점에 다다랐지만, 여행 검색 선도업체인 익스피디아(Expedia)는 10여 년 전부터 자체 핵심 비즈니스에 머신러닝을 구축하고 있었다. 익스피디아는 항공권 검색 엔진을 훌쩍 넘어 현재 트리바고(Trivago), 호텔닷컴(Hotels.com)을 포함한 여행 브랜드만 10여 개 이상의 자회사를 보유하고 있다.

익스피디아 글로벌 제품 부사장 데이비드 플라이슈만은 "그러나 익스피디아의 심장은 언제나 머신러닝이었다"고 말했다. 플라이슈만은 "항공권 검색 결과를 전달하는 비즈니스는 힘들다"며, "이 비즈니스는 무한한 컴퓨터 문제라고 볼 수 있다"고 설명했다.

항공 여행일정표와 스케줄은 끊임없이 바뀌고 있기 때문에 익스피디아는 독자적인 BFS(best fare search)을 항상 학습하고 적용해야 했다. 이에 대해서는 하나의 도표로 요약할 수 있다. 플라이슈만은 "익스피디아 항공권 검색 평균 시간은 3초가 걸린다. 사용자의 질의에 대한 결과를 전달하는데 3초가 걸린다는 말이다. 사용자는 평균적으로 1만 6,000건의 항공 예약 상황을 가격 또는 시간대 별로 검색해 그 결과를 보게 된다"고 말했다.

플라이슈만은 "주말에 익스피디아의 팀은 하나의 질의에 대해 이틀 동안 BFS를 실행하도록 한다. 예를 들어, 미국의 시애틀과 애틀랜타 간 왕복 여행이라는 질의를 던져놓고 주말을 보낸 후, 월요일 출근하면 이 알고리듬은 엄청나게 빠른 속도로 결과를 전달하게 된다"고 설명했다.

이처럼 이 알고리듬은 익스피디아 머신러닝팀에 의해 항상 테스트되고 수정된다. 이 알고리듬의 서로 다른 다양한 버전과 튜닝을 통해 수정한 것들을 테스트한다. 또한 서로 다른 버전들의 전체 편향을 시도하고 해당 결과물을 보며, 좀더 나은 결과물을 요구한다. 플라이슈만은 "익스피디아는 좀더 나은 결과를 제공하기 때문에 사람들이 좀더 많은 항공권을 구매한다는 전제에 대해 테스트를 했고 그 결과치를 보고있다"고 설명했다.

익스피디아의 또다른 머신러닝 애플리케이션
또한 익스피디아는 700명의 데이터과학자들과 직원들이 사기 탐지를 위한 알고리듬을 만들기 위한 자체 제작한 머신러닝 애플리케이션을 사용하고 있다.

플라이슈만과 그의 팀의 차세대 프로젝트는 바로 자연어 검색 처리다. 근본적으로 이는 '질의에 대한 올바른 결과를 전달한다'는 익스피디아의 근본 목적으로 돌아온다. 이 질의는 사용자의 일정, 목적, 그리고 가격 범위와 같은 것이 조건 셋이 될 수도 있고, 또는 “나는 이번 주말에 좋은 곳으로 떠나길 원한다”와 같은 자연어 질의가 될 수 있다.

익스피디아의 다음 도전
플라이슈만은 "익스피디아의 주요 목표는 여행객 질문에 대답하는 것이며 발견한 문제를 해결하기 위해 머신러닝을 사용한다"고 말했다.

플라이슈만은 한 블로그 게시물에서 모바일용 자연어 검색 질의의 중요성에 대해 상세하게 설명했다. "지난 수년간 익스피디아는 자연어 처리에 대해 상당히 많은 경험을 했다. 표준 여행 검색 프레임워크가 모바일 기기에서는 그닥 좋게 동작하지 않는다는 것을 알아차렸다"고.

이는 개인화다. 머신러닝 알고리듬은 시간이 지남에 따라 사용자의 선호와 여행 습관을 학습할 수 있는가? 구매 절차 단계를 단축시킬 수 있는가?

플라이슈만은 "이 비즈니스는 개인화에 대한 실험을 실행하고 있다"며, 개인적인 생각을 전제로 "이는 우리가 조사하기 위해 필요한 것이지만 사람들은 단지 구경하는 것만을 원한다는 점을 아는 것은 그리 중요하지 않다. 그래서 익스피디아는 좀더 고객 맞춤에 대해 생각해 사용자가 자신이 생각하는 곳이 어딘지 인지시켜주는 것을 생각하고 있다"고 말했다.

적어도 현 시점에서 익스피디아에게는 해당 사용자가 통로쪽 좌석을 좋아하는지 여부보다 구매 프로세스가 좀더 중요하다.

머신러닝 재능을 키우는 방법
데이터과학자들을 고용하기 위해 익스피디아는 문제 해결 능력에 대해 가치를 부여했다. 플라이슈만은 머신러닝을 수정한다는 것에 대해 "사람들은 코드가 아니다. 중요한 것은 고객 문제를 이해한다는 것이다"고 말했다.

이 말은 익스피디아 데이터과학 책임자 누노 카스트로의 관점에서 이해할 수 있다. 최근 카스트로는 "(데이터과학자들은) 상업적인 측면에서 조직을 이해할 수 있는 사람들과 조직 내에서 적절한 관계를 창출하는 사람들은 좀더 성공적일 것이다"고 말한 바 있다.

일반적으로 기술전문가와 제품관리자, UX 디자이너로 구성되어 있는 익스피디아 머신러닝 팀은 에자일 팀에 속해있다. 플라이슈만에 따르면, 머신러닝 전문가들은 그들의 핵심 문제를 해결하는 팀의 구성원이다. 익스피디아는 그들이 사용하는 툴이나, 그들이 문제를 접근하는 방법에 대해서는 지시하지 않는다.

카스트로는 "일반적으로 행위의 원인에 대한 설명하는 것이 상위 목표로 설정될 것이다. 불행하게도 다른 분야와는 달리 데이터 과학에서는 레시피가 없다. 종종 한 질문에 대한 올바른 해답을 발견하기 위해 노력하지 않고 우선적으로 질문을 위한 질문을 파악하려고 노력하는 모습을 볼 수 있다"고 충고했다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.