2018.12.12

데이팅 앱 틴더의 매칭 개선 비결은 'AWS 이미지 인식 기술'

Scott Carey | Computerworld UK
유명 데이팅 앱 틴더(Tinder)는 프리미엄 사용자를 위한 매칭 알고리즘을 강화하기 위해 AWS의 이미지 인식 기술을 사용하고 있다. 

최근 미국 라스베이거스에서 열린 AWS 리인벤트(re:Invent) 행사에서, 틴더의 엔지니어링 담당 부사장 톰 자큐는 AWS 레커그니션(Rekognition) 서비스의 도움을 받아 딥러닝을 사용하고 있다고 밝혔다. 틴더 사용자가 업로드하는 100억 장에 달하는 사진을 분석해 그들의 핵심 특징을 식별하는데 이 기술을 쓰고 있다.

자큐는 "우리가 직면했던 어려움은 회원이 보고 싶어 하는 사람이 누구인지 이해하는 것이었다. 예를 들면 회원이 누구와 연결하고 누구와 대화하는지, 우리가 회원에게 보여줄 수 있는 콘텐츠가 무엇이고 가장 잘 보여줄 수 있는 방법이 무엇인지 같은 것이다"라고 말했다.

이를 위해 틴더는 매일 40TB 크기의 데이터를 수집한 후 애널리틱스와 머신러닝 시스템에 입력해 매칭 작업을 개선한다. 이 기반 작업을 AWS 클라우드 서비스에서 처리한다.  자큐에 따르면, 텐더는 이 데이터를 통해 회원간 매치가 이뤄지는 주 요인이 사진이라는 것을 밝혀냈다. 그는 "사진이 더 많은 회원일수록 매칭될 가능성이 더 커진다"라고 말했다.

틴더에 가입하면 일반적으로 자신의 사진을 몇장 올리고 짧은 소개글을 쓴다. 그러나 사용자가 늘어날수록 소개글이 없는 경우도 늘고 있다. 이는 곧 틴더가 추천 기능에 사용할 데이터를 찾을 다른 방법이 필요하다는 의미다. 그래서 틴더는 AWS 레커그니션을 이용해 자동으로 수십억 장의 사진을 태그한다. 이 과정에서 개인적인 특성을 정의한다. 예를 들어 기타를 가진 사진을 올린 사용자라면 '음악가', '창의적' 같은 태그를 붙인다. 등산용품과 함께 찍힌 사진이 있다면 '모험적', '야외활동을 좋아하는' 같은 태그가 자동으로 추가된다.

틴더는 이러한 태그를 이용해 사용자의 프로필을 더 풍부하게 분석한다. 학위나 직업 같은 정형 데이터는 물론 텍스트 같은 비정형 데이터도 물론 함께 활용한다. 이후에 틴더는 이들 정보를 추출한 후 내부 기능 스토어에 추가한다. 자큐는 "이 기능 스토어는 온라인, 스트리밍, 배치 프로세스를 관리하는 통합 서비스다. 우리는 이 정보를 확보해 내부 태깅 시스템에 넣어 각 프로필에서 두드러지는 것을 찾아낸다. 결국 레커그니션은 틴더에게 대규모로 이들 사진의 내용에 접근하는 방법을 제공한다. 이 방법은 정확하고 우리의 프라이버시와 보안 정책에도 부합한다"라고 말했다.

이어 "레커그니션은 수십억 장의 사진을 처리할 수 있는 클라우드 확장성 외에도 우리의 전문 직원과 데이터 사이언티스트가 복잡한 문제를 해결하는 정교한 모델을 만드는 데도 큰 도움이 된다. 특히 프라이버시는 우리에게 매우 중요하다. 레커그니션은 우리가 필요로 하는 기능에만 접근할 수 있도록 관리하는 별도의 API를 제공한다. 우리는 이런 기능을 레커그니션 기반으로 개발해 태그 커버지르를 2배 이상 늘릴 수 있었다"라고 덧붙였다.

이밖에도 틴더의 프리미엄 사용자는 톱 픽(Top Picks) 기능을 사용할 수 있다. 지난 9월에 시작한 서비스로 월 12파운드를 내는 가장 비싼 유료 고객인 골드(Gold) 유저에게만 제공된다. 별도로 정리한 '고급 예상 가능 매치' 피드를 받아볼 수 있다. 모든 틴더 유저는 하루에 한번 무료로 이 톱 픽을 받는다. 그러나 골드 가입자는 다이아몬드 아이콘을 탭해 언제든 톱 픽을 볼 수 있다. 이 목록은 매일 갱신된다.

자큐는 "회원이 우리가 추천하는 톱 픽을 원할 때 이를 제공하는 기능의 기반 기술은 이미지 인식 기술과 같다. 그러나 사용자가 원하는 결과가 다르고 매우 개인화된 고급 매칭을 제공한다는 점이 다르다. 톱 픽을 도입한 이후 코어 추천 대비 고객 상호작용이 크게 늘어났다. 특히 프로필에서 이런 태그를 볼 때 20% 상호자굥이 늘어났다"라고 말했다.

특히 자큐는 AWS 신기능에도 기대를 걸고 있다. 그는 "AWS 신기능을 활용해 모델의 정확성을 높이고 카테고리화와 클러스터 콘텐츠를 개선한 단계적 데이터를 추가했다. 또한 사진 속 물체를 인식하는 것 뿐만 아니라 그들이 어디에 있고 무엇을 사용하는 지도 알 수 있게 됐다. 우리는 이를 이용해 회원의 삶에서 실제로 무슨 일이 벌어지고 있는지 심층 분석할 수 있고 결과적으로 그들에게 더 좋은 서비스를 제공할 수 있다"라고 말했다.

AWS 레커그니션은 누구나 바로 사용할 수 있다. 비용은 첫 100만 건까지의 사진에 대해서는 월 1달러이며 다음 900만 건까지는 0.8%달러, 다음 9000만 건까지는 0.6달러다. 1억 건 이상은 0.4달러다. editor@itworld.co.kr


2018.12.12

데이팅 앱 틴더의 매칭 개선 비결은 'AWS 이미지 인식 기술'

Scott Carey | Computerworld UK
유명 데이팅 앱 틴더(Tinder)는 프리미엄 사용자를 위한 매칭 알고리즘을 강화하기 위해 AWS의 이미지 인식 기술을 사용하고 있다. 

최근 미국 라스베이거스에서 열린 AWS 리인벤트(re:Invent) 행사에서, 틴더의 엔지니어링 담당 부사장 톰 자큐는 AWS 레커그니션(Rekognition) 서비스의 도움을 받아 딥러닝을 사용하고 있다고 밝혔다. 틴더 사용자가 업로드하는 100억 장에 달하는 사진을 분석해 그들의 핵심 특징을 식별하는데 이 기술을 쓰고 있다.

자큐는 "우리가 직면했던 어려움은 회원이 보고 싶어 하는 사람이 누구인지 이해하는 것이었다. 예를 들면 회원이 누구와 연결하고 누구와 대화하는지, 우리가 회원에게 보여줄 수 있는 콘텐츠가 무엇이고 가장 잘 보여줄 수 있는 방법이 무엇인지 같은 것이다"라고 말했다.

이를 위해 틴더는 매일 40TB 크기의 데이터를 수집한 후 애널리틱스와 머신러닝 시스템에 입력해 매칭 작업을 개선한다. 이 기반 작업을 AWS 클라우드 서비스에서 처리한다.  자큐에 따르면, 텐더는 이 데이터를 통해 회원간 매치가 이뤄지는 주 요인이 사진이라는 것을 밝혀냈다. 그는 "사진이 더 많은 회원일수록 매칭될 가능성이 더 커진다"라고 말했다.

틴더에 가입하면 일반적으로 자신의 사진을 몇장 올리고 짧은 소개글을 쓴다. 그러나 사용자가 늘어날수록 소개글이 없는 경우도 늘고 있다. 이는 곧 틴더가 추천 기능에 사용할 데이터를 찾을 다른 방법이 필요하다는 의미다. 그래서 틴더는 AWS 레커그니션을 이용해 자동으로 수십억 장의 사진을 태그한다. 이 과정에서 개인적인 특성을 정의한다. 예를 들어 기타를 가진 사진을 올린 사용자라면 '음악가', '창의적' 같은 태그를 붙인다. 등산용품과 함께 찍힌 사진이 있다면 '모험적', '야외활동을 좋아하는' 같은 태그가 자동으로 추가된다.

틴더는 이러한 태그를 이용해 사용자의 프로필을 더 풍부하게 분석한다. 학위나 직업 같은 정형 데이터는 물론 텍스트 같은 비정형 데이터도 물론 함께 활용한다. 이후에 틴더는 이들 정보를 추출한 후 내부 기능 스토어에 추가한다. 자큐는 "이 기능 스토어는 온라인, 스트리밍, 배치 프로세스를 관리하는 통합 서비스다. 우리는 이 정보를 확보해 내부 태깅 시스템에 넣어 각 프로필에서 두드러지는 것을 찾아낸다. 결국 레커그니션은 틴더에게 대규모로 이들 사진의 내용에 접근하는 방법을 제공한다. 이 방법은 정확하고 우리의 프라이버시와 보안 정책에도 부합한다"라고 말했다.

이어 "레커그니션은 수십억 장의 사진을 처리할 수 있는 클라우드 확장성 외에도 우리의 전문 직원과 데이터 사이언티스트가 복잡한 문제를 해결하는 정교한 모델을 만드는 데도 큰 도움이 된다. 특히 프라이버시는 우리에게 매우 중요하다. 레커그니션은 우리가 필요로 하는 기능에만 접근할 수 있도록 관리하는 별도의 API를 제공한다. 우리는 이런 기능을 레커그니션 기반으로 개발해 태그 커버지르를 2배 이상 늘릴 수 있었다"라고 덧붙였다.

이밖에도 틴더의 프리미엄 사용자는 톱 픽(Top Picks) 기능을 사용할 수 있다. 지난 9월에 시작한 서비스로 월 12파운드를 내는 가장 비싼 유료 고객인 골드(Gold) 유저에게만 제공된다. 별도로 정리한 '고급 예상 가능 매치' 피드를 받아볼 수 있다. 모든 틴더 유저는 하루에 한번 무료로 이 톱 픽을 받는다. 그러나 골드 가입자는 다이아몬드 아이콘을 탭해 언제든 톱 픽을 볼 수 있다. 이 목록은 매일 갱신된다.

자큐는 "회원이 우리가 추천하는 톱 픽을 원할 때 이를 제공하는 기능의 기반 기술은 이미지 인식 기술과 같다. 그러나 사용자가 원하는 결과가 다르고 매우 개인화된 고급 매칭을 제공한다는 점이 다르다. 톱 픽을 도입한 이후 코어 추천 대비 고객 상호작용이 크게 늘어났다. 특히 프로필에서 이런 태그를 볼 때 20% 상호자굥이 늘어났다"라고 말했다.

특히 자큐는 AWS 신기능에도 기대를 걸고 있다. 그는 "AWS 신기능을 활용해 모델의 정확성을 높이고 카테고리화와 클러스터 콘텐츠를 개선한 단계적 데이터를 추가했다. 또한 사진 속 물체를 인식하는 것 뿐만 아니라 그들이 어디에 있고 무엇을 사용하는 지도 알 수 있게 됐다. 우리는 이를 이용해 회원의 삶에서 실제로 무슨 일이 벌어지고 있는지 심층 분석할 수 있고 결과적으로 그들에게 더 좋은 서비스를 제공할 수 있다"라고 말했다.

AWS 레커그니션은 누구나 바로 사용할 수 있다. 비용은 첫 100만 건까지의 사진에 대해서는 월 1달러이며 다음 900만 건까지는 0.8%달러, 다음 9000만 건까지는 0.6달러다. 1억 건 이상은 0.4달러다. editor@itworld.co.kr


X