2019.02.20

"중요한 것은 데이터가 아니다. 어떻게 활용하느냐다"...한국IDG, 제 9회 빅데이터 컨퍼런스 성료

이대영 기자 | ITWorld
빅데이터의 핵심은 데이터 수집이 아닌, 수집한 데이터를 어떻게 활용할 것인지에 있다. 특정 비즈니스에서의 과제를 해결할 해답을 찾는데 데이터를 어떻게 이용할 것인지에 대해 집중할 필요가 있다. 또한 새로운 기술과 인프라를 준비하는 것과 더불어, 이를 어디에 쓰고 어떤 결과물을 만들어 낼 지에 대한 고민이 중요하다.

한국 IDG 박형미 대표는 "데이터 자체로는 가치가 없다는 것은 이미 모두가 잘 알고 있다. 이를 제대로 활용하는 것에 가치가 있다"며, "인공지능과 머신러닝을 통한 데이터 분석을 통해 고객의 니즈를 적용하는 것이 중요하다"고 말했다. 

이에 대해 한국IDG는 2월 20일 제 9회 비즈니스 임팩트 & 빅데이터(Business Impact & Big Data) 컨퍼런스를 개최해 최근 빅데이터 국내외 활용 방안과 과제를 살펴보고, 시대의 흐름에 발 맞추기 위한 전략적 대응 방안을 논의하는 자리를 가졌다. 


 

데이터 사이언스를 활용하기 위한 4원칙

이번 컨퍼런스의 기조 연설을 맡은 구글 데이터 사이언스 담당 헤드 제이 야나미니는 400여 명의 IT 및 마케팅 전문가들이 참석한 가운데 '비즈니스 의사결정 향상을 위한 데이터 사이언스의 중요성'이라는 주제로 구글의 데이터 활용에 대한 노하우를 공개했다.  

야나미니는 데이터 사이언스의 성공 사례를 짚어보면서 공통 특성으로 자동화를 거론했다. 야나미니는 "추천, 자율주행, 자동 검색 등 모두가 의사결정 자동화와 연관이 있다"며, "의사 결정은 일반적으로 수집(Collect), 저장(Store), 추론(Inference), 실행(Act) 등 4단계의 과정을 거치는 데, 이는 인간이든, 머신러닝이든 저장된 데이터를 기반으로 추론하고 행동으로 이어진다"고 설명했다.  

완전한 자동화(Fully Automated)는 이 4단계가 연속적으로 이어지는데 비해, 전문가 지원 시스템의 경우, 추론과 실행 과정 사이에 인간이 개입하게 된다. 지금까지 사례를 보면, 인간의 개입이 있는 경우가 훨씬 많고 흔한데, 법조계, 의학계, 스포츠 업계 등이 대표적이다. 

야나미니는 "전문가 지원 시스템을 위해 많은 투자가 이뤄지고 있지만, 이런 인간의 개입이 과연 올바르고 정확한 결정을 하는 것인지에 대해서는 많은 논란이 있다"고 의문을 표시했다. 야나미니는 데이터 사이언스를 잘 활용하기 위해서는 다음과 같은 4가지 원칙을 지켜야 한다고 주장했다. 

- 객관적이어야 한다: 일반적으로 기업에서는 돈을 가장 많이 버는 사람이나 직급이 가장 높은 사람의 영향력이 크다. 하지만 의사 결정의 정확성을 평가해야 하며, 데이터 사이언스를 통한 객관적인 기준이 필요하다. 이를 이용해 결정하지 않으면 데이터 사이언스 효과를 측정하기가 어렵다. 

- 간단함이 진리다: 최첨단 기술을 선택, 도입하는 것은 설레고 보람찬 일임은 틀림없다. 하지만 이는 기업에서 굉장히 많이 범하는 실수이자 오류이기도 하다. 가장 간단한 기술을 활용할 수 있다면 그것이 최상의 선택이다. 

- 결과를 위해 창의적으로 설득하라: 완전히 자동화된 기술이라면 어떻게 사용할 것인지를 고민할 필요가 없다. 하지만 데이터 알고리즘을 만들 때, 인간에게 추천하고 지원하는 것이 목적이라면, 설득 방법이 중요하다. 인간이 채택하지 않으면 아무런 가치를 창출하지 못하기 때문이다. 최종 결과를 이루기 위해서는 어떤 방법으로든 실제 채택율을 높이기 위한 창의적인 방법을 찾아야 한다.   

- 운전대를 제거할 시점을 파악하라: 현재 사람들은 기계가 추천한 정보를 바탕으로 기계와 인간이 힘을 합친다면 더 좋은 효율성과 결과를 창출할 것이라고 믿었다. 하지만 이는 거짓이다. 인간과 머신러닝의 조합의 결과가 오히려 더 나쁜 경우도 있었다. 자율주행 차량이 바로 그 예다. 자율주행 자동차는 오랫동안 개발해오면서 운전대와 함께 사람이 늘 개입하고 있었다. 특정 상황에서는 인간이 운전하도록 해놓은 것이다. 하지만 인간이 운전대를 잡게 되면 사고 발생율이 높아진 결과를 초래한 것이다. 성과에 대한 객관적인 평가가 이뤄지면 인간의 의사결정에 대해서도 제대로 평가할 수 있게 되고 이런 의사결정에 있어서의 인간의 개입을 일정 부분 제거할 수 있다. 

야나미니는 "그렇다고 모든 의사 결정을 자동화할 수 있는 것은 아니다. 완전 자동화할 것인지, 인간의 의사 결정을 지원할 것인지 처음 목적을 잘 설정해야 하며 이에 따라 활용 방법이 달라진다"며, "완전 자동화가 가능한 분야와 전문가 지원 시스템이 적합한 분야를 데이터 볼륨, 에러의 비용, 피드백의 기간, 결과 평가의 객관성 등 4가지 요소를 통해 분류할 수 있다"고 말했다. 


머신러닝, 마케팅 및 크로스 판매에 실제 도움 

이어 강연을 한 우버(Uber) 데이터 사이언스 & 옵티마이제이션, 퍼포먼스 마케팅 매니저 마리오 비나스코는 "우버가 마케팅에 머신러닝과 인공지능을 활용하는 법"에 대해 설파했다.  

비나스코는 우버의 실제 사례와 데이터를 기반으로 데이터 사이언스 팀이 AI 및 머신러닝을 활용해 마케팅에 적용하는 방법에 대해 알기 쉽게 설명했다. 비나스코는 "5년 전만 하더라도 인공지능은 개와 고양이를 구분할 수 없었다"면서, "현재 이미지 인식 기술은 엄청난 속도로 발전해 5년 전 불가능하다고 생각했던 것을 가능하게끔 만들었다"고 말했다.  

우버는 이런 이미지 인식 기술을 활용해 운전자를 식별하고 상품을 구매하는 사람을 파악하는 등 데이터를 수집한다. 예를 들어, 지난 9개월 간 운전자의 데이터를 기반으로 머신러닝을 학습해 이를 기반으로 누가 이탈하고 유지할 것인지를 알아낸다. 

비나스코는 "완벽한 모델은 없으며, 긍정오류는 나타날 수 밖에 없다. 다만 이 모델을 마케팅에 어떻게 활용할 것이냐에 초점을 맞춰야 한다"고 말했다. 

기존 고객 이탈율이 10%라고 가정했을 때, 100명 중 10명이 이탈하게 되는데, 100명 전체에 대해 인센티브를 제안하는 것과 이탈율이 높은 20%에 대해 타깃 마케팅을 하는 것과는 확연히 다른 결과를 가져올 수 있다.  

비나스코는 "사실 모든 기술은 오픈소스로 열려있다. 이런 기술은 굉장히 간단하고 쉽게 도입할 수 있다. 하지만 이를 활용하려면 가장 먼저 데이터가 있어야 한다. 결국 중요한 것은 기술이 아니라 데이터를 어떻게 활용하느냐다"고 말했다. 

비나스코는 수개월 전 임원이 요구했던 얼마나 자주 이메일을 보내야하는 지에 대한 정답을 찾아가는 과정을 설명하면서 데이터 활용 방법에 대해 설명했다. 

우버는 지금까지 이메일을 보낸 기록과 오픈율, 이탈율 등에 대한 데이터를 기반으로 가장 적절한 이메일 빈도 수를 찾았다. 이를 위해 가장 먼저해야 할 것은 고객 분류였다. 오픈율과 이탈율을 고중저로 나누어 분류표를 만들었고 이를 통해 이메일 빈도수를 조절할 수 있었다. 

비나스코는 "정확하게 정답을 제공할 수 있는 머신러닝 모델은 없다. 정확한 답은 줄 수 없지만, 고객을 분류해 빈도수를 파악할 수 있는 근간을 마련할 수는 있다"고 말했다. 실제 우버는 이를 통해 첫해에 50만 건의 구독 해지를 방지할 수 있었다고 판단했다.   

우버는 머신러닝을 고객 유지 마케팅뿐만 아니라 크로스 판매에도 적용했다. 우버는 자사의 또 다른 비즈니스 모델인 음식 배달 서비스를 기존 고객이 사용하게 되는 전환율을 분석했다. 분류된 데이터를 기반으로 관심이 없는 이와 전환율이 높은 이들에게는 별도의 프로모션을 하지 않고 중간 부분에 위치한 고객들을 대상으로 마케팅 활동을 해야한다는 결론에 다다랐다. 

우버는 전세계에 걸쳐 마케팅에 매년 수십억 달러 규모의 투자를 한다. 이 투자를 제대로 배분해, 언제, 얼마나 투자할 것인지 결정하는 데 머신러닝 모델을 적용했다. 과거 투자했던 곳과 금액, 결과 등 데이터를 기반으로 모델을 훈련시켜 새로운 모델링을 만든다. 비나스코는 "간단한 경우는 엑셀과 같은 수작업으로도 가능하다. 하지만 우버는 수백 개의 도시에 엄청난 금액을 투자하기 때문에 데이터가 굉장히 많고 채널도 많아 머신러닝을 이용했다"고 말했다. 

뒤이어 히타치밴타라의 김경륜 이사가 산업현장에서의 데이터사이언스 적용이라는 주제로 강연했으며, 퓨어스토리지의 이규현 상무는 AI와 빅데이터 시대, 기업의 비즈니스 혁명을 위한 데이터 혁신 전략이라는 주제로 오전 컨퍼런스를 마무리했다. 

오후에는 팁코 소프트웨어의 김영석 이사가 운영에서의 데이터 사이언스를 설파한 것을 시작으로, 퍼즐데이터의 김영일 대표이사가 빅데이터 분석의 새로운 영역, 프로세스 마이닝 활용 사례를 강연했다. 

그리고 AXA 데이터 매니지먼트 & 이노베이션 담당 헤드인 조나단 칼머스가 데이터로 가치를 만들어내는 비즈니스 모델과 보험의 서비스화라는 주제로, 트위치의 애널리틱스 디렉터인 준 더쇼위츠는 데이터 분석가처럼 생각하는 법이라는 주제로 이번 컨퍼런스를 마무리했다. editor@itworld.co.kr 


2019.02.20

"중요한 것은 데이터가 아니다. 어떻게 활용하느냐다"...한국IDG, 제 9회 빅데이터 컨퍼런스 성료

이대영 기자 | ITWorld
빅데이터의 핵심은 데이터 수집이 아닌, 수집한 데이터를 어떻게 활용할 것인지에 있다. 특정 비즈니스에서의 과제를 해결할 해답을 찾는데 데이터를 어떻게 이용할 것인지에 대해 집중할 필요가 있다. 또한 새로운 기술과 인프라를 준비하는 것과 더불어, 이를 어디에 쓰고 어떤 결과물을 만들어 낼 지에 대한 고민이 중요하다.

한국 IDG 박형미 대표는 "데이터 자체로는 가치가 없다는 것은 이미 모두가 잘 알고 있다. 이를 제대로 활용하는 것에 가치가 있다"며, "인공지능과 머신러닝을 통한 데이터 분석을 통해 고객의 니즈를 적용하는 것이 중요하다"고 말했다. 

이에 대해 한국IDG는 2월 20일 제 9회 비즈니스 임팩트 & 빅데이터(Business Impact & Big Data) 컨퍼런스를 개최해 최근 빅데이터 국내외 활용 방안과 과제를 살펴보고, 시대의 흐름에 발 맞추기 위한 전략적 대응 방안을 논의하는 자리를 가졌다. 


 

데이터 사이언스를 활용하기 위한 4원칙

이번 컨퍼런스의 기조 연설을 맡은 구글 데이터 사이언스 담당 헤드 제이 야나미니는 400여 명의 IT 및 마케팅 전문가들이 참석한 가운데 '비즈니스 의사결정 향상을 위한 데이터 사이언스의 중요성'이라는 주제로 구글의 데이터 활용에 대한 노하우를 공개했다.  

야나미니는 데이터 사이언스의 성공 사례를 짚어보면서 공통 특성으로 자동화를 거론했다. 야나미니는 "추천, 자율주행, 자동 검색 등 모두가 의사결정 자동화와 연관이 있다"며, "의사 결정은 일반적으로 수집(Collect), 저장(Store), 추론(Inference), 실행(Act) 등 4단계의 과정을 거치는 데, 이는 인간이든, 머신러닝이든 저장된 데이터를 기반으로 추론하고 행동으로 이어진다"고 설명했다.  

완전한 자동화(Fully Automated)는 이 4단계가 연속적으로 이어지는데 비해, 전문가 지원 시스템의 경우, 추론과 실행 과정 사이에 인간이 개입하게 된다. 지금까지 사례를 보면, 인간의 개입이 있는 경우가 훨씬 많고 흔한데, 법조계, 의학계, 스포츠 업계 등이 대표적이다. 

야나미니는 "전문가 지원 시스템을 위해 많은 투자가 이뤄지고 있지만, 이런 인간의 개입이 과연 올바르고 정확한 결정을 하는 것인지에 대해서는 많은 논란이 있다"고 의문을 표시했다. 야나미니는 데이터 사이언스를 잘 활용하기 위해서는 다음과 같은 4가지 원칙을 지켜야 한다고 주장했다. 

- 객관적이어야 한다: 일반적으로 기업에서는 돈을 가장 많이 버는 사람이나 직급이 가장 높은 사람의 영향력이 크다. 하지만 의사 결정의 정확성을 평가해야 하며, 데이터 사이언스를 통한 객관적인 기준이 필요하다. 이를 이용해 결정하지 않으면 데이터 사이언스 효과를 측정하기가 어렵다. 

- 간단함이 진리다: 최첨단 기술을 선택, 도입하는 것은 설레고 보람찬 일임은 틀림없다. 하지만 이는 기업에서 굉장히 많이 범하는 실수이자 오류이기도 하다. 가장 간단한 기술을 활용할 수 있다면 그것이 최상의 선택이다. 

- 결과를 위해 창의적으로 설득하라: 완전히 자동화된 기술이라면 어떻게 사용할 것인지를 고민할 필요가 없다. 하지만 데이터 알고리즘을 만들 때, 인간에게 추천하고 지원하는 것이 목적이라면, 설득 방법이 중요하다. 인간이 채택하지 않으면 아무런 가치를 창출하지 못하기 때문이다. 최종 결과를 이루기 위해서는 어떤 방법으로든 실제 채택율을 높이기 위한 창의적인 방법을 찾아야 한다.   

- 운전대를 제거할 시점을 파악하라: 현재 사람들은 기계가 추천한 정보를 바탕으로 기계와 인간이 힘을 합친다면 더 좋은 효율성과 결과를 창출할 것이라고 믿었다. 하지만 이는 거짓이다. 인간과 머신러닝의 조합의 결과가 오히려 더 나쁜 경우도 있었다. 자율주행 차량이 바로 그 예다. 자율주행 자동차는 오랫동안 개발해오면서 운전대와 함께 사람이 늘 개입하고 있었다. 특정 상황에서는 인간이 운전하도록 해놓은 것이다. 하지만 인간이 운전대를 잡게 되면 사고 발생율이 높아진 결과를 초래한 것이다. 성과에 대한 객관적인 평가가 이뤄지면 인간의 의사결정에 대해서도 제대로 평가할 수 있게 되고 이런 의사결정에 있어서의 인간의 개입을 일정 부분 제거할 수 있다. 

야나미니는 "그렇다고 모든 의사 결정을 자동화할 수 있는 것은 아니다. 완전 자동화할 것인지, 인간의 의사 결정을 지원할 것인지 처음 목적을 잘 설정해야 하며 이에 따라 활용 방법이 달라진다"며, "완전 자동화가 가능한 분야와 전문가 지원 시스템이 적합한 분야를 데이터 볼륨, 에러의 비용, 피드백의 기간, 결과 평가의 객관성 등 4가지 요소를 통해 분류할 수 있다"고 말했다. 


머신러닝, 마케팅 및 크로스 판매에 실제 도움 

이어 강연을 한 우버(Uber) 데이터 사이언스 & 옵티마이제이션, 퍼포먼스 마케팅 매니저 마리오 비나스코는 "우버가 마케팅에 머신러닝과 인공지능을 활용하는 법"에 대해 설파했다.  

비나스코는 우버의 실제 사례와 데이터를 기반으로 데이터 사이언스 팀이 AI 및 머신러닝을 활용해 마케팅에 적용하는 방법에 대해 알기 쉽게 설명했다. 비나스코는 "5년 전만 하더라도 인공지능은 개와 고양이를 구분할 수 없었다"면서, "현재 이미지 인식 기술은 엄청난 속도로 발전해 5년 전 불가능하다고 생각했던 것을 가능하게끔 만들었다"고 말했다.  

우버는 이런 이미지 인식 기술을 활용해 운전자를 식별하고 상품을 구매하는 사람을 파악하는 등 데이터를 수집한다. 예를 들어, 지난 9개월 간 운전자의 데이터를 기반으로 머신러닝을 학습해 이를 기반으로 누가 이탈하고 유지할 것인지를 알아낸다. 

비나스코는 "완벽한 모델은 없으며, 긍정오류는 나타날 수 밖에 없다. 다만 이 모델을 마케팅에 어떻게 활용할 것이냐에 초점을 맞춰야 한다"고 말했다. 

기존 고객 이탈율이 10%라고 가정했을 때, 100명 중 10명이 이탈하게 되는데, 100명 전체에 대해 인센티브를 제안하는 것과 이탈율이 높은 20%에 대해 타깃 마케팅을 하는 것과는 확연히 다른 결과를 가져올 수 있다.  

비나스코는 "사실 모든 기술은 오픈소스로 열려있다. 이런 기술은 굉장히 간단하고 쉽게 도입할 수 있다. 하지만 이를 활용하려면 가장 먼저 데이터가 있어야 한다. 결국 중요한 것은 기술이 아니라 데이터를 어떻게 활용하느냐다"고 말했다. 

비나스코는 수개월 전 임원이 요구했던 얼마나 자주 이메일을 보내야하는 지에 대한 정답을 찾아가는 과정을 설명하면서 데이터 활용 방법에 대해 설명했다. 

우버는 지금까지 이메일을 보낸 기록과 오픈율, 이탈율 등에 대한 데이터를 기반으로 가장 적절한 이메일 빈도 수를 찾았다. 이를 위해 가장 먼저해야 할 것은 고객 분류였다. 오픈율과 이탈율을 고중저로 나누어 분류표를 만들었고 이를 통해 이메일 빈도수를 조절할 수 있었다. 

비나스코는 "정확하게 정답을 제공할 수 있는 머신러닝 모델은 없다. 정확한 답은 줄 수 없지만, 고객을 분류해 빈도수를 파악할 수 있는 근간을 마련할 수는 있다"고 말했다. 실제 우버는 이를 통해 첫해에 50만 건의 구독 해지를 방지할 수 있었다고 판단했다.   

우버는 머신러닝을 고객 유지 마케팅뿐만 아니라 크로스 판매에도 적용했다. 우버는 자사의 또 다른 비즈니스 모델인 음식 배달 서비스를 기존 고객이 사용하게 되는 전환율을 분석했다. 분류된 데이터를 기반으로 관심이 없는 이와 전환율이 높은 이들에게는 별도의 프로모션을 하지 않고 중간 부분에 위치한 고객들을 대상으로 마케팅 활동을 해야한다는 결론에 다다랐다. 

우버는 전세계에 걸쳐 마케팅에 매년 수십억 달러 규모의 투자를 한다. 이 투자를 제대로 배분해, 언제, 얼마나 투자할 것인지 결정하는 데 머신러닝 모델을 적용했다. 과거 투자했던 곳과 금액, 결과 등 데이터를 기반으로 모델을 훈련시켜 새로운 모델링을 만든다. 비나스코는 "간단한 경우는 엑셀과 같은 수작업으로도 가능하다. 하지만 우버는 수백 개의 도시에 엄청난 금액을 투자하기 때문에 데이터가 굉장히 많고 채널도 많아 머신러닝을 이용했다"고 말했다. 

뒤이어 히타치밴타라의 김경륜 이사가 산업현장에서의 데이터사이언스 적용이라는 주제로 강연했으며, 퓨어스토리지의 이규현 상무는 AI와 빅데이터 시대, 기업의 비즈니스 혁명을 위한 데이터 혁신 전략이라는 주제로 오전 컨퍼런스를 마무리했다. 

오후에는 팁코 소프트웨어의 김영석 이사가 운영에서의 데이터 사이언스를 설파한 것을 시작으로, 퍼즐데이터의 김영일 대표이사가 빅데이터 분석의 새로운 영역, 프로세스 마이닝 활용 사례를 강연했다. 

그리고 AXA 데이터 매니지먼트 & 이노베이션 담당 헤드인 조나단 칼머스가 데이터로 가치를 만들어내는 비즈니스 모델과 보험의 서비스화라는 주제로, 트위치의 애널리틱스 디렉터인 준 더쇼위츠는 데이터 분석가처럼 생각하는 법이라는 주제로 이번 컨퍼런스를 마무리했다. editor@itworld.co.kr 


X