Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
클라우드

글로벌 칼럼 | “오픈, 오픈, 오픈” 구글 클라우드의 핵심 전략 ‘개방성’

Matt Asay | InfoWorld 2022.10.13
구글 클라우드(Google Cloud)는 항상 경쟁 업체들과는 다른 접근 방식을 취해 왔다. 구글은 멋진 회사가 되기 오래전부터 오픈소스에 관심이 많았고 외부 파트너십을 체결하면서 고객의 요구사항에 적극적으로 대응했다. 물론 구글의 따스하고 포근한 접근 방식이 모두 성공만 가져온 것은 아니다. 기업 고객의 관심을 끌기 위해 조금 더 ‘재미없게’ 변해야 할 때도 있었다. 그러나, 개방성을 차별점으로 내세우려는 구글의 진지한 노력은 점점 더 결실을 맺고 있다. 이번 주 열렸던 ‘구글 넥스트(Google Next) 2022 이벤트’에서 그 결과를 확인할 수 있었다. 
 
ⓒ Getty Images Bank 

구글 클라우드 VP 겸 데이터 분석 총괄 담당자 게릿 카즈마이어는 인터뷰에서 “개방형 기술(오픈소스, 오픈 표준, 오픈 데이터)”의 중요성을 내내 강조했다. 인터뷰 중 ‘오픈’이라는 단어를 무려 29회나 언급했다. 게다가 구글 클라우드 사업부에서 공개한 블로그 글과 보도 자료 등에서도 ‘오픈’이라는 단어가 100번도 넘게 사용되었다. 이쯤 되면 구글이 전달하려는 주요 메시지는 분명하다. 바로 ‘구글은 개방형(open) 클라우드가 되고 싶어 한다’라는 점이다. 별거 아닌 것처럼 들리겠지만 업계에서 주목해야 할 방향일 수 있다. 물론 개방형 클라우드를 구현하기는 대단히 어렵다. 제품과 데이터 소유권에 대한 독특한 사고 방식이 필요하기 때문이다. 
 

‘개방’해서 ‘수익’ 얻기

필자는 이전 기사에서 구글이 오픈소스를 적극 받아드린 덕에 클라우드 시장에 미리 진출한 AWS와 경쟁할 수 있는 튼튼한 발판을 확보했다고 밝힌 바 있다. 오픈소스 기여자 많다고 무조건 성공하는 것은 아니지만 구글의 방식은 장기적인 관점에서 고객 중심 전략을 구사하고 시장 재편에 도움이 될 것이다. 실제 그러한 필자의 예측은 맞아 떨어지고 있다. 이번 넥스트 이벤트를 보면, 구글 클라우드가 ‘모든 소스, 모든 플랫폼, 모든 데이터를 통합해 가장 개방된 데이터 클라우드 생태계’로 자리매김하려 하고 있다는 것을 알 수 있다. ‘모든’이라는 표현은 다소 과장된 것이겠지만 구글이 개방성에 진심인 것은 분명하다. 다음 내용을 살펴보면 더욱더 그렇다.  
 
  • 아파치 아이스버그(Apache Iceberg), 리눅스 재단 델타 레이크(Linux Foundation Delta Lake), 아파치 후디(Apache Hudi)와 같은 주요 데이터 형식에 대한 지원을 추가함 
  • 아파치 스파크(Apache Spark)를 위한 빅쿼리(BigQuery)에 새로운 통합 경험을 도입함
  • 콜리브라(Collibra), 엘라스틱(Elastic), 몽고DB(MongoDB)(필자는 몽고DB 직원임을 밝혀 둔다) 등과 같은 인기 있는 기업 데이터 플랫폼과의 통합을 확장하거나 도입함 

엘라스틱 파트너십은 특히 흥미롭다. 양방향 통합이기 때문이다. 이번 파트너십으로 구글 고객들은 엘라스틱서치(Elasticsearch) 질의를 구글 클라우드의 데이터 레이크에 통합하는 작업을 보다 수월하게 할 수 있다. 또한 루커(Looker) 지원을 엘라스틱 플랫폼에 결합하고 있다.

델타 레이크는 데이터브릭스(Databricks)에서 개발한 기술인데, 사실 데이터브릭스와 구글 클라우드는 데이터 웨어하우징 워크로드 사업을 놓고 경쟁하는 관계다. 필자는 데이터브릭스 제품 관리 담당 SVP 데이빗 마이어에게 델타 레이크 통합을 강화한 이유를 물어봤는데 “고객 때문”이라는 답을 들었다. 마이어는 “고객들은 데이터브릭스가 구글에 있어야 한다고 말했다. 왜냐하면 포춘 1,000대 회사들에 들어가는 규모가 큰 기업은 영향력 관점에서뿐만 아니라 데이터 자산 관점에서도 클라우드에 다양성이 필요하기 때문”이라고 설명했다.

해당 기업들은 이미 구글 애즈(Google Ads)를 사용하는 경향이 있으므로 클라우드 공간을 확장하는 과정에서 구글 클라우드를 선택하기 쉽다. 만약 데이터가 델타 레이크에 들어갔다면 고객은 더 쉽게 데이터를 관리할 수 있다. 두 회사가 파트너십을 맺어 구글 클라우드에서 델타 레이크 형식을 지원한다면, 고객은 델타 데이터 레이크에 저장된 데이터를 옮길 필요 없이 빅쿼리를 적용할 수 있다. 일종의 윈윈이다.

구글은 자체 기술의 노선도 한 번 더 정리했다. 대표적으로 구글의 비즈니스 인텔리전스 서비스 전체를 루커 브랜드 아래로 이동했다. 루커와 구글 워크스페이스를 제대로 통합하여 상대적으로 쓰기 쉽고 접근성이 좋은 구글 스프레드시트 같은 생산성 도구를 BI 중심의 인사이트를 만드는 데 활용할 수 있게 만들었다. 

그런 면에서 구글 클라우드 전략에서 말하는 ‘오픈’은 오픈소스 기술을 가르키지 않는다. 그보다는 ‘데이터 활용의 장벽을 낮춘다’는 의미에 가깝다. 물론 경쟁 서비스들도 마이SQL이나 리눅스를 사용하기 쉽게 만들면서 호환성을 높였다. 하지만 구글 클라우드는 그보다 한 단계 더 나아가 데이터 인프라뿐만 아니라 데이터의 사용을 수월하게 했다.

구글이 버텍스 AI 비전(Vertex AI Vision)을 도입한 것도 비슷한 맥락이다. 버텍스 AI 비전을 이용하면 데이터 실무자 누구나 복잡한 컴퓨터 비전과 이미지 인식 AI 관련 작업을 보다 쉽게 처리할 수 있다. 구글은 이런 기술을 만들기 위해 온갖 똑똑한 사람을 고용했지만, 그 덕분에 실제 고객들은 전문성이 낮아도 다양한 고급 기능을 이용할 수 있게 됐다. 카즈마이어가 강조한 것처럼 기업 데이터 자산은 복잡성은 더욱 커질텐데 이를 관리할 기술을 구글이 알아서 출시하니 고객 입장에서 분명 잘된 일이다.
 

더 많은 데이터를 가져오려는 구글 클라우드

요즘에는 하나의 클라우드 서비스만 이용하는 기업은 거의 없다. 카즈마이어는 “CIO가 온프레미스 인프라와 여러 클라우드 서비스에 애플리케이션을 설치하는 것을 막으려고 해도, 이미 많은 기업에서 데이터를 여러 클라우드에서 관리하고 있다”라고 설명했다. 카즈마이어는 “그러다 보니 멀티클라우드의 목적은 똑같은 솔루션을 여러 클라우드에 배포하고 똑같은 기술의 독립적인 사일로를 갖추는 것이 아니다. 여러 클라우드의 데이터를 종합적인 데이터 환경 내에 서로 연결하는 것이다”라고 설명했다. 

바로 이런 비전에 따라 구글 클라우드는 멀티클라우드를 적극 수용하고 있으며 안토스(Anthos) 같은 서비스도 내놓았다. 이번 행사에서 구글은 “이제 빅쿼리에서 비정형 스트리밍 데이터를 분석하는 것이 가능해짐에 따라 기업이 정형 데이터와 비정형 데이터의 분석을 빅레이크라는 한 장소에서 통합할 수 있다”라고 소개했다. 또한 구글 클라우드 기술은 “데이터 클라우드”라기 보다 “클라우드에서 데이터를 끌어오기도 하는 데이터 웨어하우스”를 의미한다. 좀 더 정확히는, 데이터 웨어하우징/애널리틱스 서비스 및 AI/ML 활성화 시스템과 완벽히 협력해 몽고DB처럼 데이터베이스로부터 운영 데이터를 끊김없이 분석할 수 있는 능력을 제공하려 하는 것이다.

매우 당차면서 인상적인 기술이지만 구글이 실제로 이런 기술을 잘 지원할 수 있을지는 좀 더 두고 봐야 한다. 아마 구글이 고객 경험과 관련 데이터를 절대적 소유권 관점에서 바라보지 않는다면 기술 지원에 성공할 수 있다. 기본적으로 필자는 구글 클라우드를 비롯해 클라우드 서비스 업체가 이제 모든 기술을 직접 만들 수 없다는 것을 인정하고 나아가야 한다고 생각한다. 클라우드 서비스 업체의 규모가 크더라도 모든 수요를 충족할 솔루션을 만들어낼 수 있을 만큼 규모를 늘릴 수는 없다.

구글도 아직까지는 필자의 의견과 비슷한 것 같다. 앞서 언급한 것처럼 구글은 항상 파트너 지향적이었고 올해 넥스트 이벤트에서는 한발 더 나아갔다. 카즈마이어는 깊이 통합된 파트너 생태계를 만들려면 구글 클라우드가 “100% 오픈 API를 갖춰야 하지만 그것으로 충분하지 않으며, 구글 제품에서 사용하는 API도 파트너들에게 노출하는 API와 똑같아야 한다”라고 말했다. 물론 이것이 가능하지 않은 주변 사례도 있겠지만 예외일 가능성이 크다. 카즈마이어는 “많은 워크로드는 구글의 파트너가 처리할 것이며, 구글은 파트너사가 그런 기술을 구축할 수 있도록 구글의 API를 오픈할 것이다. 구글은 파트너사와 직접 경쟁한다고 생각하지 않는다”라고 말했다. 

구글의 전략은 클라우드 산업뿐만 아니라 컴퓨팅 산업 전체에서도 보기 쉽지 않은 접근법이다. 데이터는 계속해서 모든 장소에서 폭발적으로 늘어날 것이니 구글의 전략은 어느 정도 일리가 있다. 데이터가 여러 클라우드에서 저장되고 늘어나고, 그 형태는 정형과 비정형이면서, 실시간 및 일괄 처리 지향 분석도 필요하다. 어떤 방식이든 복잡성은 계속 늘어날 것이라고 가정하면, 구글 클라우드의 접근 방식은 꼭 필요해 보인다. 카즈마이어는 데이터가 넘쳐나는 복잡한 세상에서 “개방형 플랫폼은 고객들에게 최고의 선택이 될 것이다. 여러 솔루션 중에 원하는 것을 고를 수 있으니 궁극적으로 다른 어떤 것보다 시간 대비 최대의 유연성을 제공할 것이다”라고 설명했다.
editor@itworld.co.kr
 Tags 구글클라우드 오픈소스 데이터 개방성
Sponsored
IDG 설문조사

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.