개발자 / 데이터ㆍ분석 / 오픈소스

글로벌 칼럼 | 카산드라와 데이터스택스의 재결합에 거는 기대

Matt Asay | InfoWorld 2020.04.01
한때 이별했던 데이터스택스(DataStax)가 아파치 카산드라(Apache Cassandra) 프로젝트에서 다시 한 번 중요한 역할을 수행한다.   
 
ⓒ Getty Images Bank

아파치 카산드라는 세계에서 가장 인기 있는 데이터베이스 가운데 하나지만 몇 년 전부터 커뮤니티의 분열에 골머리를 앓고 있다. 카산드라 내에서 오랜 기간 주도적인 역할을 해온 데이터스택스가 리더십 역할을 포기하면서 혼란의 와중에 프로젝트를 떠난 듯이 보였다.

그러나 데이터스택스는 카산드라를 떠나지 않았고 애초에 프로젝트가 혼란에 빠진 것도 아니었다.

데이터스택스가 아파치 소프트웨어 재단(ASF)의 비판에 조금 물러난 대신 애플, 넷플릭스와 같이 카산드라에 의존하는 여러 업체가 나서 카산드라 커뮤니티 내에서 리더십 역할의 공백을 채웠다. 카산드라 4.0 출시가 임박한 지금, 데이터스택스가 다시 한 번 카산드라에서 중요한 역할을 맡으면서 카산드라 코드와 커뮤니티는 과거 어느 때보다 견실한 모양새를 갖추고 있다.


집안 가장이 나가면 생기는 일

단일 공급업체 오픈소스 프로젝트는 흔히 볼 수 있지만 ASF 프로젝트에서는 금지된다. 이 규칙이 카산드라에 문제가 됐다. 몇 년 전에 데이터스택스가 카산드라 코드의 85%를 기여하는 동시에 커뮤니티 콘텐츠 포럼인 플래닛 카산드라(Planet Cassandra), 카산드라 이벤트 등도 주도적으로 운영했기 때문이다. ASF는 데이터스택스가 카산드라에 대해 과도한 영향력을 행사하거나 행사할 가능성이 있다고 비판했고, 데이터스택스가 한발 물러나면서 카산드라 커뮤니티에 공백이 생겼다.
 
그러나 각 기업의 카산드라에 대한 투자는 계속됐다. 예를 들어 애플은 오랜 기간 뛰어난 확장성과 높은 성능을 지닌 분산 데이터베이스인 카산드라를 사용해왔다. 애플은 카산드라 기술을 어떻게 사용하는지에 대한 정보는 거의 공개하지 않지만 현재 10만 개 이상의 카산드라 노드를 실행한다는 것은 알려진 사실이다.

카산드라에 이처럼 크게 투자한 만큼 카산드라가 추락한다면 애플도 상당한 타격을 입게 된다. 그래서 애플은 카산드라 3.11부터 지금의 카산드라 4.0에 이르기까지 안정성을 대폭 높이기 위해 많은 노력을 기울였다. 애플 혼자만의 노력은 아니다.

2018년 아론 모튼에 따르면(카산드라 컨설팅 업체인 래스트 피클(The Last Pickle)의 공동 창업자이자 CEO. 최근 데이터스택스에 인수됨), 카산드라의 안정성을 높이는 데 중점을 두자 더 많은 프로젝트 사용자가 나서서 이 노력에 힘을 보탰다.

모튼은 "데이터스택스 입장에서는 가만히 있기가 힘들었겠지만 덕분에 다른 이들이 데이터스택스의 공백을 채우면서 커뮤니티가 더 다양화되는 결과로 이어졌다. 필자와 함께 래스트 피클의 공동 창업자 가운데 한 명인 네이트 맥콜이 데이터스택스의 조나단 엘리스를 대신해 PMC 회장으로 선출됐고, PMC는 많은 사람의 도움을 받아 커미터(committer)의 수를 늘리고 카산드라에 의존하는 기업을 독려해 더 많은 기여를 이끌어냈다. 또한 넷플릭스, 우버, 인스타그램과 같은 대기업도 계속해서 중요한 부분을 기여하고 있다"라고 설명했다.

다양한 기업과 개인이 참여하고 있지만 이들이 항상 같은 방향으로 노를 젓는 것은 아니다. 예를 들어 여러 기업이 기여하고 개선하는 하나의 일반화된 카산드라용 쿠버네티스 오퍼레이터가 있으면 좋겠지만 현실은 스카이(Sky), 오랜지(Orange), 인스타클러스터(Instaclustr) 등의 여러 오퍼레이터가 있다.

인스타그램과 같은 기업은 카산드라를 아예 포크해버렸다('록산드라(Rocksandra)'). 이런 행동 자체가 나쁜 것은 아니지만 “카산드라는 무엇인가”라는 정의를 불분명하게 하고 혁신의 에너지를 여러 곳으로 분산시키는 결과를 초래한다. 다시 데이터스택스 이야기로 돌아가 보자.


돌아온 데이터스택스

지금 가장 필요한 것은 누군가 공동의 목표를 향해 카산드라 기여자들을 결집하는 것이다. 네이트 맥길과 같은 카산드라의 주요 관리 책임자와 지도부는 카산드라 4.0(현재 베타 단계이며 2020년 2분기 공식 출시 예정)에 이르러 몇 년 전에 약속했던 안정성을 실현하는 어려운 일을 훌륭하게 해냈다.

이제는 다른 요구사항으로 눈을 돌려야 한다. 특히 새로운 지도부가 카산드라에 대한 기여를 강조했음을 감안하면 데이터스택스는 이런 요구사항을 충족하기에 적절한 위치에 있다.

예를 들어, 카산드라의 포크(fork)가 유행한 데는 그럴 만한 이유가 있지만 어떤 기업도 포크를 유지 관리하고 싶어하지 않는다(포크 유지 관리를 위해서는 오픈소스 프로젝트의 주 분기가 계속 진행되는 중에도 상당한 리소스를 투입해야 한다). 카산드라에 플러그인 기능을 내장하는 데 더 중점을 두면 이와 같은 포크의 필요성을 없앨 수 있을 것이다.

데이터스택스는 카산드라에 온전히 집중하고 다른 사람과 협력해 카산드라 코드를 모듈화해서 아키텍처의 플러그인 특성을 강화할 수 있다. 포크 가능한 스토리지 엔진 대신 플러그인 가능한 스토리지 엔진이 있다면 카산드라에는 큰 진전이 된다. 이와 같은 작업은 결코 간단한 일이 아니며 개발자 한 명이 남는 시간에 할 만한 종류의 일도 아니다.

마찬가지로, 카산드라에는 일반화된 쿠버네티스 오퍼레이터가 필요하다(쿠버네티스를 사용해 카산드라 클러스터를 더 쉽게 배포하기 위해서다). 이 일도 역시 간단치 않지만 다양한 관점을 분산시키는 대신 하나의 프로젝트로 정렬하는 데 필요한 요소이므로 중요하다. 데이터스택스에는 카산드라 문서를 개선하기 위한 작업을 보완하고 4.0 릴리스를 테스트하는 등 좋은 기회가 될 수 있다.

필자는 카산드라 커뮤니티에서 데이터스택스가 지배적 기여자가 돼야 한다고 주장하는 게 아니다. 지난 몇 년 동안 카산드라 커뮤니티에서 배운 점이 있다면 그건 많은 기업이 카산드라에 진정한 가치를 기여할 역량을 갖고 있다는 사실이다. 그러나 이런 노력을 공동의 요구사항을 해결하는 데 집중하고 리소스의 분산이 아닌 집결을 이끌기 위해서는 더 많은 노력이 필요하다. 데이터스택스가 카산드라 내에서 리더십 역할을 다시 이어 나가기 위한 좋은 길로 보인다. editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.