이중 오라클 클라우드 인프라스트럭처 데이터 사이언스(Oracle Cloud Infrastructure Data Science)가 핵심 솔루션으로, 기업 내 협력 기반의 머신러닝 모델 개발과 교육, 관리 및 구축을 통해 데이터 사이언스의 성공적 수행을 돕는다.
개별 데이터 과학자(Data Scientist)에 중점을 두는 다른 솔루션과는 달리, 오라클 클라우드 인프라스트럭처 데이터 사이언스는 기업 내 공유 프로젝트와 모델 카탈로그, 팀 보안정책, 재현성 및 감사성(auditability) 등 데이터 사이언스 조직이 다루는 주요 기능에 집중하는 것이 특징이다. 또한 자동 머신러닝(AutoML) 알고리즘 선택과 튜닝, 모델 평가 및 모델 설명기능을 통해 최적의 데이터세트틀 자동으로 선택해준다.
오늘날 기업은 비즈니스 혁신을 도모할 수 있는 거대한 양의 잠재적 데이터를 보유하고 있음에도 극히 그 일부만 이를 파악하거나 활용하고 있다. 이는 기업 내 데이터 사이언스 조직이 올바른 데이터에 접근하여 머신러닝 모델을 효과적으로 개발하고 구축할 수 있는 도구가 없었기 때문으로 분석된다. 그 결과, 이러한 모델 개발에 장시간이 소요됨은 물론, 정확도와 안정성의 요건을 충족하지 못해 실제 업무 환경에까지 적용하지 못하는 경우가 대다수였다.
오라클 데이터 및 AI 서비스 제품 개발 부문 그렉 파블릭 수석부사장은 “성공적인 데이터 사이언스 프로젝트 수행을 위해서는 효과적인 머신러닝 모델이 그 기반임에도, 다양하고 방대한 양의 데이터가 그 동안 기업들의 발목을 잡아왔다”며, “이번 오라클 클라우드 인프라스트럭처 데이터 사이언스 출시를 통해 개별 데이터 과학자의 전체 업무를 자동화해 개인 생산성을 증대할 뿐만 아니라 관련 팀 간의 협력을 지원함으로써 데이터 사이언스 프로젝트가 실질적인 기업의 비즈니스 가치로 직결될 수 있도록 지원할 수 있게 되었다”고 밝혔다.
오라클 클라우드 인프라스트럭처 데이터 사이언스는 ▲AutoML 자동화 알고리즘 선택 및 튜닝 ▲자동화된 예측형 특징(predictive feature) 선택 ▲모델 평가 ▲모델 설명 기능을 통해 데이터 사이언스 워크플로우 자동화와 시간 절약 및 오류 최소화 등의 효과를 구현한다.
효과적인 머신러닝 모델을 실제 생산환경에 성공적으로 도입하기 위해서는 단순히 전담 요원들의 배치보다는, 함께 협업할 수 있는 팀 단위의 데이터 과학자들이 필요하다. 이러한 팀 역량을 지원하기 위한 오라클 클라우드 인프라스트럭처 데이터 사이언스는 ▲프로젝트 공유 기능 ▲모델 카탈로그 ▲팀 기반의 보안 정책 ▲재생산성과 감사성 등의 기능을 제공한다. editor@itworld.co.kr