H2O
이제 버전 3인 H2O는 일반적인 개발 환경(파이썬, 자바, 스칼라, R), 빅데이터 시스템(하둡, 스파크), 그리고 다양한 데이터 소스(HDFS, S3, SQL, NoSQL)를 통해 머신러닝 알고리즘에 대한 액세스를 제공한다. H2O는 데이터 수집, 모델 구축, 그리고 각종 예측을 제공하기 위한 엔드 투 엔드 솔루션으로 개발되었다. 예를 들면, 모델을 자바 코드로 내보낼 수 있어서, 여러 가지 예측사항들이 다수의 플랫폼과 환경에서 사용될 수 있게 하고 있다.
H2O는 순수 파이썬 라이브러리로 기능하거나, 주피터 노트북(Jupyter Notebook)을 통해서 또는 R 스튜디오에서 R 언어를 통해서 사용할 수 있다. 이 플랫폼에는 H2O에만 있는 플로우(Flow)라는 오픈소스, 웹 기반 환경도 포함되어 있으며, 플로우는 학습 프로세스 이전이나 이후뿐 아니라 학습 프로세스 도중에도 데이터셋과 상호작용할 수 있게 해준다.