반면 과거 기록 데이터는 일반적으로 배치 ETL(추출, 변환, 로드) 프로세스를 거친 후 데이터 웨어하우스, 데이터 레이크 또는 데이터 레이크하우스와 같은 분석 데이터베이스로 전달된다. 급하지 않을 때는 이런 절차를 거쳐도 문제될 것이 없다. 그러나 분석 결과에 대해 최대한 실시간에 가깝게 대응하기 위해서는 스트리밍 데이터를 신속하게 처리해야 하는 경우가 있다.
스트리밍 데이터 처리 소프트웨어는 보통 증분적으로 데이터를 분석하고 실시간 집계 및 상호연계, 필터링 또는 샘플링을 수행한다. 또한 스트림은 과거 기록 레코드에 반영되도록 저장되는 경우도 많다. 증분 처리는 레코드 단위로 할 수도 있고 일정한 시간에 걸쳐 수행할 수도 있다.
스트림 데이터를 실시간으로 분석하면 비정상적인 이벤트, 정상 값에서의 현저한 이탈, 형성 중인 추세를 감지할 수 있다. 이렇게 하면 농지가 건조해질 때 급수 장치를 켜거나, 주식 값이 목표가 아래로 떨어질 때 주식을 구매하는 등의 실시간 대응이 가능하다. 스트리밍 데이터의 소스에는 다음이 포함된다.