에너지 산업에 일렁이는 '데이터 과학' 물결

CIO
유가 하락의 여파가 세계 경제에 미치고 있다. 캐나다 알버타 주에서는 유가 하락으로 인해 물가가 함께 하락하면서 실업률이 올라가는 문제가 발생했고 올해 1월 사우디 아라비아 역시 이런 상황을 고려해 현지 유가를 50% 가량 인상하는 조치를 취하기도 했다.
유가 변동과 그로 인한 물가 변동폭이 커짐에 따라, 또 에너지 프로젝트의 높은 비용으로 인해 정보의 중요성이 그 어느 때보다 커지고 있다.



이를 위해 에너지 업계에서 주목하고 있는 것 중 하나가 데이터 과학이다. 이를 이용해 비용을 절감하고, 투자결정을 최적화하며 리스크를 줄이려는 시도를 하고 있다. 특히 장비 및 시설 관리, 모니터링 분야에 데이터 과학이 많이 쓰이고 있다. 이 밖에 에너지 분야 투자 결정에도 데이터 과학이 이용되고 있다.

생존 분석 개념의 차용
타 산업 분야로부터 아이디어나 기술을 도입해 혁신을 달성하는 것은 검증된 혁신 방식이다. “에너지 산업은 최근 의료 분야에서 쓰이던 생존 분석이란 개념을 도입하기 시작했다”라고 휴스턴 에너지 데이터 사이언스(Houston Energy Data Science) 대표 프란시스코 산체스는 전했다.

생존 분석이란 환자들의 상태, 치료 상황 등 다양한 요소를 고려하여 환자의 생존률을 계산하는 통계 분석 방식이다. 오늘날 일부 정유 업계에서는 이 개념을 기계 및 설비 오류를 예방하는 데 적용하고 있다.

산체스는 “생존 분석 방식을 적용하여 모니터링, 모델링 등을 통해 컴프레서 같은 장비의 유지, 보수 상황에 생길 수 있는 문제를 미리 예측할 수 있다”라고 설명했다.

에너지 업계에서는 기계 문제가 발생할 경우 이것이 해결될 때까지 3일은 아무 것도 할 수 없는 경우가 많다. 데이터 과학을 통해 사전에 이에 대한 대비를 하면 이러한 다운 타임을 하루까지도 줄일 수 있다는 게 그의 설명이다.

다운 타임은 하루가 늘어날 때마다 엄청난 손실을 초래한다. 소규모 유정에서조차 하루 1,000배럴에 가까운 석유가 생산되는데, 현재 유가로 계산하면 이는 하루 3만 달러의 수익을 포기해야 함을 의미하기 때문이다.

BP가 데이터 과학 및 애널리틱스 분야에 관심을 갖게 된 이유
영국의 정유 업체 BP(British Petroleum) 역시 IT 및 관련 분야에 많은 투자를 하고 있다. 정유 업체 BP가 IT에 이처럼 관심을 갖게 된 데는 여러 가지 이유가 있지만, 무엇보다도 안전 사고의 예방이 주 목적이다.

BP는 2010년 멕시코 만 기름 유출 사건과 2015년 여타 다른 환경 문제 유발에 대한 책임을 지고 180억 달러에 달하는 배상액을 지불해야 했다. 즉 회사에게는 정보 기술의 활용을 통해 이러한 사건, 사고들을 사전에 예방하는 것이 대단히 중요한 비즈니스 문제로 대두됐다. 2013년 BP 사는 텍사스 주 휴스턴에 하이 퍼포먼스 컴퓨팅 센터(Center for High-Performance Computing)를 설립하고 라이스 대학 등 미국 내 여러 기관들과의 협력을 진행해오고 있다.

애널리틱스를 통해 안전 사고를 예방하는 데 있어 BP가 취하는 전략은 엔드-투-엔드 접근법이다.. BP의 애널리틱스 프로세스는 고 퀄리티 데이터와 모니터링 역량에 대한 투자로 시작한다.

- 현장에서의 데이터 애널리틱스. BP 웰 어드바이저(Well Advisor)가 예측 툴을 이용하여 현장으로부터의 데이터를 통합, 처리하여 이를 사무실의 오퍼레이터들에게 보낸다. 오퍼레이터들은 대시보드를 통해 이 데이터를 받아보고 이를 기반으로 최적의 의사 결정을 내릴 수 있다. 웰 어드바이저는 현재 100 곳이 넘는 해외 유전에서 활용되고 있다.

- 생산 역량의 증가. BP는 정유 공장의 효율성 증진에 각종 애널리틱스와 모델을 사용하고 있다. 정유 공장의 생산 역량을 최적화시키는 접근 방식이다. 애널리틱스는 또한 직접적인 생산량 증가에도 일조하고 있다.

- 파트너십과 인재 관리. BP가 이처럼 테크놀로지 분야에 많은 투자를 하고 있지만 그것이 전부는 아니다. BP는 또한 IBM과의 협력을 통해 생산성 향상 및 인력 관리 프랙티스를 고도화하고 있다. BP의 데이터 과학 테크놀로지 담당자 찰스 카이는 영국 내 유명 데이터 리더 50인 중 하나로 꼽히기도 했다.

물론 BP는 전 세계에 생산 설비와 인프라를 갖춘 초 거대 기업이다. 모든 기업이 BP의 전략을 따라 하긴 어려울 수 있다. 하지만 그렇다고 방법이 없는 것은 아니다.

어떤 툴이 적합할까?
프란시스코 산체스는 “구체적인 애널리틱스 툴이나 테크닉도 물론 중요하지만, 그보다 먼저 집고 넘어가야 할 것은 비즈니스 문제다”라고 강조했다. 에너지 분야에서 흔히 발생하는 비즈니스 문제에는 생산량 예측, 현장 효율성 증대, 지질학적 활동의 이해 등이 있다. 어떤 문제를 해결하는 것이 시급한지 먼저 확인하는 것이 도움이 된다.

그는 “BP나 할리버튼(Halliburton)같은 대기업들은 이미 데이터 과학에 기반한 애널리틱스를 도입하고 있다. 하지만 그보다 규모가 작고, 처리 데이터가 덜 복잡한 기업들의 경우 문제에 따라 전문 데이터 과학자를 한, 두 명만 채용해도 많은 변화와 개선할 수 있다”라고 말했다.

산체스는 이어 “어떤 툴을 선택할 것인가는 문제가 얼마나 복합적인가에 따라 다르다. 변수가 50개 이상인 상황이라면 기계 학습 툴을 추천한다. 살포드 시스템(Salford System)에서 나온 랜덤 포레스트(Random Forest)라는 툴도 추천할 만 하다. 팁코(Tibco)나 타블로(Tableau)는 데이터를 시각화하는 데 매우 유용한 툴들이다”라고 말했다. 변수가 그보다 적은 프로젝트의 경우 R이나 파이썬(Python)같은 툴킷이 적합하다고 그는 덧붙였다.

데이터 애널리틱스의 가능성
데이터 분석가들의 전문 역량은 다른 분야에서와 마찬가지로 에너지 분야에서도 많은 가치를 창출해 왔다. 데이터를 취합, 분석, 정리하여 유의미한 형태로 이용될 수 있게 재구성 함으로써 상당한 부가가치를 창출해 낸 것이다.

알버타 주 프리시전 드릴링(Precision Drilling)의 애널리스트 그래험 에켈은 “데이터 애널리스트로서 내가 가장 많은 시간을 투자하는 부분은 굴착과 시추 과정의 성과를 시각화 하는 것이다. 수백 가지 데이터 소스를 깔끔하게 통합, 분류하여 한 눈에 보고 파악하기 쉽게 만드는 데이터 수집 루틴을 만들어 냈다. 우리 업체에서는 시장 평균가보다 높은 가격으로 이러한 애널리틱스 서비스를 판매하고 있다. 내부적으로 이런 작업을 할 수 있는 기업들이 별로 없기 때문에 프리미엄을 지불하고서라도 이러한 데이터 시각화 루틴을 구매하고자 하는 고객들이 많이 있다”라고 전했다.

그는 이어 “에너지 산업 분야에서는 데이터 과학이 활약할 수 있는 가능성이 특히 크다. 데이터 수집, 정리, 저장을 위한 시스템 및 프로세스 시행이 그 시작이다. 그 다음에는 그 과정에서 필요한 아키텍처의 구축, 그리고 이행 과정을 가이드 해 줄 데이터 과학자를 고용하는 것이 수순이다. 이 정도면 데이터 애널리틱스를 이용한 예측 분석 준비가 끝났다고 할 수 있다”라고 설명했다. ciokr@idg.co.kr