2020.01.22

글로벌 칼럼 | 증가하는 데이터, 보안이 충족되어야 하는 4가지 새로운 과제

Drew Osborne | CSO
세계 데이터의 90%가 지난 2년 동안 생성되었다는 것을 들어본 적이 있을 것이다. 흔히 인용되는 이 구절은, 때로는 당연한 결과이겠지만, 대중의 의식을 거쳐 별 것 아닌 것이 되어가고 있다. 이는 ‘재미있는 사실’로 전락하기 전에 경고의 의미가 담긴 이야기로 제시하고자 한다. 
 
ⓒ Getty Images Bank

필자가 가장 좋아하는 소설의 탐정은 “확실한 사실보다 더 기만적인 것은 없다”라고 말한 적이 있다. 필자는 독자들에게 이 ‘명백한 사실’을 돌려서 미래를 내다보라고 권한다. 만약 사실이라면, 세계 데이터는 향후 2년 내에 10배, 그리고 다음 4년 후에는 100배 증가할 것이다.

증가의 이유와 그 지속은 자명한 사실이다. 데이터는 귀중한 정보를 담고 있는 자산으로 인식된다. 빅데이터는 새로운 도구와 애널리틱스의 새로운 분야(이어서 더 많은 데이터를 생성함)의 개발로 이어졌으며, 그 결과 더 많은 귀중한 정보가 수집되고 있다. 

경제적 관점에서 볼 때, 빅데이터 시장은 2019년에 490억 달러였고 2023년에는 1,030억 달러로 성장할 것으로 예상된다. 추상적으로 말해, 시장의 힘이 자본화 할 수 있는 상품의 성장을 견인할 것으로 예상해야 한다.


데이터 증가가 안고있는 위험

데이터의 증가는 정보 보안에 몇 가지 도전을 야기한다. 여기에서 몇 가지를 소개해보겠다. 

- 자산 보호하기
‘확실한 사실’은 보호받고 있는 자산이 증가하고 있다는 것이다. 2012년에 세계의 데이터는 2020년까지 40제타바이트에 도달할 것으로 예상했으며, 최근 연구는 5년 후인 2025년까지 175제타바이트에 달할 것으로 예상한다. 더 중요한 것은, 보호가 필요한 데이터의 비율이 2010년의 1/3 미만에서 2020년에는 약 40%로 디지털 환경 자체보다 빠르게 증가하고 있다는 점이다.

소셜 미디어에서 디지털 변환, 그리고 혁신에 이르기까지 많은 요인이 원시 데이터의 성장에 기여한다. 예를 들어, 3D 방사선학은 2D에 비해 파일 크기를 20배 증가시켰고, 자율주행 차량은 시간당 3TB 또는 초당 1GB 미만의 데이터를 생성할 것으로 예상된다. 

원시 데이터를 귀중한 정보로 바꾸는 애널리틱스는 아직 초기 단계에 머물러 있다. 어떤 연구는 데이터의 극히 일부분만 분석한다고 주장하지만, 빅데이터 증가 수치는 폭발적인 관심을 보여준다. 

오늘날 보호받고 있는 데이터는 빙산의 일각에 불과하다. 원시 데이터 측면에서 보안은 IT와 협력해야 하며 데이터 스토리지, 아카이브 및 백업 전략과 함께 데이터의 성장 궤적을 최우선으로 이해해야 한다. 

애널리틱스는 데이터 수요를 증가시키고 훨씬 더 많은 정보를 생성할 것이다. 입력되는 정보에는 고객의 프라이버시와 재무 데이터가 포함될 가능성이 높으며, 이에 따른 결과는 민감하고 가치있는 것이 될 것이다. 분석적 환경은 데이터 위험의 관점에서 평가되고 관리되어야 한다.

- 이동 중인 데이터
데이터는 이동 중이며 이런 움직임은 계속될 것으로 예상된다. 이 주제에 관한 ‘2018 IDC 백서’에서는 3가지 광범위한 범주에서 데이터 위치를 설명한다.
  • 코어: 한때 엔터프라이즈 데이터센터의 독점적인 영역이었던 코어가 퍼블릭이든 프라이빗이든 하이브리드든 점점 클라우드가 되고 있다. 예측에 따르면 2020년까지 퍼블릭 클라우드에서 엔드포인트보다 더 많은 데이터가 필요하고 2021년까지 퍼블릭 클라우드의 데이터가 기존 데이터 센터보다 더 많을 것으로 예상한다.
  • 엣지: 지점, 소매점 또는 지리상 사라진 사무실이든 엣지는 전환 중인 위치다. 어떤 경우에는 가상화가 엣지 데이터를 다시 코어로 이동시키기도 한다. 동시에 임베디드 기기(카메라, POS 단말기, 결제 시스템 등)의 확산으로 그 어느 때보다 엣지에서 많은 데이터가 생성되고 있다.
  • 엔드포인트: 다시 말하지만, 2025년까지 1,500억 개 이상의 연결된 기기들이 데이터를 생성하게 될 것이며, 그 대부분은 실시간으로 데이터를 생성하게 될 것이다. 모바일 기기는 거의 두말할 나위도 없이 소비자 생성과 데이터 소비에 가장 선호되는 장치지만, 이 범주에는 태블릿, 웨어러블, PC 및 사물인터넷(저장 또는 처리하지 않을 수도 있지만 확실히 많은 데이터를 생성하는 장치)도 포함된다.

보안은 비즈니스 채널로서의 엔드포인트의 중요성에 비즈니스가 대응함에 따라 애플리케이션 보안 전문지식을 강조(즉, 모집/유지/개발)해야 한다. 엔드포인트 개발은 개발 주기가 짧고 플랫폼 보안 제어를 가정할 수 없기 때문에 강력한 보안 도전과제의 영역에 속한다. 보안은 더 큰 서비스와 더 빠른 대응으로 진화하는 과정에서 로컬 분석이 이루어짐에 따라 더 높은 컴퓨팅 성능과 증가된 데이터 보존이 요구됨에 따라 엣지에 대한 공격적인 위험 평가를 수행해야 한다. 

특히 클라우드에 있어서는 그러하다.
 
- 서드파티 업체 
간단히 말해서 클라우드는 다른 누군가의 데이터센터일 뿐이다. 클라우드에서 보안을 관리하는 것은 서드파티 환경에서 위험을 관리하고 제공되는 제품에 대한 제어 기능을 활용하는 것을 의미한다. 보안에 관해서는 클라우드는 서드파티 위험 관리의 연습이며, 정보 보안은 매우 적극적인 서드파티 관리 기술을 개발해야 할 것이다.

서드파티 업체들에 관한 한, 조직의 서비스 제공업체 중 일부는 분석적 관심사가 되거나 앞으로 될 데이터를 보유하고 있다는 점도 고려해야 한다. 서비스 제공업체는 다음과 같은 사항을 요구받게 될 것이다.
  • 그들 자신의 분석 수준을 증가시킨다. 
  • 그들의 보유한 데이터에 대한 더 큰 접근 수준을 제공한다. 
  • 클라이언트들이 이용가능한 데이터를 만든다. 

서드파티에게서 분석된 데이터는 가치가 증가하여 통제력을 강화해야 할 필요가 있을 것이다. 물론 접속 확대는 신원과 접속 관리의 문제인 반면, 가용성의 확대는 연결성 제어의 재평가를 필요로 하는 데이터 흐름의 증가를 의미할 것이다. 보안은 이런 각각의 결과들과 일반적으로 서드파티 데이터 관리자에 대해 주의를 기울여야 한다.

- 복잡성
데이터 과학은 V자로 시작하는 명사들로 빅데이터 특성을 설명한다. 가장 중요한 3가지는 볼륨(Volume), 다양성(Variety) 및 속도(Velocity)(다만, 다른 것들도 있음)이며, 빅데이터의 복잡성과 데이터 관리의 이전 개념과 어떻게 다른지를 총체적으로 설명한다.
  • 속도: 빅데이터의 특징에 대한 보안 우려의 우선순위를 정하기는 어렵지만, 각 데이터마다 사례가 있을 수 있다. 다만, 첫 번째는 속도여야 한다고 생각한다. 스토리지 제약(즉, 분석 격차)으로 인해 데이터를 아카이브 하거나 상실하기 전에 기업이 데이터를 소비할 수 있는 속도보다 빠르게 생성할 경우 일반적인 데이터 처리 위험이 있다. 분석이 뒤처질 경우, 지표는 예방 조치에는 너무 늦으며 설상가상으로 사고 대응에도 너무 늦다.
  • 다양성: 데이터는 기존 데이터센터 외부(엣지 및 엔드포인트)와 새로운 다양한 소스로부터 생성되고 있다. 비정형 데이터는 엔터프라이즈 데이터의 80% 이상을 차지하며 연간 55~65%의 속도로 증가하고 있다. 기존 트랜잭션 데이터베이스와 달리 애플리케이션 데이터의 보안은 새로운 중요성을 띠게 될 것이다. 공격 표면이 점점 커지고 변화하고 있다.
  • 볼륨: 보안 우려는 간단하다. 보호받고 있는 원자산이 증가하고 있다.


제언과 기회

미래의 도전과 잠재적인 보상은 우리 마음대로 데이터를 숙달하도록 요구한다. 기업이 애널리틱스를 활용해 가치를 창출하는 것과 마찬가지로, 정보 보안도 동일한 작업을 수행할 수 있으며, 반드시 그렇게 해야 한다. 여기 보안이 데이터와의 관계를 바꿀 수 있는 3가지 방법이 있다.

- 데이터 과학
데이터 과학(Data science)은 정보 보안 툴박스에 추가할 새로운 세대의 애널리틱스 기법과 기술을 가져온다. 많은 것이 매우 큰 데이터 세트와 함께 사용하도록 고안되었다. 몇 가지 예는 다음과 같다.
  • 데이터 세트를 단순화하고 유형을 찾아내는 데이터 마이닝
  • (아주) 큰 데이터 세트에서 새로운 통찰력을 끌어내는 머신러닝 
  • 보안 제어를 우선시하고 풍부하게 하는 예측적 애널리틱스, 사용자 친화적이고 접근 가능한 프로그래밍 언어 및 통계 전문 코드에서부터 인공지능의 실현되지 않은 잠재력에 이르기까지 경험과 검증된 자원의 부족을 상쇄하기 위한 폭넓은 기술

- 위협 지능
위협 지능(Threat intelligence)은 잘 이해된 분야지만 보안 통제 데이터와 상업적 피드에 의존하는 경향이 있다. 데이터가 증가함에 따라 각 기업은 데이터를 분석할 수 있고 분석해야 하는 장소를 마련해야 한다. 보안은 위협 지능의 범위를 자체 통제 범위 이상으로 확대하고 사용자 행동, 네트워크 데이터 흐름, 보호되는 비즈니스 애플리케이션 등을 비롯한 모든 데이터를 마음대로 검토해야 한다. 결국 위협은 어디에나 있을 수 있다. 

- 데이터 보호
데이터 보호(Data protection) 프로그램은 크기와 복잡성이 아니라 강도와 단순성으로 판단되어야 한다. 이상적인 데이터 보호 전략은 모든 데이터에 강력한 기본 제어 장치(인증, 암호화 등)를 한 세트씩 적용해 분류와 라벨의 필요성을 없앨 것이다. 데이터 거버넌스(Data governance)는 라이프사이클 정책과 기밀 해제(공개) 프로세스만 필요로 할 것이다. 직원 교육, 프로젝트 요구사항 및 IT 운영은 모두 동일하고 간단하다. 데이터가 여기에 있으면 보호되며 예외는 없다.

만약 이것이 사소하고 순진해 보인다면, 요점을 짚어내려는 의도였다. 데이터 보호는 설명하기 쉽고, 실행하기 쉬워야 하며, 가능한 한 강력해야 한다. editor@itworld.co.kr 


2020.01.22

글로벌 칼럼 | 증가하는 데이터, 보안이 충족되어야 하는 4가지 새로운 과제

Drew Osborne | CSO
세계 데이터의 90%가 지난 2년 동안 생성되었다는 것을 들어본 적이 있을 것이다. 흔히 인용되는 이 구절은, 때로는 당연한 결과이겠지만, 대중의 의식을 거쳐 별 것 아닌 것이 되어가고 있다. 이는 ‘재미있는 사실’로 전락하기 전에 경고의 의미가 담긴 이야기로 제시하고자 한다. 
 
ⓒ Getty Images Bank

필자가 가장 좋아하는 소설의 탐정은 “확실한 사실보다 더 기만적인 것은 없다”라고 말한 적이 있다. 필자는 독자들에게 이 ‘명백한 사실’을 돌려서 미래를 내다보라고 권한다. 만약 사실이라면, 세계 데이터는 향후 2년 내에 10배, 그리고 다음 4년 후에는 100배 증가할 것이다.

증가의 이유와 그 지속은 자명한 사실이다. 데이터는 귀중한 정보를 담고 있는 자산으로 인식된다. 빅데이터는 새로운 도구와 애널리틱스의 새로운 분야(이어서 더 많은 데이터를 생성함)의 개발로 이어졌으며, 그 결과 더 많은 귀중한 정보가 수집되고 있다. 

경제적 관점에서 볼 때, 빅데이터 시장은 2019년에 490억 달러였고 2023년에는 1,030억 달러로 성장할 것으로 예상된다. 추상적으로 말해, 시장의 힘이 자본화 할 수 있는 상품의 성장을 견인할 것으로 예상해야 한다.


데이터 증가가 안고있는 위험

데이터의 증가는 정보 보안에 몇 가지 도전을 야기한다. 여기에서 몇 가지를 소개해보겠다. 

- 자산 보호하기
‘확실한 사실’은 보호받고 있는 자산이 증가하고 있다는 것이다. 2012년에 세계의 데이터는 2020년까지 40제타바이트에 도달할 것으로 예상했으며, 최근 연구는 5년 후인 2025년까지 175제타바이트에 달할 것으로 예상한다. 더 중요한 것은, 보호가 필요한 데이터의 비율이 2010년의 1/3 미만에서 2020년에는 약 40%로 디지털 환경 자체보다 빠르게 증가하고 있다는 점이다.

소셜 미디어에서 디지털 변환, 그리고 혁신에 이르기까지 많은 요인이 원시 데이터의 성장에 기여한다. 예를 들어, 3D 방사선학은 2D에 비해 파일 크기를 20배 증가시켰고, 자율주행 차량은 시간당 3TB 또는 초당 1GB 미만의 데이터를 생성할 것으로 예상된다. 

원시 데이터를 귀중한 정보로 바꾸는 애널리틱스는 아직 초기 단계에 머물러 있다. 어떤 연구는 데이터의 극히 일부분만 분석한다고 주장하지만, 빅데이터 증가 수치는 폭발적인 관심을 보여준다. 

오늘날 보호받고 있는 데이터는 빙산의 일각에 불과하다. 원시 데이터 측면에서 보안은 IT와 협력해야 하며 데이터 스토리지, 아카이브 및 백업 전략과 함께 데이터의 성장 궤적을 최우선으로 이해해야 한다. 

애널리틱스는 데이터 수요를 증가시키고 훨씬 더 많은 정보를 생성할 것이다. 입력되는 정보에는 고객의 프라이버시와 재무 데이터가 포함될 가능성이 높으며, 이에 따른 결과는 민감하고 가치있는 것이 될 것이다. 분석적 환경은 데이터 위험의 관점에서 평가되고 관리되어야 한다.

- 이동 중인 데이터
데이터는 이동 중이며 이런 움직임은 계속될 것으로 예상된다. 이 주제에 관한 ‘2018 IDC 백서’에서는 3가지 광범위한 범주에서 데이터 위치를 설명한다.
  • 코어: 한때 엔터프라이즈 데이터센터의 독점적인 영역이었던 코어가 퍼블릭이든 프라이빗이든 하이브리드든 점점 클라우드가 되고 있다. 예측에 따르면 2020년까지 퍼블릭 클라우드에서 엔드포인트보다 더 많은 데이터가 필요하고 2021년까지 퍼블릭 클라우드의 데이터가 기존 데이터 센터보다 더 많을 것으로 예상한다.
  • 엣지: 지점, 소매점 또는 지리상 사라진 사무실이든 엣지는 전환 중인 위치다. 어떤 경우에는 가상화가 엣지 데이터를 다시 코어로 이동시키기도 한다. 동시에 임베디드 기기(카메라, POS 단말기, 결제 시스템 등)의 확산으로 그 어느 때보다 엣지에서 많은 데이터가 생성되고 있다.
  • 엔드포인트: 다시 말하지만, 2025년까지 1,500억 개 이상의 연결된 기기들이 데이터를 생성하게 될 것이며, 그 대부분은 실시간으로 데이터를 생성하게 될 것이다. 모바일 기기는 거의 두말할 나위도 없이 소비자 생성과 데이터 소비에 가장 선호되는 장치지만, 이 범주에는 태블릿, 웨어러블, PC 및 사물인터넷(저장 또는 처리하지 않을 수도 있지만 확실히 많은 데이터를 생성하는 장치)도 포함된다.

보안은 비즈니스 채널로서의 엔드포인트의 중요성에 비즈니스가 대응함에 따라 애플리케이션 보안 전문지식을 강조(즉, 모집/유지/개발)해야 한다. 엔드포인트 개발은 개발 주기가 짧고 플랫폼 보안 제어를 가정할 수 없기 때문에 강력한 보안 도전과제의 영역에 속한다. 보안은 더 큰 서비스와 더 빠른 대응으로 진화하는 과정에서 로컬 분석이 이루어짐에 따라 더 높은 컴퓨팅 성능과 증가된 데이터 보존이 요구됨에 따라 엣지에 대한 공격적인 위험 평가를 수행해야 한다. 

특히 클라우드에 있어서는 그러하다.
 
- 서드파티 업체 
간단히 말해서 클라우드는 다른 누군가의 데이터센터일 뿐이다. 클라우드에서 보안을 관리하는 것은 서드파티 환경에서 위험을 관리하고 제공되는 제품에 대한 제어 기능을 활용하는 것을 의미한다. 보안에 관해서는 클라우드는 서드파티 위험 관리의 연습이며, 정보 보안은 매우 적극적인 서드파티 관리 기술을 개발해야 할 것이다.

서드파티 업체들에 관한 한, 조직의 서비스 제공업체 중 일부는 분석적 관심사가 되거나 앞으로 될 데이터를 보유하고 있다는 점도 고려해야 한다. 서비스 제공업체는 다음과 같은 사항을 요구받게 될 것이다.
  • 그들 자신의 분석 수준을 증가시킨다. 
  • 그들의 보유한 데이터에 대한 더 큰 접근 수준을 제공한다. 
  • 클라이언트들이 이용가능한 데이터를 만든다. 

서드파티에게서 분석된 데이터는 가치가 증가하여 통제력을 강화해야 할 필요가 있을 것이다. 물론 접속 확대는 신원과 접속 관리의 문제인 반면, 가용성의 확대는 연결성 제어의 재평가를 필요로 하는 데이터 흐름의 증가를 의미할 것이다. 보안은 이런 각각의 결과들과 일반적으로 서드파티 데이터 관리자에 대해 주의를 기울여야 한다.

- 복잡성
데이터 과학은 V자로 시작하는 명사들로 빅데이터 특성을 설명한다. 가장 중요한 3가지는 볼륨(Volume), 다양성(Variety) 및 속도(Velocity)(다만, 다른 것들도 있음)이며, 빅데이터의 복잡성과 데이터 관리의 이전 개념과 어떻게 다른지를 총체적으로 설명한다.
  • 속도: 빅데이터의 특징에 대한 보안 우려의 우선순위를 정하기는 어렵지만, 각 데이터마다 사례가 있을 수 있다. 다만, 첫 번째는 속도여야 한다고 생각한다. 스토리지 제약(즉, 분석 격차)으로 인해 데이터를 아카이브 하거나 상실하기 전에 기업이 데이터를 소비할 수 있는 속도보다 빠르게 생성할 경우 일반적인 데이터 처리 위험이 있다. 분석이 뒤처질 경우, 지표는 예방 조치에는 너무 늦으며 설상가상으로 사고 대응에도 너무 늦다.
  • 다양성: 데이터는 기존 데이터센터 외부(엣지 및 엔드포인트)와 새로운 다양한 소스로부터 생성되고 있다. 비정형 데이터는 엔터프라이즈 데이터의 80% 이상을 차지하며 연간 55~65%의 속도로 증가하고 있다. 기존 트랜잭션 데이터베이스와 달리 애플리케이션 데이터의 보안은 새로운 중요성을 띠게 될 것이다. 공격 표면이 점점 커지고 변화하고 있다.
  • 볼륨: 보안 우려는 간단하다. 보호받고 있는 원자산이 증가하고 있다.


제언과 기회

미래의 도전과 잠재적인 보상은 우리 마음대로 데이터를 숙달하도록 요구한다. 기업이 애널리틱스를 활용해 가치를 창출하는 것과 마찬가지로, 정보 보안도 동일한 작업을 수행할 수 있으며, 반드시 그렇게 해야 한다. 여기 보안이 데이터와의 관계를 바꿀 수 있는 3가지 방법이 있다.

- 데이터 과학
데이터 과학(Data science)은 정보 보안 툴박스에 추가할 새로운 세대의 애널리틱스 기법과 기술을 가져온다. 많은 것이 매우 큰 데이터 세트와 함께 사용하도록 고안되었다. 몇 가지 예는 다음과 같다.
  • 데이터 세트를 단순화하고 유형을 찾아내는 데이터 마이닝
  • (아주) 큰 데이터 세트에서 새로운 통찰력을 끌어내는 머신러닝 
  • 보안 제어를 우선시하고 풍부하게 하는 예측적 애널리틱스, 사용자 친화적이고 접근 가능한 프로그래밍 언어 및 통계 전문 코드에서부터 인공지능의 실현되지 않은 잠재력에 이르기까지 경험과 검증된 자원의 부족을 상쇄하기 위한 폭넓은 기술

- 위협 지능
위협 지능(Threat intelligence)은 잘 이해된 분야지만 보안 통제 데이터와 상업적 피드에 의존하는 경향이 있다. 데이터가 증가함에 따라 각 기업은 데이터를 분석할 수 있고 분석해야 하는 장소를 마련해야 한다. 보안은 위협 지능의 범위를 자체 통제 범위 이상으로 확대하고 사용자 행동, 네트워크 데이터 흐름, 보호되는 비즈니스 애플리케이션 등을 비롯한 모든 데이터를 마음대로 검토해야 한다. 결국 위협은 어디에나 있을 수 있다. 

- 데이터 보호
데이터 보호(Data protection) 프로그램은 크기와 복잡성이 아니라 강도와 단순성으로 판단되어야 한다. 이상적인 데이터 보호 전략은 모든 데이터에 강력한 기본 제어 장치(인증, 암호화 등)를 한 세트씩 적용해 분류와 라벨의 필요성을 없앨 것이다. 데이터 거버넌스(Data governance)는 라이프사이클 정책과 기밀 해제(공개) 프로세스만 필요로 할 것이다. 직원 교육, 프로젝트 요구사항 및 IT 운영은 모두 동일하고 간단하다. 데이터가 여기에 있으면 보호되며 예외는 없다.

만약 이것이 사소하고 순진해 보인다면, 요점을 짚어내려는 의도였다. 데이터 보호는 설명하기 쉽고, 실행하기 쉬워야 하며, 가능한 한 강력해야 한다. editor@itworld.co.kr 


X