Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

빅데이터

“소수의 기업만이 데이터를 활용한다” 성공적인 데이터 분석 플랫폼 구축을 위한 기업의 조건 - IDG Summary

데이터는 이제 기업에 있어 필수불가결한 자원으로 자리 잡았다. 데이터를 어떻게 수집, 통합, 처리, 분석, 활용하는지에 기업의 경쟁력은 물론, 미래가 달려있다고 해도 과언이 아니다. 롯데백화점과 서울시 사례를 심층 분석해 오늘날 기업에 필요한 데이터 분석 플랫폼의 요건을 알아보자. 데이터 분석 플랫폼을 도입할 때 기업이 고려해야 할 사항도 살펴본다. <11p> 주요 내용 - 빅데이터 시대, 데이터의 중요도가 달라졌다 - 구축사례1. 롯데백화점, 온/오프라인 쇼핑 경계 허물다 - 구축사례2. 서울시, 빅데이터 통합 저장소 만든다 - 성공적인 데이터 분석 플랫폼 도입을 위한 기업 전략 - '왕도는 없다', 자사에 맞는 단계별 프로젝트가 해답

데이터분석 빅데이터 2021.09.13

수십억 개의 파일을 저장하는 차세대 빅데이터 저장소 아파치 오존의 이해와 설치 시 고려 사항 - IDG Summary

차세대 HDFS인 아파치 오존(Apache Ozone)은 빅데이터 생태계에서 사용하는 새로운 스토리지 컴포넌트다. 아파치 오존은 기존의 HDFS가 갖고 있던 확장성의 한계, 아키텍처에서의 문제를 극복하기 위해 10년이상 HDFS를 사용하면서 얻었던 경험을 기반으로 네임 스페이스와 블록 스페이스를 분리했으며, 아마존의 SSS와 유사한 객체지향성 저장소 기능을 제공한다. 빅데이터 저장소가 갖춰야 할 요건과 기존 HDFS가 갖고 있던 제약, 그리고 아파치 오존을 알아보고 사용자 입장에서 설치 시 고려 사항에 대해 설명한다.  주요 내용 - 차세대 HDFS 기술 아파치 오존, 수십억 개의 파일 핸들링  - HDFS, 3억 5,000만 개 이상의 파일 관리는 불가능 - 아파치 오존에 담긴 확장성의 비밀, 네임스페이스와 블록스페이스 분리 - 아파치 오존 설치 시 OM은 별도로 배치  - 아파치 오존을 선택해야 하는 5가지 이유 

아파치 오존 빅데이터 2021.01.11

빅데이터 시각화 분석 입문 1편. SAS Visual Analytics 소개 및 화면 구성

빅데이터 시각화 분석을 처음부터 하나하나 배워 봅니다. 단일 인메모리 환경에서 빅데이터 시각화, 셀프 서비스 리포팅 및 고급 분석 기능을 활용할 수 있는 서버 기반 시각화 분석 솔루션 SAS Visual Analytics을 직접 실습해 볼 수 있습니다. 분석 수준에 상관없이 데이터를 쉽게 탐색, 시각화하고, 빠르게 인사이트를 발견하고자 하는 의사결정권자, 비즈니스 분석가, 보고서 작성자, 데이터 사이언티스트에게 도움이 됩니다.  참고 자료 - 실습 데이터 다운로드하기 - SAS® Visual Analytics 무료 체험

빅데이터 시각화 2020.11.24

데이터 시각화, 기본에서 실전까지

한 장의 사진이 천 마디 말의 가치를 지닙니다. 데이터를 이해하고 인사이트를 발견하려고 할 때 특히 그렇습니다. 데이터 시각화는 수백, 수천 개 변수 간의 관계성을 알아내 상대적 중요성을 판단하거나, 혹은 이 변수가 중요한 것인지 판단할 때 특히 유용합니다. 데이터에서 의미 있는 시각화 분석 자료를 생성하려면 몇 가지 고려할 기본 요소가 있습니다. 데이터 크기, 데이터 유형, 데이터 칼럼 구성입니다. 이 백서에서는 데이터 시각화 과정에서 일어나는 몇 가지 기본적인 문제를 살펴보고 해결 방안을 제시합니다. 또한 빅데이터만이 갖는 고유한 문제를 짚어보고 해결책을 살펴봅니다. <19p> 주요 내용 - 데이터 카디널리티(Data Cardinality)란? - 데이터 시각화 시작하기  - 빅데이터 시각화하기 - 자동 차트 작성으로 쉬운 데이터 시각화 - 자동 예측을 통한 미래 전망  - 의사결정 트리로 영향력 파악  - 위치 분석으로 지오 맵 확장 - 모바일 기기 활용으로 협업 향상

빅데이터 시각화 2020.11.24

기업을 위한 7가지 데이터 시각화 실전 업무 활용 팁

많은 기업이 데이터 시각화에 관심이 높은 이유는 간단합니다. 많은 양의 데이터에서 인사이트를 쉽게 식별해 활용할 수 있기 때문입니다. 하지만 빠듯한 예산과 한정된 IT 자원, 그리고 전문 데이터 분석가를 보유하기 힘들어 어디서부터 시작해야 할지 고민이 많습니다.  여기서는 데이터 시각화의 도입과 성공을 위한 몇 가지 실전 업무 활용 팁을 제공합니다. 또한 데이터 시각화와 분석을 통해 성과를 거둘 수 있는 주요 업무와 특정 기능의 활용 예시도 소개합니다. <6p> 주요 내용 - 데이터 시각화 솔루션 도입 시 고려사항 7가지 - 비즈니스 업무별 데이터 시각화 활용의 예

빅데이터 시각화 2020.11.24

“데이터 분석 보편화 시대의 개막” 2020 애널리틱스 전략 – IDG Deep Dive

비즈니스 계획에서 인프라 최적화에 이르기까지 데이터 분석은 없어서는 안될 필수 요소다. 이제 관건은 데이터와 인사이트를 일부 전문가의 전유물이 아니라, 임원부터 일선 직원에 이르기까지 모두가 활용 가능한 형태로 진화시키는 것이다. 머신러닝이나 셀프서비스 분석 도구 등 다양한 기술은 이런 데이터 분석의 보편화를 가능하게 하고 있으며, 혁신적인 일부 기업은 애널리틱스를 통해 실시간 운영 효율화를 성공적으로 수행하고 있다. 최신 애널리틱스 트렌드부터 분석 플랫폼 선택 가이드, 시각화 팁, 성공사례까지 애널리틱스 전략 업그레이드를 도와줄 가이드를 제시한다. 주요 내용 - ‘과감하게 투자할 만한’ 애널리틱스 영역 5가지 - 데이터 분석 플랫폼을 선택하는 방법 - 숫자 이면까지 보여주는 데이터 시각화 팁 6가지 - 헬스케어 분야의 애널리틱스 성공 사례 4선  

데이터분석 애널리틱스 빅데이터 2020.08.13

우리 회사 데이터 레이크는 얼마나 개방적인가?

데이터 레이크는 변환된, 신뢰할 수 있는 데이터 집합과 함께 원시 형식의 데이터를 저장하고, 데이터 탐색과 인터랙티브 분석, 머신러닝과 같은 다양한 분석 작업을 위해 이 데이터에 대한 프로그램식 액세스와 SQL 기반 액세스를 모두 제공하는 시스템 또는 리포지토리다. 데이터 레이크에 저장되는 데이터에는 관계형 데이터베이스의 구조적 데이터(열과 행), 반구조적 데이터(CSV, 로그, XML, JSON), 비구조적 데이터(이메일, 문서, PDF), 바이너리 데이터(이미지, 오디오, 비디오)가 포함된다.   데이터 레이크의 과제는 사유 형식이나 시스템에 종속되지 않는 것이다. 종속은 다른 용도를 위해 데이터를 시스템 안팎으로 이동하거나 다른 툴을 사용해 데이터를 처리하는 역량을 제약하고, 데이터 레이크를 단일 클라우드 환경에 묶을 수도 있다. 따라서 기업은 데이터를 개방 형식으로 저장하고 개방형 표준 기반 인터페이스를 통해 액세스할 수 있는 개방형 데이터 레이크를 구축하도록 노력해야 한다. 데이터 저장, 데이터 관리, 데이터 처리, 운영, 데이터 액세스, 거버넌스, 보안을 포함한 시스템의 모든 측면에서 개방형 원칙을 고수해야 한다.   개방 형식은 개방형 표준을 기반으로 해서 특정 벤더의 사유 확장 없이 공개 커뮤니티 중심의 프로세스를 통해 개발되고 공유되는 형식이다. 예를 들어 개방형 데이터 형식은 ORC나 파케이(Parquet)과 같이 사양이 커뮤니티에 게시되어 어느 조직에서나 해당 형식으로 된 데이터를 읽는 툴과 애플리케이션을 만들 수 있는, 플랫폼 독립적이고 기계가 읽을 수 있는 데이터 형식이다.   일반적인 데이터 레이크에는 다음과 같은 기능이 있다. -    데이터 흡수와 저장 -    지속적 데이터 엔지니어링을 위한 데이터 처리 및 지원 -    데이터 액세스와 소비 -    디스커버리 가능성(discoverabili...

데이터베이스 빅데이터 머신러닝 2020.04.14

아파치 쿠두를 통한 실시간 워크로드 최적화

실시간 분석 수행을 위한 최선의 선택으로 아파치 쿠두(Apache Kudu)에 많은 이가 주목하고 있다. 컬럼형(Columnar) 스토리지 엔진인 쿠두가 빠른 분석에 유리한 이유는 무엇일까?    빠른 분석과 빠른 데이터 처리를 위한 최선의 선택  아파치 쿠두 PMC 멤버이자 클라우데라 소프트웨어 엔지니어인 앤드류 웡은 쿠두가 왜 필요한지부터 묻는다. 스키마 변화가 많은 데이터 세트를 다루거나, 분석을 위한 스캔과 열 검색 작업을 동시에 자주 하거나, 최대한 빨리 최신 데이터를 대상으로 쿼리를 수행하고 싶을 경우라면, 스키마 업데이트가 쉽고 데이터가 들어오자마자 활용할 수 있고, 끊임 없이 업데이트와 삭제가 가능한 쿠두가 최선의 솔루션이라는 설명이다.   쿠두의 특징  쿠두는 데이터가 저장되는 공간인 테이블(Table)과 이들로 구성된 태블릿(Tablet), 이들을 저장하는 태블릿 서버(Tablet Server), 쿠두 구성 요소의 메타 데이터를 담고 있는 마스터(Master)로 구성된다. 각 테이블 스키마에는 프라이머리 키(Primary Key)가, 파티션 스키마에는 파티션 키가(Partition Key)가 정의되어 있다. 태블릿 간 복제는 Raft 합의 알고리즘을 이용해 리더(Leader)와 팔로워(Follower) 관계로 구성된다. 마스터에는 태블릿과 파티션에 대한 메타 데이터가 담기고, 태블릿 서버에는 복제된 태블릿 데이터가 저장된다.   쿠두에서 쓰기 작업은 다음 그림처럼 이루어진다. Raft 합의 알고리즘에 따라 리더에서 팔로워로 복제가 이루어지고 인메모리로 처리된다.   태블릿에 쓰기가 이루어질 때 쿠두는 블룸 필터와 프라이머리 키 인덱스를 이용해 불필요한 탐색을 최소화한다.   스캔을 통해 열을 읽을 때도 프라이머리 키를 참조해 관계없는 태블릿은 건너뛴다.    파티셔닝과 관련해 앤드류 웡은 몇 가지 팁을 알려 주었습다. 일반적인 쿼리의 경우 ...

아파치 빅데이터 쿠두 2020.02.03

'환상의 조합' 임팔라·쿠두로 Operational DBMS 구축하기

빅 데이터 환경에도 유행이 있다. 최근 유행은 아파치 임팔라(Apache Impala)와 아파치 쿠두(Apache Kudu) 조합을 쓰는 것이다. 일단 한번 데이터를 투입한 후에는 업데이트와 삭제가 되지 않고, 대량의 스몰 파일(small file)을 처리해야 하는 HDFS 환경의 부족함을 메우는 수단으로 임팔라와 쿠두 조합이 유행하기 시작했다.   임팔라, 안 쓸 이유가 없다 클라우데라 솔루션 아키텍트 신정훈 이사에 따르면, 최근의 대세는 임팔라와 쿠두다. 장기 저장용 콜드 데이터는 HDFS에 넣고, 자주 사용하는 핫 데이터는 임팔라와 쿠두 환경을 이용하는 방식이 많이 채택되고 있다. 임팔라는 대규모 병렬 처리(MPP)를 위한 SQL 쿼리 엔진인데, 무엇보다도 성능이 임팔라의 가장 큰 장점이다. 임팔라는 설계 단계에서부터 성능을 고려한 솔루션이기 때문이다.   클라우데라 세션에서 신정훈 이사는 직접 써보면 기존 SQL과 비교해 임팔라의 성능 차이가 상당하다고 말했다. 덧붙여 임팔라의 성능은 새로운 버전이 나올 때마다 더 높아지는 경향을 보인다고 설명했다.   임팔라는 데몬(Daemon), 카탈로그 서비스(Catalog Service), 스테이트스토어(Statestore)로 구성되어 있다. 데몬은 데이터 노드에서 실행되는 임팔라 프로세스로 사용자의 요청을 수용하고, Coordinator와 Executor 역할을 한다. 카탈로그 서비스는 메타 데이터 동기화를 위한 프록시 역할을 한다. 데몬에서 직접 메타 데이터를 변경하면 자동으로 동기화된다. 하이브(Hive)나 HDFS에서 직접 변경하면 Refresh문이나 Invalidate metadata문을 이용해 동기화 작업을 해야 한다. 다음으로 스테이트스토어는 데몬의 상태를 확인하고 메타 데이터 동기화하는 기능을 한다.     확장성과 안정성도 뛰어나 신정훈 이사는 많은 이가 궁금해하는 확장성과 안정성에 명쾌한 답을 제시했다. 부하가 가중되면 임팔라 데몬간 리소스...

빅데이터 임팔라 쿠두 2020.02.03

통신 빅데이터 활용 폭, 데이터 분석이 좌우한다

흔히 데이터는 새로운 가치(Value)와 부(wealth) 창출의 기반이라고 한다. 그렇다면 다른 업종에 비해 더 많은 데이터를 처리하는 통신사의 경우, 어떤 방식으로 새로운 가치와 부를 만들어 내고 있을까?    LG유플러스의 빅데이터 분석 절차  데이터를 잘 다루는 회사가 안팎으로 인정받는 시대다, LG유플러스는 기업 가치를 높이기 위해 어떤 빅데이터 분석 프로세스를 따르고 있을까? LG유플러스가 상시로 수행하는 빅데이터 분석 절차를 살펴보자.   클라우데라 세션 행사에서 이대식 전문위원은 문제를 어떻게 바라보느냐에 따라 분석 방법이 달라진다며 영화 ‘머니볼’의 예를 들었다. LG유플러스가 문제를 정의한 핵심 영역은 매출 증진, 고객 경험 개선, 비용 효율화, 신규 사업 창출, 총 4가지다. 이 4가지를 큰 방향으로 생각하고 신규 고객 유치, 해지 방어, 고객 만족, 서비스 차별화 등 세부 분석 주제를 정의해 통찰력을 끌어내는 작업에 매진한다.    문제가 정리된 후에는 데이터 저장 위치를 결정한다. 개인정보보호법 등 데이터 관련 규제를 고려해 저장 위치와 사용 방식을 정하는 것이다.   데이터 탐색 과정은 과정인 동시에 결론이 될 수 있다. 이대식 전문위원은 탐색을 통해 분석 목표를 달성하는 경우도 많다는 말과 함께 ‘어떻게 탐색하느냐’가 분석의 성과를 좌우한다고 말했다. 또 탐색의 품질 제고에는 협업 비즈니스 전문가와 분석가 간의 소통이 매우 중요하며, 서로 알고 있는 것을 공유하는 과정에서 새로운 아이디어와 가설을 얻을 수 있다고 덧붙였다. 모형 선택 단계에서 LG유플러스는 분석 목적에 따라 예측 모형, 설명 모형, 추천 모형 등으로 설계 방향을 정한다. 그리고 프로덕션 환경에 적용하면서 최적화를 수행한다. LG유플러스에 있어 데이터 분석 과정은 일회성 프로세스가 아니라 반복 속에서 최적화를 끌어내는 여정이다. 이 여정을 이어가면서 서비스를 개선하여 신규 고객을 늘리고, 고객 ...

LG유플러스 빅데이터 5G 2020.02.03

한국IDG, 2월 13일 제 10회 Business Impact & Data+ 데이터 컨퍼런스 개최

한국 IDG가 오는 2월 13일, 르 메르디앙 서울 호텔 다빈치볼룸(LL)에서 ‘제 10회 비즈니스 임팩트 & 데이터 플러스 (10th Business Impact & Data+)’ 컨퍼런스를 개최한다.  이번 행사에는 구글, 세포라, 아마존, 카카오 엔터프라이즈 등 혁신적인 데이터 활용 사례로 유명한 기업들의 전문가들이 연사진으로 참여해 큰 기대를 모으고 있다. 구글의 람쿠마 라비찬드란 데이터 사이언스 테크 리드 매니저는 “Data: 2020 & Beyond”라는 주제로 데이터, 애널리틱스, AI 영역에서의 최근 트렌드와 변화 양상 그리고 전략적 계획과 운영에 대한 인사이트를 공유한다. 최근 한국에 상륙한 세계 1위 뷰티 편집숍인 세포라의 옴니채널 마케팅 전문가의 강연도 예정되어 있다. 세포라의 커스터머 인사이트(Customer Insights) 부문을 리드하고 있는 티피 퓨라는 세포라의 데이터 및 고객 중심 전략과 고객 경험 향상 사례를 전달한다.   또한 아마존의 시니어 머신러닝 사이언티스트인 대니얼 다쉬티가 참여해 ‘프로덕션(Production)에서의 머신러닝 모델 도입 방안’을 소개한다. 성공적인 머신러닝 도입 파이프라인을 위해 고려해야 할 사항과 해결 과제도 함께 알아본다. 카카오의 사내 독립기업인 AI Lab에서 최근 분사한 카카오 엔터프라이즈에서도 이번 행사에 참여한다. 카카오 엔터프라이즈 AI Lab의 이동훈 차장은 ‘우리말 자연어처리 기술과 데이터 소개 및 활용방안’을 주제로 자연어처리 기술을 구현하기 위해 필요한 데이터는 어떤 것들이 있으며, 어떻게 활용되는 지 설명한다. 또한, 이러한 연구성과를 서비스로 연결시키기 위해 어떤 고민을 하고 있는 지도 함께 전달할 예정이다. 아울러 효성인포메이션시스템, 팁코 소프트웨어, 알터릭스, 데이타솔루션, 엘라스틱서치, 퍼즐데이터 등도 참여해 데이터를 통한 비즈니스 혁신 전략과 다양한 산업별 적용 사례를 전달한다. 이번 행사는 선착순 400명에 한해 ...

한국IDg 빅데이터 데이터컨퍼런스 2020.01.14

데이터 기반 비즈니스에 '데이터 카탈로그'가 필요한 이유

관계형 데이터베이스, 데이터 레이크, NoSQL 데이터 저장소는 데이터를 삽입, 업데이트, 쿼리, 검색, 처리하는 강력한 툴이다. 그러나 이러한 데이터 관리 플랫폼에서 한 가지 역설적인 부분이 있다. 일반적으로 플랫폼 내의 데이터를 공유하기 위한 적절한 툴이나 사용자 인터페이스를 제공하지 않는다는 점이다. 이 때문에 이런 플랫폼 자체는 사실 데이터 금고에 더 가깝다. 안에 유용한 데이터가 있다는 것을 알지만 외부에서 손쉽게 그 데이터에 접근할 방법이 없다. 기업의 고민도 여기서 시작된다. 다수의 데이터 금고, 예를 들면 여러 엔터프라이즈 데이터베이스와 비교적 작은 데이터 저장소, 데이터센터, 클라우드, 애플리케이션, BI 툴, API, 스프레드시트, 오픈 데이터 소스를 다뤄야 한다는 점이다. 물론 관계형 데이터베이스의 메타데이터에서 테이블, 저장 프로시저, 인덱스를 비롯한 기타 데이터베이스 객체를 쿼리해 디렉터리를 얻을 수 있다. 그러나 기술적인 전문 지식이 필요한 데다 많은 시간이 필요하고, 최종 결과도 단일 데이터 소스의 기본적인 목록뿐이다. 데이터 모델을 리버스 엔지니어링하거나 메타데이터 탐색 기능이 있는 툴을 사용할 수 있지만 이러한 툴은 전문가용인 경우가 많고 주로 데이터베이스 감사, 문서화, 분석에 사용된다. 결국 데이터베이스의 내용을 쿼리하기 위한 이와 같은 접근 방법과 메타데이터를 추출하기 위한 툴은 다음과 같은 여러 이유로 지금의 데이터 기반 비즈니스의 요구사항에는 충분하지 않다. • 기술에 너무 많은 전문 지식이 필요해 일반적인 최종 사용자에게는 접근성이 떨어진다. • 여러 개의 대규모 데이터 데이터베이스와 다양한 데이터베이스 기술이 있고 하이브리드 클라우드를 운영하는 엔터프라이즈 관점에서 방법이 지나치게 수동적이다. • 협업을 원하거나 주 데이터 집합과 파생된 데이터 집합으로 머신러닝 실험을 하고자 하는 데이터 과학자 또는 시민 데이터 과학자에게 별로 유용하지 않다. • 데이터베이스 메타데이터 감사 전략으로 인해 데이터 관리팀이 ...

빅데이터 데이터카탈로그 2020.01.13

인공지능 관련 TED 강연 15선

인공지능은 윤리, 감성 지능, 인간-컴퓨터 협력에 관한 논쟁을 불러일으키는 주제다. 어떤 사람들은 AI가 기술을 부적절하게 사용할 수 있다고 경고하기도 했고, 기업이 AI를 활용하는 방법과 잠재력을 강조하는 <테크월드(Techworld)>에서도 AI에 관한 다양한 주제를 다루고 있다. 사이버보안부터 사업 기획까지 다양한 주제에 관해 정보를 전달하는 테드 강연(TED Talks) 중에는 AI를 주제로 발표한 여러 연사의 강연이 있다. 꾸준히 인기를 끄는 인공지능에 관한 테드 강연을 소개한다.  AI가 인류를 어떻게 구할 수 있나 컴퓨터 과학자이자 기술 투자가인 카이-푸는 15분 테드 강연에서 인공 공명 장치와 함께 인간이 어떻게 자연스럽게 공감할 수 있는지 설명한다. 카이-푸는 미국과 중국에서 AI 투자와 개발이 크게 도약하면서 AI 기술의 길을 닦는 방법에 대해 자세히 언급한다.  그는 "미국이 발견의 시대를 주도하고 중국이 구현의 시대를 주도함에 따라, 우리는 두 초강대국의 이중 엔진이 기술에서 가장 빠른 혁명을 추진하기 위해 함께 노력하고 있는 놀라운 시대에 살고 있다"라고 말한다.  이어서 "(AI)는 우리를 일상적인 업무에서 벗어나게 하려고 여기 있으며, 우리를 더 인간답게 만드는 것이 무엇인지 상기시켜 주기 위해 여기 있다"라고 전한다.  강연 보기 : AI가 인류를 어떻게 구할 수 있나 AI에 대한 통제력을 잃지 않으면서 AI를 구축할 수 있을까? 5차례나 뉴욕타임스 베스트셀러 작가로 선정된 샘 해리스는 신경과학과 도덕성부터 인간의 합리성까지 다양하고 흥미로운 주제와 세상이 달라짐에 따라 우리가 어떻게 변화해야 하지에 관한 글을 쓴다. 이 강연에서 해리스는 초 지능형 기계와 관련된 두려움과 이러한 두려움이 정당화되는 이유를 설명한다. 해리스는 통제되지 않은 AI가 엄청난 결과를 초래하는 '공포' 상황이 발생하지 않으려면 높은 수준의 AI를 만들어 내기 전에 인공지능과 관련된 문제가 해결해...

인공지능 기계 지능 강연 2020.01.02

글로벌 칼럼 | 위험하고 치명적인 전 지구적 중독, '데이터'

아이클라우드 계정의 장애로 인해 평생의 소중한 사진을 잃어버린 개인이나, 고객 데이터를 보호하지 못해 재무 및 평판에서 치명상을 입는 기업을 상상하기는 어렵지 않다. 그런데 호주 같은 국가 단위로 필수적인 정부 데이터의 소실 때문에 국가 기능이 정지하고 경제적 혼란에 휩싸이는 상황은 어떨까? 데이터가 우리 삶에 강한 영향력을 갖는 현재 상황에서 이는 매우 실제적인 위험이다.   호주 전국에 걸쳐 판매업체, 자문업체, 협력업체, 고객이 계속 증가하기만 하는 데이터 더미로부터 가치를 분리해 추출하려고 시도함에 따라 데이터 문제는 점점 더 뜨거운 논란거리가 되고 있다. 이러한 시도는 통찰을 주고, 비즈니스 프로세스, 가치 및 이해를 제고한다는 사실이 이미 증명됐지만 한 가지 결정적으로 간과된 사실이 있다. 바로 데이터에 대한 사람들의 의존과 중독이다. 개인, 정부, 매장은 일상 업무를 위해 최소한 분 단위로 데이터를 저장하고 액세스한다. 사람들은 아직도 데이터가 선택 중 하나라고 주장하지만, 일반적으로 '선택'이란 단어는 '의존'과 연관되는 것이 아니다. 진실은 이제 현실에서 개인, 기업 할 것 없이 갈수록 데이터에 의존한다는 사실이다. 우리가 인터넷 그리고 연결된 세계로 나감에 따라 이러한 의존은 오히려 더 극적으로 확대된다. 데이터는 반드시 저장돼야 하고, 이는 여러 환경의 조합을 통해 이루어진다. 즉 기업 내에서나, 프라이빗 클라우드나 퍼블릭 클라우드에서, 또는 이 모든 곳에서 저장된다. 대부분의 사람과 기업 관계자는 이러한 사실에 별로 관심이 없고, 흔히 기술에 능한 개인 및 부서가 알아서 할 일이라고 생각한다. 그러나 아마도 이제는 인류 전체가 관심을 가져야 할 시간이 된 것 같다. 우리의 '의존'이 한계에 도달했다는 위험신호가 나타나고 있기 때문이다. 현존하는 전 세계의 데이터센터 중 단 5%만 현대화됐다. '데이터 의존'이라는 현실적인 희망을 20년 넘은 낡은 아키텍처가 지탱하고 있는 것이다. 이는 90년대의 자동차 기술 및 제조 능력...

CIO 데이터 중독 2019.12.18

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.