Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
TOPIC

데이터ㆍ분석

블로그 | 기업이 데이터 활용에 ‘젬병’인 이유

많은 기업이 클라우드 컴퓨팅으로 자사의 데이터를 제대로 활용해 역량을 배가하고 혁신 기업이자 업계 선두주자로 변신하고자 한다. 또는 그 정도는 아니라도 최소한 데이터를 최적화할 수 있기를 바란다. 스노우플레이크는 최근 대부분 기업이 데이터와 관련해 여전히 가지고 있는 핵심 문제를 파악한 보고서를 발표했다. 보고서에 따르면, 38%의 기업만이 데이터에서 가치를 추출해 의사결정에 활용하고 있다. 게다가 글로벌 기업 중 단 6%만이 견실한 데이터 전략이 제공하는 이점을 모든 조직이 활용할 수 있는 방법으로 데이터를 사용하고 액세스하고 공유하는 것으로 나타났다.   클라우드 컴퓨팅의 시대에 어떻게 이런 일이 일어나는 것일까? 첫째, 많은 기업이 그저 데이터를 클라우드로 옮기고 좋은 일이 일어나길 바란다. 잘 사용하지 않는 데이터를 데이터센터에서 클라우드로 옮기면, 클라우드에 잘 사용하지 않는 데이터가 있을 뿐이다. 바뀌는 것은 아무것도 없다.  둘째, 데이터 통합에 대한 고려가 전혀 없고, 데이터에 대한 액세스는 여전히 해결해야 할 핵심 문제로 남아있다. 데이터 통합과 이를 위한 툴은 10년이나 된 개념이다. 놀랍게도 많은 기업이 아직 클라우드로 이전한 데이터를 활용할 방법을 파악하지 못한 상태이다. 마지막으로 기업은 자체 비즈니스 의사결정을 위해 자체 데이터를 이용하지 않는다. 영업 예측을 위한 기본적인 분석뿐만 아니라 재고 소진 프로세스 같은 공급망 자동화를 지원할 수 있는 실시간 의사결정 자동화도 마찬가지다.  이런 문제를 바로잡는 마법의 기술 같은 것은 없다. 데이터 활용을 개선하는 유일한 방법은 기업의 데이터를 도메인으로 나누고 각각의 도메인을 한 번에 하나씩 어떻게 처리할 것인지 계획하는 다년 계획을 세우는 것뿐이다. 이런 전략에는 두 가지 주된 목표가 있어야 한다. 먼저, 구체화해야 하는 데이터를 어떻게 찾을 것인지 방법을 찾고, 이를 찾고 추출할 인터페이스를 제공해야 한다. 이 과정은 안전하고 확장 가능한 방법...

인사이트 분석 애널리틱스 2022.07.25

오라클-마이크로소프트, 마이크로소프트 애저용 오라클 데이터베이스 서비스 정식 출시

오라클과 마이크로소프트가 마이크로소프트 애저용 오라클 데이터베이스 서비스(Oracle Database Service for Microsoft Azure)를 정식 출시했다.    이번 신규 서비스를 통해 마이크로소프트 애저 사용자는 오라클 클라우드 인프라스트럭처(OCI)에서 구동되는 엔터프라이즈급 오라클 데이터베이스 서비스를 손쉽게 프로비저닝, 액세스, 모니터링할 수 있게 됐다. 또한, 애저에서 새로운 애플리케이션을 마이그레이션 또는 구축한 뒤, OCI에서 구동되는 자율운영 데이터베이스(Autonomous Database)와 같은 고성능, 고가용성 오라클 데이터베이스 서비스들과 연결해 사용할 수 있다. 2019년 오라클과 마이크로소프트는 파트너십을 체결하고 마이크로소프트 애저용 오라클 인터커넥트(Oracle Interconnect for Microsoft Azure)를 출시, 현재까지 수백 여 개의 기업들이 한국을 포함한 11개의 글로벌 리전을 통해 안전한 프라이빗 상호연결 서비스를 사용해오고 있다. 마이크로소프트와 오라클은 파트너십을 더욱 확대해 보다 간편한 멀티 클라우드 경험을 제공하는 마이크로소프트 애저용 오라클 데이터베이스 서비스를 출시했다. AT&T, 메리어트 인터네셔널, 베리타스, SGS와 같은 기업들을 비롯한 양사의 많은 공통 고객들은 성능 및 확장성을 최적화하고 비즈니스 현대화를 가속화하기 위해 클라우드 공급업체들이 제공하는 서비스를 선택적으로 활용할 수 있기를 바라는 것으로 업체 측은 분석했다.  마이크로소프트 애저용 오라클 데이터베이스 서비스는 애저용 오라클 인터커넥트의 핵심 기능을 기반으로 구축되며, 마이크로소프트 애저의 워크로드와 OCI에서 구동되는 오라클 데이터베이스 서비스를 더욱 손쉽게 통합할 수 있도록 지원한다. 마이크로소프트 애저용 오라클 데이터베이스 서비스 또는 애저와 OCI간 기반 네트워크 인터커넥션, 데이터 이그레스(egress) 및 인그레스(ingress)에는 비용이 발생하지 않으며,...

오라클 마이크로소프트 2022.07.21

A/B 테스트 및 데이터 분석 플랫폼 ‘핵클’, 누적 트래픽 150억 건 돌파

핵클은 자체 개발한 A/B 테스트 및 데이터 분석 플랫폼의 2022년 2분기 데이터 처리량이 작년 동기 대비 920% 성장해, 누적 데이터 처리량 150억 건을 달성했다고 발표했다.    기업이 온라인 제품을 출시하고, 데이터 기반으로 기능을 개선하는 전 과정에 필요한 솔루션들을 SaaS 형태로 제공하는 핵클은 2020년 7월 설립 이래 매분기 2배 이상 성장을 거듭하고 있다고 밝혔다.  핵클의 고객사는 A/B 테스트, 기능 플래그 기능을 통해 제품 출시 과정에서 겪게 되는 시행착오에 대한 위험을 사전 진단/방지할 수 있고, 이벤트 관리 기능과 데이터 분석 기능을 활용해 고객의 구매 여정을 분석, 고객 니즈에 맞춰 보다 정교하게 기능을 개선할 수 있다. 주요 고객사로는 우아한 형제들, 카카오스타일, 네이버제트, 당근마켓, 여기어때, 클래스101과 같은 유니콘 테크 기업들이 있으며, 최근에는 데이터 기반 의사결정의 중요성이 부각됨에 따라 대기업 및 게임사 등 다양한 분야로도 관심이 확대되고 있는 추세다. 핵클을 이용하고 있는 게임 스타트업 ‘게임듀오’의 관계자는 “핵클의 A/B 테스트 기능을 통해 즉각적인 사용자 반응을 확인하고, 제품에 인사이트를 반영하여 매달 가파른 매출 성장을 경험하고 있다”고 말했다. 또 다른 고객사 웅진씽크빅은 글로벌 학습 서비스에 핵클의 솔루션을 활용하고 있다.  핵클은 쿠팡에서 쿠팡페이, 쿠팡이츠 같은 서비스를 출시 및 개선했던 프로덕트 오너(PO), 소프트웨어 엔지니어, 데이터 사이언티스트 출신이 모여 만든 업체로, A/B 테스트, 기능 플래그, 이벤트 관리, 데이터 분석 툴까지 총 4가지 솔루션을 보유하고 있다. editor@itworld.co.kr

핵클 2022.07.21

메시 vs. 패브릭 : 대표 데이터 아키텍처 이해하기

데이터 메시와 데이터 패브릭 아키텍처 간의 주요 차이점과 유사점에 대해 알아보자. 2가지 접근 방식을 적절히 결합하면, 회사의 용도에 딱 맞는 다목적 데이터 제품 플랫폼을 구축할 수 있다.    기업이 직관적인 데이터 관리 솔루션을 도입하는 과정에서, 데이터 형태의 다양성으로 인해 비즈니스 리더들은 지속적인 데이터 관리 전략 구축 및 탐색의 중요성을 깨닫기 시작했다. 가트너는 데이터 패브릭을 2021년 데이터 애널리틱스 주요 트렌드로 꼽았지만 업계 전문가들은 데이터로 실행 가능한 비즈니스 인사이트를 제공할 수 있다는 점에서 데이터 메시 아키텍처의 잠재력 또한 강조했다.  이 2가지 아키텍처의 공통된 목적은 서로 다른, 혹은 이질적인 출처에 산재해 있는 데이터를 처리하고 공유하도록 돕는다는 점이다. 모든 것이 데이터로 연결된 세계에서 2가지 아키텍처는 혼용될 수 있다. 회사에 적합한 데이터 전략을 구축하려면 2가지 아키텍처 간의 근본적인 차이를 이해하는 게 중요하다.  데이터 패브릭 기술 시장 조사업체 엑스퍼사이트(Expersight)가 설명한 정의에 따르면, 데이터 패브릭은 '데이터와 연결 프로세스의 통합 계층을 일컫는 설계 개념'이다. 이는 기존의 검색 가능하고 참조된 메타데이터를 지속해서 분석하여, 하이브리드 및 멀티 클라우드 플랫폼을 포함한 모든 환경에서 통합되고 재사용 가능한 데이터세트를 설계, 구축 및 활용하도록 해준다.  데이터 메시 아키텍처와의 주요 차이점 기술 중심(Technology centric) : 데이터 패브릭 아키텍처는 기존 인프라의 데이터를 통합하고, 의미 있는 인사이트를 사전에 얻을 수 있도록 데이터를 준비하는 운영 기술 계층을 갖추고 있다.   부산물로서의 데이터(Data is a by-product) : 데이터 패브릭 아키텍처는 데이터 통합 기술을 기반으로 여러 출처의 실시간 데이터를 특정 위치로 식별하고 통합한다. 따...

데이터아키텍처 데이터메시 데이터패브릭 2022.07.15

트레드링스, 33만 해운데이터 분석한 ‘공급망 인사이트 리포트’ 공개

수출입 물류 플랫폼 업체 트레드링스가 빅데이터로 분석한 ‘공급망 인사이트 리포트(Supply Chain Insights Report)’를 14일 발간했다.  ‘공급망 인사이트 리포트’는 2020년 1월부터 2022년 6월까지 30개월 동안 쌓인 33만 개의 데이터를 분석한 결과가 담겨 있다. 월 35만 명이 이용하는 트레드링스의 자체 누적 데이터에서 추출한 부산발 수출 데이터와 TPCI(Tradlinx Ports Congestion Index) 데이터가 기반이 됐다.   리포트 주요 내용은 부산을 비롯해 상하이, 홍콩, 로테르담, 포트클랑, 로스앤젤레스, 함부르크, 시드니 등 전 세계 20여 개 주요 항구의 ▲항만 혼잡도 ▲선박 지연 ▲운송/운항 시간 등이며 각 항목의 주요 수치, 그래프, 데이터 비교, 원인 분석 등의 내용도 담겨 있다. 특히 항만 혼잡도는 트레드링스의 대표 서비스인 물류 가시성 솔루션 ‘쉽고(ShipGo)’에도 반영될 예정이다. 리포트 내용을 살펴보면 지난해 대비 혼잡도가 가장 심해진 항만은 로테르담(네덜란드)으로 선박 평균 대기 시간이 3.2일에서 6.9일로 116%가 증가했다. 부산에서 시드니까지 평균 선박 도착 지연일은 5.8일에서 28.8일로 약 400%가 늘어난 것으로 나타났다. 트레드링스 박민규 대표는 “팬데믹 이후 SCM의 중요성이 나날이 커지고 있고, 공급망의 현 상황을 정확하게 진단하고 불확실성에 대비해야 한다”며, “이번 리포트가 많은 기업의 공급망 대처에 조금이나마 도움이 되길 바란다”고 말했다. 한편, 트레드링스는 주요 서비스 ‘보이는 화물 관리 솔루션 쉽고(ShipGo)’, ‘수출입 물류 마켓 플레이스 링고(LinGo)’에 이어 ‘수출입 협업 클라우드 솔루션 짐고(ZimGo)’를 하반기 출시 예정이다. editor@itworld.co.kr

트레드링스 2022.07.14

트레저데이터코리아, 한국 사업 전략 소개…“고객의 모든 경험, 통합 데이터 활용으로 디지털 혁신”

트레저데이터코리아는 2020년 10월 한국법인 설립 이후 첫 기자간담회를 갖고, 국내 및 전세계 CDP(Customer Data Platform) 시장 현황을 소개하고 트레저데이터의 사업 전략을 발표했다.    트레저데이터가 제공하는 CDP는 지금까지 개별적이고 단편적으로 제공 및 활용되고 있는 다양한 고객 정보를 통합해 사일로화(파편화)된 고객데이터로부터 동일 고객을 식별하고, 통합 고객 프로필을 구성해, 탁월한 고객경험을 제공함으로써 데이터로부터 실질적인 고객 가치를 창출할 수 있다는 점이 핵심이다. 트레저데이터 코리아의 고영혁 대표는 “트레저데이터 CDP는 단순히 마케팅 툴로서의 CDP가 아니라 마케팅, 서비스 및 판매 업무의 상호 연결된 고객 경험을 제공하는 엔터프라이즈급 고객 데이터 플랫폼”이라며, “기업들의 업무 전체 영역에서 실시간으로 고객들의 반응을 데이터로 캐치해 개인 정보를 최우선으로 보호하는 범위 안에서 분석하고 활용할 수 있는 솔루션”이라고 말했다. 고영혁 대표는 한국 사업 강화를 위해 올해 영업/마케팅/시스템구축/컨설팅 등 주요 영역별 팀 세팅을 완료했으며 비즈니스 파트너도 각 영역별로 확보했다고 소개했다. 특히, 그는 CDP솔루션이 데이터 분야이기 때문에 컨설팅, 구축, 운영, 분석 등 각 영역별 파트너들의 전문 역량 시너지가 중요하다고 보고, 영역별 파트너사들과 공동 프로젝트를 진행함으로써 서로 사업이 성장하는 ‘윈-윈’ 관계를 구축하는 것을 목표로 하고 있다고도 강조했다. 뿐만 아니라 이미 2020년에 한국 전용 데이터센터를 설립, 운영하고 있으며, 한국시장에 특화된 정보보안 요건에 맞는 커스텀 기능 개발 및 지원, 한국어 텍스트 빅데이터에 대한 자연어처리(NLP) 엔진 및 각종 로컬라이제이션 등 본사 차원의 투자 및 지원이 이뤄졌다.  고영혁 대표는 “CDP 프로젝트를 제대로 하다 보면 결국에는 데이터 기반 디지털 트랜스포메이션과 데이터 거버넌스를 동시에 수립할 수 있다”며, “트레저데이터는...

트레저데이터코리아 2022.07.13

쿠콘, 한국씨티은행에 대출 대환 제휴 프로그램 위한 데이터 중계 시스템 구축

비즈니스 데이터 플랫폼 기업 쿠콘이 한국씨티은행(이하 씨티은행)의 개인 신용 대출 대환 제휴 프로그램 관련 데이터 중계 시스템을 구축했다고 밝혔다.   씨티은행은 최근 소비자 금융 업무를 단계적으로 축소하면서 개인 신용 대출 이용 고객 보호와 편의 제고를 위해 토스뱅크, 국민은행과 대환 대출 업무 제휴 협약을 체결했다. 쿠콘은 씨티은행과 제휴 은행 간 대환 대출 업무를 위한 데이터 중계 시스템을 구축했으며, 제휴 은행은 이를 통해 빠르게 대환 대출 프로세스를 마련하고 대출 이용자의 편의성도 높일 수 있게 됐다. 씨티은행의 개인 신용 대출 상품을 이용하는 고객은 기존 대출의 잔액, 적용 금리 등을 제휴 은행에서 실시간으로 확인할 수 있어 별도 서류 제출 없이 낮은 금리의 대출 상품으로 편리하게 갈아탈 수 있다. 쿠콘과 씨티은행은 대출 업무 전용망이 이미 연계돼 있어 대환 대출 데이터 중계 시스템을 빠르게 구축할 수 있었다. 쿠콘은 30여 곳의 금융 기관과 대출 업무 전용망이 연결돼 있어 관련 서비스 구축이 쉽다. 쿠콘 김종현 대표는 “이번 씨티은행의 대환 대출 데이터 중계 시스템 구축 사업은 쿠콘의 새로운 비즈니스 모델”이라며 “쿠콘은 고객사의 업무 편의성을 높일 수 있도록 꾸준히 신규 서비스 발굴에 힘쓰겠다”고 말했다.  editor@itworld.co.kr

쿠콘 한국씨티은행 2022.07.12

IBM, 데이터 옵저버빌리티 기업 ‘데이터밴드.ai’ 인수

IBM이 데이터 급증과 이에 따른 중요성 증가를 고려해 하이브리드 클라우드 및 AI 서비스를 강화하기 위한 전략의 일환으로 데이터 옵저버빌리티 서비스 기업 ‘데이터밴드.ai(Databand.ai)’를 인수한다고 밝혔다. 인수가는 공개되지 않았다. IBM에 따르면 이번 인수는 IDC에서 2020년 미화 약 50억 달러로 추산한, 매년 크게 성장 중인 데이터 옵저버벌리티 시장을 개척하려는 시도다.    데이터 옵저버벌리티는 풀스택 옵저버벌리티 그리고 애플리케이션 성능 관리(APM)와는 다르다. 데이터 옵저버빌리티는 데이터 세트나 데이터 파이프라인이 원하는 대로 작동하지 않는 이유를 파악하는, 풀스택 옵저버빌리티의 하위 집합이다. 데이터 옵저버빌리티 플랫폼은 데이터 엔지니어가 애널리틱스 대시보드 또는 머신러닝 모델 등의 데이터 제품이 제대로 작동하는지 신속하게 파악하고, 오류 발생 시 문제 원인을 추적하는 데 필요한 도구를 제공한다.  일반적으로 옵저버빌리티는 엔터프라이즈 애플리케이션, 데이터 플로우, 분산 인프라를 모니터링하는 작업을 설명하는 비교적 새로운 IT 용어다. 옵저버빌리티를 지원하는 시스템은 이전의 APM 프로그램을 넘어, 높은 수준의 IT 인프라 개요와 세분화된 지표를 제공해 효율적인 애플리케이션, 네트워크, 데이터 및 보안 관리를 가능하게 한다.  풀스택 옵저버빌리티 도구 및 서비스를 제공하는 회사로는 데이터독, 뉴렐릭, 다이나트레이스, 허니콤, 수모 로직, 시스코 앱다이나믹스, AWS, 오라클, 마이크로소프트 등이 있다. IBM의 옵저버빌리티 관련 인수는 이번이 처음은 아니다. 하이브리드 클라우드 측면에서 애플리케이션 성능 모니터링 시장을 목표로 지난 2020년 11월 인스타나(Instana)를 사들인 바 있다.  데이터밴드.ai는 데이터 옵저버빌리티를 전문으로 한다. 이 스타트업은 이스라엘 텔아비브에 본사를 두고 있으며, 지난 2018년 에브게니 슐만, 조시 베남람, 빅터 샤...

IBM 옵저버빌리티 관찰가능성 2022.07.08

브이엔티지-지놈인사이트, 암 및 희귀질환 유전체 빅데이터 플랫폼 공동 개발

브이엔티지(VNTG)가 최근 유전체 빅데이터 기업 지놈인사이트와 ‘전장유전체 기반 정밀의료 빅데이터 플랫폼’ 공동 개발을 위한 협력 파트너십을 체결했다.   지놈인사이트는 암 및 희귀질환과 같은 유전적 변이에 의해 발생하는 질환의 정확한 진단과 맞춤형 치료를 하기 위한 전장유전체 빅데이터 분석 및 해석 전문기업이다. 전장유전체 분석은 30억 쌍에 이르는 사람의 DNA 염기서열 전체를 읽고 해석하는 것으로, 기술과 비용적 한계로 1% 유전체를 선별적으로 검사하던 기존 패널 검사의 한계를 넘어 유전체의 99%를 규명한다. 그동안 전장유전체는 비용과 기술의 문제로 실제 의료현장에서는 사용되지 못했으나, 지놈인사이트는 해석 능력을 고도화하고 스케일업해 누구나 전장유전체 빅데이터를 의미 있게 사용할 수 있는 초고속 정밀의료 분석 기술을 개발해왔다. 브이엔티지는 디지털 전환(DT) 기술을 바탕으로 지놈인사이트의 빅데이터 서비스 플랫폼 고도화 협력에 나선다. 단순히 플랫폼 구축 지원에 그치지 않고 ‘디지털과 관련한 모든 것’을 함께 고민하며 업무 프로세스를 비롯한 시스템과 조직 문화 등을 위한 디지털 전환 작업에 힘을 보탠다. 지놈인사이트는 이번 브이엔티지와의 파트너십을 계기로 환자 의료정보와 유전체 정보를 결합한 데이터베이스를 구축한다. 뿐만 아니라 미래 사업의 일환으로 난치성 암 및 희귀질환을 맞춤 진단을 하기 위한 클라우드 시스템 및 관련 서비스를 개발할 계획이다. 브이엔티지 이승은 부대표는 “의미 있는 사업 비전에 브이엔티지의 경험과 역량이 기여할 수 있다는 점에서 기대가 크다”며 “다양한 분야에서 데이터 플랫폼 구축 및 DT 서비스를 제공한 전문성을 활용해 지놈인사이트가 성공적인 인프라와 서비스를 구축할 수 있도록 최선을 다하겠다”고 말했다. editor@itworld.co.kr

브이엔티지 지놈인사이트 2022.07.07

“국내 기업 경영진 53%, 기술 투자 1순위로 데이터 및 분석 꼽아” EY컨설팅 발표

국내 기업 경영진 53%가 기술 투자 1순위로 데이터 및 분석을 지목하면서 경영, 조직 운영, 주요 의사결정에 데이터를 접목해 ‘데이터 중심’ 조직으로 탈바꿈할 계획을 고려하고 있다는 조사 결과가 나왔다.   글로벌 회계·컨설팅 법인 EY한영의 컨설팅 조직 EY컨설팅은 한국을 포함한 전 세계 22개국 1,600여 명의 기업 경영진들의 기업혁신 내 기술의 역할에 대한 견해를 담은 ‘EY 테크 호라이즌(Tech Horizon) 2022’ 보고서를 발표했다.   보고서에 따르면 현재 데이터 중심의 조직으로 전환을 마쳤다는 국내 기업 비율은 21%에 불과했으나, 점차 늘어날 것으로 전망된다. 데이터 중심이란 IT 부서에 국한되어 데이터를 관리하는 것이 아닌, 전사적으로 통합된 데이터를 통해 인사이트를 도출해 기업의 의사결정, 프로세스, 서비스, 제품 등을 개선하는 접근방식을 의미한다. 조사에 참여한 국내 응답자의 절반 이상인 53%가 데이터 및 분석을 향후 2년간 혁신 전략을 수립하기 위한 최우선 투자 분야로 선정했다. 국내 경영인들은 데이터를 비롯해 ▲사물인터넷(51%) ▲클라우드(47%) ▲인공지능(AI) 및 머신러닝(42%) ▲블록체인(18%) 등 신기술 인프라에 기술 투자를 집중해 디지털 기반을 마련하고 있는 것으로 나타났다. 전 세계 기업 경영진들도 마찬가지로 데이터 및 분석을 가장 중요한 투자과제이자 향후 2년 간 기업에 가장 높은 가치를 창출할 기술로 지목했다. 기술 투자를 통해 트렌드 및 고객 요구사항을 파악하거나, 비용절감, 신제품 개발, 기존 제품 및 운영을 개선함으로써 비즈니스 가치를 창출할 계획이다. 디지털 트랜스포메이션 전략의 일환으로 국내 기업인들은 데이터 경영체계 구축에 나서면서 기존 노후화된 레거시 인프라를 현대화하고 데이터를 중앙 집중화하는 것을 추진하고 있으나 기술의 진입장벽이 높다고 밝혔다. 레거시 인프라 전환 및 업그레이드(32%), 분산된 시스템의 통합(29%), 디지털 에코시스템 관리(29%)와 같은 ...

EY컨설팅 2022.07.07

“쉽고 빠른 풀스택 접근법” MS 애저 애널리틱스 서비스 7선

비즈니스 데이터를 이해할 수 없다면 사실상 눈을 가린 채로 비행하는 것이나 마찬가지다. 데이터에 숨겨진 인사이트는 비즈니스 운영을 최적화하고 고객 경험을 미세 조정하며, 새로운 제품 또는 새로운 비즈니스를 개발하는 데 필수적이다.  데이터 분석은 이런 인사이트를 발견하기 위한 수단이고, 이를 제대로 하려면 데이터 수집 및 준비, 데이터 보강 및 태깅, 보고서 작성 및 공유, 데이터 및 인사이트 관리 및 보호를 위한 도구가 필요하다. 또한 기업이 점점 더 많은 양의 데이터와 씨름하면서 클라우드는 분석 작업에 안성맞춤인 장소로 빠르게 변하고 있다.     많은 기업이 마이크로소프트 애저(Microsoft Azure)를 데이터 분석을 위한 중앙 허브로 이용하고 있다. 데이터 분석의 범위를 광범위하게 정의하는 애저는 12가지 이상의 서비스를 제공한다. 또한 AI 기반 분석 및 새로운 데이터마트 옵션을 지원하는 파워 BI(Power BI)나 마이크로소프트 퍼뷰(Microsoft Purview) 등의 거버넌스 지향 접근법도 추가됐다. 마이크로소프트 애널리틱스(Microsoft Analytics)의 CTO 아미르 네츠는 “단편적인 접근법이 아니라, 함께 작동하도록 설계된 애저에서 전체 애널리틱스 서비스 스택을 제공하는 것을 목표로 하고 있다”라고 강조했다.  다양한 서비스 간에 중복되는 부분이 있긴 하지만, 네츠는 애저의 애널리틱스 서비스가 애널리틱스 아키텍처 프레임워크 생성 시 기업이 구축하는 계층에 폭넓게 적용된다고 밝혔다. 네츠는 “데이터 레이크 생성, 데이터 저장, 데이터 레이크에서의 데이터 처리, 데이터 엔지니어링, 데이터 웨어하우스 구축, 머신러닝 알고리즘 및 데이터 과학 실행, 비즈니스 사용자에게 데이터 제공 등의 기능이 있다”라고 설명했다.  최근 발표된 ‘마이크로소프트 인텔리전트 데이터 플랫폼(Microsoft Intelligent Data Platform)’은 이런 사실을 잘 보여준다. 여기서는 마이크...

마이크로소프트 애저 클라우드 2022.07.05

"이러려고 데이터 과학자 됐나" 데이터 관리의 11가지 어두운 비밀

누군가는 데이터를 새로운 석유라 부르고, 누군가는 새로운 금이라고도 부른다. 철학자와 경제학자들은 비유의 적절성 대해 논쟁할 수 있겠지만, 데이터 기반 의사 결정을 도모하는 기업에 데이터 구성 및 분석이 필수적이라는 점은 의심의 여지가 없다. 일단은 견고한 데이터 관리 전략이 핵심이다. 데이터 거버넌스, 데이터 운영, 데이터 웨어하우징, 데이터 엔지니어링, 데이터 분석, 데이터 과학 등을 포괄하는 데이터 관리는 올바르게 수행될 경우 각종 비즈니스에서 경쟁 우위를 가져다줄 수 있다. 좋은 소식은 데이터 관리의 많은 측면이 잘 정립돼 있으며, 수십 년 동안 발전해 온 원칙이 존재한다는 점이다. 예를 들어, 적용하기 어렵거나 이해하기에 간단하지 않을 수 있지만, 많은 과학자와 수학자 덕분에 기업은 이제 데이터를 분석하고 결론을 내리기 위한 다양한 프레임워크를 갖게 됐다. 분석 한계를 나타내는 오차 막대를 그리는 통계 모델도 있다. 그러나 데이터 과학과 이를 뒷받침하는 다양한 학문에 대한 연구에서 얻은 모든 장점에도 불구하고 우리는 머리를 긁적거릴 때가 있다. 현장에서 벽에 부딪히는 경우가 많기 때문이다. 때로는 너무 많은 데이터를 수집하고 구성하는 역설적인 문제도 있다. 일부는 철학적이며 우리의 추상적 역량을 시험한다. 그리고 처음 데이터를 수집하는 데서는 개인 정보 보호 문제가 대두되고 있다. 다음은 수많은 기업에서 데이터 관리를 어려운 과제로 만드는 몇 가지 어두운 비밀들이다.   애물단지 비정형 데이터 기업 아카이브에 저장되어 있는 데이터의 대부분은 구조화되어 있지 않다. 은행의 콜센터 직원이 작성한 문자 메모를 검색하기 위한 인공 지능(AI) 사용을 원하는 경우가 있다. 이 문장에는 은행의 대출 및 서비스를 개선하는 데 도움이 될 수 있는 통찰이 담겨 있을 수 있다. 그러나 메모 데이터는 기록할 내용에 관해 서로 다른 생각을 가진 수백 명의 사람들이 작성한 것이다. 또한, 직원들은 서로 다른 작문 스타일과 능력을 가지고 있고, 일부는 전...

데이터 관리 데이터 과학 데이터 웨어하우징 2022.07.04

윌로그, ‘용마로지스’에 의약품 콜드체인 데이터 관리 솔루션 지원

윌로그가 종합물류기업 용마로지스에 의약품 콜드체인에 적합한 데이터관리 솔루션을 공급했다고 밝혔다.    윌로그의 콜드체인 데이터 관리 솔루션은 의약품, 식품, 반도체 등 콜드체인이 필요한 물품을 운송할 때 출고시점부터 반품까지 물류 전 과정에서 온도, 습도, 충격 등 다양한 데이터를 OTQ(One Time QR-code) 디바이스로 수집하고 관리한다. 올해 7월부터 백신과 같은 생물학적제제와 냉장 및 냉동 의약품의 운송에 대한 규제가 본격적으로 강화된다. 자동온도기록장치를 반드시 구비해, 전 물류과정의 의약품 박스 단위별 온도 데이터를 수집해야 하고 수집된 데이터를 출하증명서 형태로 2년간 보관해야 한다. 용마로지스는 강화된 규제에 대응하고 국내 의약품 전문 물류 기업의 지위를 공고히 하기 위해 제약바이오 제품 특화 서비스인 ‘바이오 특송 전담 배송 서비스’를 강화할 필요성을 느꼈다. 또한 단순한 온도 유지를 넘어서는 콜드체인 프로세스를 정립하고 효율적인 데이터관리가 요구되었다. 이에 프로세스 개선을 통해 업무의 효율을 높이면서 동시에 콜드체인 관리의 정확성을 높일 수 있는 윌로그의 콜드체인 데이터관리 솔루션을 선택하게 되었다. 윌로그의 콜드체인 데이터 관리 솔루션은 별도의 기기나 앱설치 없이 스마트폰 카메라로 QR코드를 스캔해 온도 데이터를 쉽고 간편하게 확인할 수 있어 물류 담당자, 운송기사, 수령자 모두 정확한 데이터로 소통할 수 있고, 디바이스와 제품 및 재고정보를 연동해 현장의 업무효율을 높이면서 업무시간도 단축할 수 있다.  용마로지스의 김현근 부장은 “생물학적제제와 냉장 및 냉동 의약품 운송관리 규제가 강화됨에 따라 이를 준수할 수 있는 표준 프로세스를 갖추기 위해 여러 고민을 하던 시점에 윌로그를 알게 되었다”며 “윌로그의 콜드체인 데이터관리 솔루션이 곧 용마로지스의 표준 프로세스가 되었고, 강화된 규제에 완벽하게 대응할 수 있게 되었다”고 밝혔다.  윌로그의 윤지현 대표는 “의약품 관리 규제가 강...

윌로그 2022.06.30

엔터플, 건양대학교병원과 의료데이터 유통 플랫폼 게이트웨이 사업 제휴 계약 체결

엔터플이 건양대학교병원과 의료데이터 유통 플랫폼 게이트웨이 사업 제휴 계약을 맺었다고  발표했다.   엔터플은 의료데이터 및 엑스레이 영상 등 의료 영상데이터 활용 시 최우선으로 고려돼야 하는 개인정보 보호를 위해 보안 및 비식별화를 노코드 방식으로 개발하는 등 의료데이터 디지털 전환에 박차를 가할 것이라고 밝혔다.   현재 민간 병원의 임상데이터 활용을 위해서는 전 처리 비용이 과다하게 소요되고 있는 실정이다. 의료데이터 유통 플랫폼이 구축될 경우 불필요한 비용을 줄이고 장기적으로는 금융·통신·건설 등 타 산업의 데이터와 헬스데이터를 융합한 새로운 데이터를 생성하는 등 다양한 활용이 가능해질 것으로 업체 측은 기대하고 있다. 엔터플은 이번 사업에서 백엔드 노코드 개발 솔루션 싱크트리를 통해 의료데이터 API화, 보안, 개인정보 비식별화 등을 노코드로 쉽고 빠르게 개발하여 의료데이터 디지털 전환에 힘쓸 예정이다. 또한 건양대학교병원은 대전, 충청 지역 중심의 9개 병원으로 구성된 중부권 병원협의체를 통해 데이터 제공기관을 확보해 나가기로 합의했다. 엔터플 박현민 대표는 “이번 사업은 백엔드 노코드 개발 솔루션 싱크트리를 통해 본격적인 디지털 헬스케어 생태계를 구축해 나간다는 점에서 매우 큰 의미가 있다”며 “엔터플은 이미 다양한 산업, 많은 기업들의 발 빠른 디지털 전환을 위해 힘쓰고 있는 만큼 의료데이터의 디지털 전환이 바이오 헬스케어 분야의 성장 속도를 앞당길 수 있도록 최선을 다하겠다”고 밝혔다. editor@itworld.co.kr

엔터플 건양대학교병원 2022.06.30

오픈소스 MPP 데이터 웨어하우스, ‘아파치 도리스’란? 

‘그’가 누구이고, 어떤 학교에 다녔는지 궁금한가? ‘아파치 도리스(Apache Doris)’는 아파치 인큐베이터(Apache Incubator)에서 개발한 오픈소스 MPP 분석 데이터 웨어하우스다. 지난주 아파치 소프트웨어 재단(Apache Software Foundation; ASF)은 도리스가 최상위 수준 프로젝트(Top-Level Project; TLP)로 승격했다고 발표했다.  MySQL 애널리틱스를 활용하는 이 SQL 기반 데이터 웨어하우스는 최근 버전 1.0 그리고 도리스를 다양한 애널리틱스 및 처리 기술과 연결하는 6개의 커넥터 릴리즈를 함께 출시했다(버전 1.0은 여덟 번째 릴리즈다). 특히 이는 데이터 과학 시나리오에서 자주 사용되는 온라인 분석 처리(OLAP) 워크로드를 지원하기 위해 개발됐다.  도리스는 중국의 인터넷 검색 대기업 바이두(Baidu)에서 태어났으며, 당시에는 ‘팔로(Palo)’라고 불렸다. 2017년 오픈소스화되고, 이어 2018년 아파치 인큐베이터에 기증되기 전까지 바이두의 광고 비즈니스를 위한 데이터 웨어하우징 시스템으로 사용됐다.    아파치 임팔라 및 구글 매사를 기반으로 하는 도리스 도리스는 구글 F1(Google F1)을 토대로 2012년 개발된 오픈소스 MPP SQL 쿼리 엔진 구글 매사(Google Mesa)와 아파치 임팔라(Apache Impala)의 기술 통합을 바탕으로 한다. 2014년경 확장성이 뛰어난 분석 데이터 웨어하우징 시스템으로 설계된 매사는 구글의 인터넷 광고 비즈니스와 관련된 중요한 측정 데이터를 저장하는 데 활용됐다.  바이두와 아파치 인큐베이터의 개발자에 따르면 이 데이터베이스는 고가용성, 안정성, 내결함성, 확장성은 물론 단순한 설계 아키텍처까지 제공한다. 아파치 소프트웨어 재단은 공식 성명에서 “단일 시스템(에서의 개발, 배포, 사용)과 많은 데이터 제공 요건을 충족하는 게 도리스의 주요 기능이다”라면서, “이 데이터 웨어하우수는...

오픈소스 데이터 웨어하우스 아파치 도리스 2022.06.27

글로벌 칼럼ㅣ위치 데이터가 개인이나 기업에 위험을 초래한다

위치 데이터 시장은 이미 거대하며, 계속 커지고 있다. 이런 데이터는 네트워크 업체, 스마트 기기에 깔린 앱, 사용자가 접속한 웹사이트 등에서 수집된다. 마케팅엔 성배이지만, 정보보안(InfoSec)에는 악몽이다.  위치 추적 알고리즘과 관련 기술을 개발하는 기업들이 ‘초개인화 마케팅’이라는 로켓을 타고 계속해서 놀라운 속도로 성장하고 있다. 작년 가을 그랜드뷰 리서치(Grandview Research)는 미국의 위치 데이터 시장만 미화 약 140억 달러 규모라고 추산했으며, 2022년에서 2030년까지 CAGR 15.6%로 성장하리라 전망했다.  이를 감안하면 위치 데이터 시장은 의심할 여지없이 뛰어들어야 할 달콤한 시장으로 보인다. 동시에 IT 및 보안 부서가 정기적으로 새로운 과제를 직면하는 곳이기도 하다.     위치 데이터 공유의 위험  직원들이 남긴 데이터 흔적을 통해 경쟁사는 기업의 R&D를 추론하고, 영업 비밀을 식별하며, 직원 및 기업 자산의 위치를 카탈로그화할 수 있다.  엔지니어 그리고 이러한 앱 및 알고리즘을 지원하는 사람이 직면하는 또 다른 문제는 ‘정보’가 어떻게 개인의 이익과는 반대로 사용될 수 있는지다. 예를 들면 美 연방대법원의 ‘로 대 웨이드(Roe v. Wade)’ 판결이나 미국 일부 주(州)에서 통과된 낙태 금지법 사례에서 이를 살펴볼 수 있다.   바이스(Vice) 매거진은 ‘데이터 브로커가 낙태 클리닉을 방문하는 사람들의 위치 데이터를 팔고 있다(Data Broker Is Selling Location Data of People Who Visit Abortion Clinics)’라는 제목의 기사에서 “가족계획연맹(Planned Parenthood)을 방문한 사람들이 어디서 왔고, 이후 어디로 갔는지 일주일 치 데이터를 얻는 데 160달러가 조금 넘는 비용이 든다”라고 밝혔다.  이어 기사는 “해당 데이터를 판매하는 곳인 세이프그래...

위치 데이터 개인정보 프라이버시 2022.06.22

빔 소프트웨어, ‘젠스엑트’의 데이터 백업 및 보호 솔루션 구축 사례 공개

빔 소프트웨어는 자율주행 전문 업체인 젠스엑트의 데이터 보호 사례를 발표했다. 젠스엑트는 빔 소프트웨어의 빔 가용성 스위트(Veeam Availability Suite)와 카스텐 K10(Kasten K10)을 사용해 안정적인 데이터 백업, 보호 및 재해 복구 솔루션을 구축하고 컨테이너형 개발 프로세스를 간소화해 급변하는 모빌리티 업계에서 경쟁력을 확보하고 있다고 업체 측은 설명했다.   자율주행 소프트웨어를 개발하는 젠스엑트는 데이터 집약적인 IT를 기반으로 한 혁신이 빠르게 진행하고 있다. 젠스엑트는 재해 발생 시 신속하고 효과적으로 데이터를 복구할 수 있어야 하므로 업무 중단이나 운영 지연 없이 백업 프로세스를 운영하는 것이 매우 중요하다. 따라서 빔 가용성 스위트를 백업, 복구 및 모니터링 솔루션으로 활용해, IT 환경 전반에 걸쳐 약 400개의 미션 크리티컬(mission-critical) 가상 머신(VM)을 보호하고 있다. 젠스엑트 스크럼 마스터 및 서비스 책임자인 요한 얀손은 “우리는 비즈니스의 유연성 및 확장성을 위해 빔 가용성 스위트를 선택했다”며, “빔 소프트웨어로 시스템을 빠르고 쉽게 복구할 수 있기 때문에 우리 고객들에게 새로운 기능을 신속하게 제공할 수 있다”고 말했다.  젠스엑트는 오버헤드(overhead)를 줄이고 개발 및 혁신을 위한 시간과 자원을 확보하기 위해 워크로드를 VM에서 컨테이너로 이동하기 시작했다. 젠스엑트는 컨테이너형 워크로드에 대해 5가지 데이터 보호 솔루션을 평가한 후 최종적으로  쿠버네티스 데이터 및 애플리케이션을 위한 클라우드 네이티브 백업 및 복구 솔루션인 카스텐 K10을 선택했다. 개발자에게 선택의 자유와 안전을 보장함으로써 개발자들이 데이터 손실 위험을 줄이면서 잠재력을 최대한 발휘할 수 있게 했다고 업체 측은 설명했다. 빔 소프트웨어 대니 앨런 CTO는 “젠스엑트는 업계 선도업체로 비즈니스를 재빠르게 전환하고 워크로드를 VM에서 컨테이너로 이동하고 있다”며, “이미 빔...

빔 소프트웨어 2022.06.22

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.