Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
TOPIC

데이터ㆍ분석

"이러려고 데이터 과학자 됐나" 데이터 관리의 11가지 어두운 비밀

누군가는 데이터를 새로운 석유라 부르고, 누군가는 새로운 금이라고도 부른다. 철학자와 경제학자들은 비유의 적절성 대해 논쟁할 수 있겠지만, 데이터 기반 의사 결정을 도모하는 기업에 데이터 구성 및 분석이 필수적이라는 점은 의심의 여지가 없다. 일단은 견고한 데이터 관리 전략이 핵심이다. 데이터 거버넌스, 데이터 운영, 데이터 웨어하우징, 데이터 엔지니어링, 데이터 분석, 데이터 과학 등을 포괄하는 데이터 관리는 올바르게 수행될 경우 각종 비즈니스에서 경쟁 우위를 가져다줄 수 있다. 좋은 소식은 데이터 관리의 많은 측면이 잘 정립돼 있으며, 수십 년 동안 발전해 온 원칙이 존재한다는 점이다. 예를 들어, 적용하기 어렵거나 이해하기에 간단하지 않을 수 있지만, 많은 과학자와 수학자 덕분에 기업은 이제 데이터를 분석하고 결론을 내리기 위한 다양한 프레임워크를 갖게 됐다. 분석 한계를 나타내는 오차 막대를 그리는 통계 모델도 있다. 그러나 데이터 과학과 이를 뒷받침하는 다양한 학문에 대한 연구에서 얻은 모든 장점에도 불구하고 우리는 머리를 긁적거릴 때가 있다. 현장에서 벽에 부딪히는 경우가 많기 때문이다. 때로는 너무 많은 데이터를 수집하고 구성하는 역설적인 문제도 있다. 일부는 철학적이며 우리의 추상적 역량을 시험한다. 그리고 처음 데이터를 수집하는 데서는 개인 정보 보호 문제가 대두되고 있다. 다음은 수많은 기업에서 데이터 관리를 어려운 과제로 만드는 몇 가지 어두운 비밀들이다.   애물단지 비정형 데이터 기업 아카이브에 저장되어 있는 데이터의 대부분은 구조화되어 있지 않다. 은행의 콜센터 직원이 작성한 문자 메모를 검색하기 위한 인공 지능(AI) 사용을 원하는 경우가 있다. 이 문장에는 은행의 대출 및 서비스를 개선하는 데 도움이 될 수 있는 통찰이 담겨 있을 수 있다. 그러나 메모 데이터는 기록할 내용에 관해 서로 다른 생각을 가진 수백 명의 사람들이 작성한 것이다. 또한, 직원들은 서로 다른 작문 스타일과 능력을 가지고 있고, 일부는 전...

데이터 관리 데이터 과학 데이터 웨어하우징 2022.07.04

윌로그, ‘용마로지스’에 의약품 콜드체인 데이터 관리 솔루션 지원

윌로그가 종합물류기업 용마로지스에 의약품 콜드체인에 적합한 데이터관리 솔루션을 공급했다고 밝혔다.    윌로그의 콜드체인 데이터 관리 솔루션은 의약품, 식품, 반도체 등 콜드체인이 필요한 물품을 운송할 때 출고시점부터 반품까지 물류 전 과정에서 온도, 습도, 충격 등 다양한 데이터를 OTQ(One Time QR-code) 디바이스로 수집하고 관리한다. 올해 7월부터 백신과 같은 생물학적제제와 냉장 및 냉동 의약품의 운송에 대한 규제가 본격적으로 강화된다. 자동온도기록장치를 반드시 구비해, 전 물류과정의 의약품 박스 단위별 온도 데이터를 수집해야 하고 수집된 데이터를 출하증명서 형태로 2년간 보관해야 한다. 용마로지스는 강화된 규제에 대응하고 국내 의약품 전문 물류 기업의 지위를 공고히 하기 위해 제약바이오 제품 특화 서비스인 ‘바이오 특송 전담 배송 서비스’를 강화할 필요성을 느꼈다. 또한 단순한 온도 유지를 넘어서는 콜드체인 프로세스를 정립하고 효율적인 데이터관리가 요구되었다. 이에 프로세스 개선을 통해 업무의 효율을 높이면서 동시에 콜드체인 관리의 정확성을 높일 수 있는 윌로그의 콜드체인 데이터관리 솔루션을 선택하게 되었다. 윌로그의 콜드체인 데이터 관리 솔루션은 별도의 기기나 앱설치 없이 스마트폰 카메라로 QR코드를 스캔해 온도 데이터를 쉽고 간편하게 확인할 수 있어 물류 담당자, 운송기사, 수령자 모두 정확한 데이터로 소통할 수 있고, 디바이스와 제품 및 재고정보를 연동해 현장의 업무효율을 높이면서 업무시간도 단축할 수 있다.  용마로지스의 김현근 부장은 “생물학적제제와 냉장 및 냉동 의약품 운송관리 규제가 강화됨에 따라 이를 준수할 수 있는 표준 프로세스를 갖추기 위해 여러 고민을 하던 시점에 윌로그를 알게 되었다”며 “윌로그의 콜드체인 데이터관리 솔루션이 곧 용마로지스의 표준 프로세스가 되었고, 강화된 규제에 완벽하게 대응할 수 있게 되었다”고 밝혔다.  윌로그의 윤지현 대표는 “의약품 관리 규제가 강...

윌로그 2022.06.30

엔터플, 건양대학교병원과 의료데이터 유통 플랫폼 게이트웨이 사업 제휴 계약 체결

엔터플이 건양대학교병원과 의료데이터 유통 플랫폼 게이트웨이 사업 제휴 계약을 맺었다고  발표했다.   엔터플은 의료데이터 및 엑스레이 영상 등 의료 영상데이터 활용 시 최우선으로 고려돼야 하는 개인정보 보호를 위해 보안 및 비식별화를 노코드 방식으로 개발하는 등 의료데이터 디지털 전환에 박차를 가할 것이라고 밝혔다.   현재 민간 병원의 임상데이터 활용을 위해서는 전 처리 비용이 과다하게 소요되고 있는 실정이다. 의료데이터 유통 플랫폼이 구축될 경우 불필요한 비용을 줄이고 장기적으로는 금융·통신·건설 등 타 산업의 데이터와 헬스데이터를 융합한 새로운 데이터를 생성하는 등 다양한 활용이 가능해질 것으로 업체 측은 기대하고 있다. 엔터플은 이번 사업에서 백엔드 노코드 개발 솔루션 싱크트리를 통해 의료데이터 API화, 보안, 개인정보 비식별화 등을 노코드로 쉽고 빠르게 개발하여 의료데이터 디지털 전환에 힘쓸 예정이다. 또한 건양대학교병원은 대전, 충청 지역 중심의 9개 병원으로 구성된 중부권 병원협의체를 통해 데이터 제공기관을 확보해 나가기로 합의했다. 엔터플 박현민 대표는 “이번 사업은 백엔드 노코드 개발 솔루션 싱크트리를 통해 본격적인 디지털 헬스케어 생태계를 구축해 나간다는 점에서 매우 큰 의미가 있다”며 “엔터플은 이미 다양한 산업, 많은 기업들의 발 빠른 디지털 전환을 위해 힘쓰고 있는 만큼 의료데이터의 디지털 전환이 바이오 헬스케어 분야의 성장 속도를 앞당길 수 있도록 최선을 다하겠다”고 밝혔다. editor@itworld.co.kr

엔터플 건양대학교병원 2022.06.30

오픈소스 MPP 데이터 웨어하우스, ‘아파치 도리스’란? 

‘그’가 누구이고, 어떤 학교에 다녔는지 궁금한가? ‘아파치 도리스(Apache Doris)’는 아파치 인큐베이터(Apache Incubator)에서 개발한 오픈소스 MPP 분석 데이터 웨어하우스다. 지난주 아파치 소프트웨어 재단(Apache Software Foundation; ASF)은 도리스가 최상위 수준 프로젝트(Top-Level Project; TLP)로 승격했다고 발표했다.  MySQL 애널리틱스를 활용하는 이 SQL 기반 데이터 웨어하우스는 최근 버전 1.0 그리고 도리스를 다양한 애널리틱스 및 처리 기술과 연결하는 6개의 커넥터 릴리즈를 함께 출시했다(버전 1.0은 여덟 번째 릴리즈다). 특히 이는 데이터 과학 시나리오에서 자주 사용되는 온라인 분석 처리(OLAP) 워크로드를 지원하기 위해 개발됐다.  도리스는 중국의 인터넷 검색 대기업 바이두(Baidu)에서 태어났으며, 당시에는 ‘팔로(Palo)’라고 불렸다. 2017년 오픈소스화되고, 이어 2018년 아파치 인큐베이터에 기증되기 전까지 바이두의 광고 비즈니스를 위한 데이터 웨어하우징 시스템으로 사용됐다.    아파치 임팔라 및 구글 매사를 기반으로 하는 도리스 도리스는 구글 F1(Google F1)을 토대로 2012년 개발된 오픈소스 MPP SQL 쿼리 엔진 구글 매사(Google Mesa)와 아파치 임팔라(Apache Impala)의 기술 통합을 바탕으로 한다. 2014년경 확장성이 뛰어난 분석 데이터 웨어하우징 시스템으로 설계된 매사는 구글의 인터넷 광고 비즈니스와 관련된 중요한 측정 데이터를 저장하는 데 활용됐다.  바이두와 아파치 인큐베이터의 개발자에 따르면 이 데이터베이스는 고가용성, 안정성, 내결함성, 확장성은 물론 단순한 설계 아키텍처까지 제공한다. 아파치 소프트웨어 재단은 공식 성명에서 “단일 시스템(에서의 개발, 배포, 사용)과 많은 데이터 제공 요건을 충족하는 게 도리스의 주요 기능이다”라면서, “이 데이터 웨어하우수는...

오픈소스 데이터 웨어하우스 아파치 도리스 2022.06.27

글로벌 칼럼ㅣ위치 데이터가 개인이나 기업에 위험을 초래한다

위치 데이터 시장은 이미 거대하며, 계속 커지고 있다. 이런 데이터는 네트워크 업체, 스마트 기기에 깔린 앱, 사용자가 접속한 웹사이트 등에서 수집된다. 마케팅엔 성배이지만, 정보보안(InfoSec)에는 악몽이다.  위치 추적 알고리즘과 관련 기술을 개발하는 기업들이 ‘초개인화 마케팅’이라는 로켓을 타고 계속해서 놀라운 속도로 성장하고 있다. 작년 가을 그랜드뷰 리서치(Grandview Research)는 미국의 위치 데이터 시장만 미화 약 140억 달러 규모라고 추산했으며, 2022년에서 2030년까지 CAGR 15.6%로 성장하리라 전망했다.  이를 감안하면 위치 데이터 시장은 의심할 여지없이 뛰어들어야 할 달콤한 시장으로 보인다. 동시에 IT 및 보안 부서가 정기적으로 새로운 과제를 직면하는 곳이기도 하다.     위치 데이터 공유의 위험  직원들이 남긴 데이터 흔적을 통해 경쟁사는 기업의 R&D를 추론하고, 영업 비밀을 식별하며, 직원 및 기업 자산의 위치를 카탈로그화할 수 있다.  엔지니어 그리고 이러한 앱 및 알고리즘을 지원하는 사람이 직면하는 또 다른 문제는 ‘정보’가 어떻게 개인의 이익과는 반대로 사용될 수 있는지다. 예를 들면 美 연방대법원의 ‘로 대 웨이드(Roe v. Wade)’ 판결이나 미국 일부 주(州)에서 통과된 낙태 금지법 사례에서 이를 살펴볼 수 있다.   바이스(Vice) 매거진은 ‘데이터 브로커가 낙태 클리닉을 방문하는 사람들의 위치 데이터를 팔고 있다(Data Broker Is Selling Location Data of People Who Visit Abortion Clinics)’라는 제목의 기사에서 “가족계획연맹(Planned Parenthood)을 방문한 사람들이 어디서 왔고, 이후 어디로 갔는지 일주일 치 데이터를 얻는 데 160달러가 조금 넘는 비용이 든다”라고 밝혔다.  이어 기사는 “해당 데이터를 판매하는 곳인 세이프그래...

위치 데이터 개인정보 프라이버시 2022.06.22

빔 소프트웨어, ‘젠스엑트’의 데이터 백업 및 보호 솔루션 구축 사례 공개

빔 소프트웨어는 자율주행 전문 업체인 젠스엑트의 데이터 보호 사례를 발표했다. 젠스엑트는 빔 소프트웨어의 빔 가용성 스위트(Veeam Availability Suite)와 카스텐 K10(Kasten K10)을 사용해 안정적인 데이터 백업, 보호 및 재해 복구 솔루션을 구축하고 컨테이너형 개발 프로세스를 간소화해 급변하는 모빌리티 업계에서 경쟁력을 확보하고 있다고 업체 측은 설명했다.   자율주행 소프트웨어를 개발하는 젠스엑트는 데이터 집약적인 IT를 기반으로 한 혁신이 빠르게 진행하고 있다. 젠스엑트는 재해 발생 시 신속하고 효과적으로 데이터를 복구할 수 있어야 하므로 업무 중단이나 운영 지연 없이 백업 프로세스를 운영하는 것이 매우 중요하다. 따라서 빔 가용성 스위트를 백업, 복구 및 모니터링 솔루션으로 활용해, IT 환경 전반에 걸쳐 약 400개의 미션 크리티컬(mission-critical) 가상 머신(VM)을 보호하고 있다. 젠스엑트 스크럼 마스터 및 서비스 책임자인 요한 얀손은 “우리는 비즈니스의 유연성 및 확장성을 위해 빔 가용성 스위트를 선택했다”며, “빔 소프트웨어로 시스템을 빠르고 쉽게 복구할 수 있기 때문에 우리 고객들에게 새로운 기능을 신속하게 제공할 수 있다”고 말했다.  젠스엑트는 오버헤드(overhead)를 줄이고 개발 및 혁신을 위한 시간과 자원을 확보하기 위해 워크로드를 VM에서 컨테이너로 이동하기 시작했다. 젠스엑트는 컨테이너형 워크로드에 대해 5가지 데이터 보호 솔루션을 평가한 후 최종적으로  쿠버네티스 데이터 및 애플리케이션을 위한 클라우드 네이티브 백업 및 복구 솔루션인 카스텐 K10을 선택했다. 개발자에게 선택의 자유와 안전을 보장함으로써 개발자들이 데이터 손실 위험을 줄이면서 잠재력을 최대한 발휘할 수 있게 했다고 업체 측은 설명했다. 빔 소프트웨어 대니 앨런 CTO는 “젠스엑트는 업계 선도업체로 비즈니스를 재빠르게 전환하고 워크로드를 VM에서 컨테이너로 이동하고 있다”며, “이미 빔...

빔 소프트웨어 2022.06.22

마이크로소프트, 데이터·AI 기반 영업관리 솔루션 ‘비바 세일즈’ 공개

마이크로소프트가 영업관리 프로세스 전반에 새로운 경험을 제공하는 신규 솔루션 ‘마이크로소프트 비바 세일즈(Microsoft Viva Sales)’를 공개했다.   하이브리드 업무 환경에서 영업직 종사자는 근무 시간과 장소는 물론 업무 툴에까지 과거보다 높은 유연성을 필요로 한다. 이에 마이크로소프트는 영업직원들이 사용 중인 시스템에서 상황에 맞는 인사이트를 제공받아 업무를 간소화하고, 조직이 고객에 대한 보다 포괄적인 관찰이 가능하도록 돕는 애플리케이션 비바 세일즈를 선보였다. 비바 세일즈는 지난해 출시된 마이크로소프트 비바의 첫 역할 기반 앱으로 영업직 종사자들을 위해 특별히 설계됐다. 마이크로소프트 비바는 업무 환경에서 근로자들의 참여, 학습, 웰빙, 지식 발견 등을 돕는 직원 경험 플랫폼이다. 데이터와 인공지능(AI)을 기반으로 하는 비바 세일즈는 협업·생산성 솔루션인 마이크로소프트 365와 마이크로소프트 팀즈에서 발생하는 고객 데이터를 어떠한 고객관계관리(CRM) 시스템과도 연동한다. 개인화된 인사이트는 물론 추천, 리마인더 등의 알림도 제공, 영업직원은 판매에 집중하는 시간을 확보하고 고객과의 계약을 보다 원활히 진행할 수 있게 된다. 구체적으로 아웃룩, 팀즈 또는 엑셀, 워드와 같은 마이크로소프트 오피스 앱에서 고객을 태그 하면, 비바 세일즈는 계층화된 모든 고객 관련 데이터에 맞춰 고객의 기록을 자동 수집 및 입력한다. 수집된 데이터는 CRM 시스템에서 다시 입력하거나 검색하지 않아도 팀즈와 오피스 앱 등으로 팀원들과 쉽게 공유할 수 있다. 비바 세일즈가 실시간으로 제공하는 고객 인사이트는 영업직원이 판매 과정과 고객과의 관계에 대해 더 잘 이해하도록 돕는다. 예컨대 영업직원은 판매 행위의 다음 단계와 업무의 우선순위 등을 제안받고, 고객과 주고받은 대화 등 고객 관련 히스토리 일체에 대해 쉽게 접근할 수 있다. 고객과의 통화 내용은 문자로 기록되어 대화에 집중할 수 있고, 통화 이후에는 영업직원이 말하고 들은 비율, 대화 속도...

마이크로소프트 비바 세일즈 2022.06.20

쓰리빅스, 국립암센터 ‘암 환자의 다차원적 연계 데이터 활용 시스템 고도화’ 사업자로 선정

바이오 빅데이터 전문 기업인 쓰리빅스가 국립암센터의 ‘암 환자의 다차원적 연계 데이터 활용시스템’ 2022년 고도화 사업자로 선정되었다고 밝혔다. 보건복지부는 암 환자데이터(총 300만 명) 중 70%를 차지하는 한국인 주요 암 10종에 대해 전국 암 병원의 ▲암 진료데이터 ▲건강검진 데이터 ▲유전체 데이터 ▲사망통계 등을 연계한 한국형 암(K-Cancer) 통합 빅데이터를 구축할 계획이다.  암의 원인 분석 및 진단 바이오 마커 발굴을 위한 다중오믹스 데이터의 분석 및 플랫폼 구축은 암 융합형 빅데이터의 핵심이다. 바이오빅데이터의 구축에 대한 필요성은 누구나 인지하고 있으나 실제로 사업을 수행하기 위한 전문인력과 노하우의 부족으로 사업 수행에는 많은 어려움이 존재한다. 쓰리빅스는 오랫동안 쌓아온 감염병 관련 바이오 빅데이터 분석 및 구축 경험을 토대로 사업자로 선정돼 글로벌 암 빅데이터 전문기업으로 성장할 기반을 확보했다. 쓰리빅스는 지난 13일부터 국제 암 관련 연구기관들의 컨퍼런스인 ICGC(국제암유전체컨퍼런스, 이탈리아 베로나)에 참여해 글로벌 암 유전체 데이터 표준화 및 빅데이터 플랫폼 구축 협력 방안을 논의하는 등 관련 사업의 성공적인 수행을 위한 준비를 마쳤다. 쓰리빅스는 국립암센터의 ‘암단백유전체 데이터 분석시스템 구축’과 ‘암 환자의 다차원적 연계데이터 활용 시스템 구축’ 사업자에 2021년에도 선정되었다. 한국인 유전체 데이터를 분석, 관리, 통합하는 ‘헬스케어 빅데이터 쇼케이스 시스템 구축’ 사업에는 2020년, 2021년에 선정돼 성공적으로 사업을 마쳤으며 지속적으로 시스템의 고도화에 참여하고 있다. 또한, 코로나19로 질병관리청에서 발주한 ‘감염병 및 생물테러 병원체 통합 데이터베이스 구축 전략 기획 수립’ 사업에도 선정된 바 있다. 쓰리빅스 박준형 대표는 “이번 사업의 참여는 국내 암 관련 빅데이터 분석 및 플랫폼 구축 전문기업으로 발돋움할 기회”라며 “바이오 빅데이터 플랫폼과 AI 시스템을 기반으로 한 신약 개발에도...

쓰리빅스 바이오 2022.06.16

오라클, 분기 실적 118억 달러…“클라우드 매출 덕분 5% 성장”

오라클이 클라우드 인프라 서비스 및 SaaS 부문에 힘입어 매출 성장을 달성했다. 대규모 클라우드 리전 확대도 검토 중이다. 클라우드 인프라 수요와 SaaS 서비스 매출 증가가 맞물리면서 오라클의 2022 회계연도 4분기(2~5월) 매출이 미화 118억 4,000만 달러(한화 약 15조 2,700억 원)를 기록했다. 반면 전자의료기록(EHR) 소프트웨어 회사 ‘서너(Cerner)’ 인수는 158억 달러의 부채를 증가시켰다.     오라클 CEO 사프라 카츠는 “클라우드 서비스 수요를 충족하기 위해 다음 회계연도에 자본 지출을 늘릴 예정이다”라고 말했다. 이어서 시킹 알파(Seeking Alpha)에 따르면 오라클은 2023 회계연도에는 이미 서비스를 제공하고 있는 20개국 38개 클라우드 리전 외에 6개 리전을 추가할 계획이다. 오라클 회장 겸 CTO 래리 엘리슨은 대규모 고객 증가를 언급하며, 이번 분기 고객으로 확보한 기업 명단을 소개했다. 유나이티드 헬스케어(United Healthcare), 뉴 사우스 웨일즈 보건당국(New South Wales Ministry of Health), 시티은행(Citibank), 처브(Chubb), PNC, SMBC, 화교은행(Overseas China Banking Corporation), 미즈호(Mizuho), 미쓰이스미토모 은행(Mitsui Sumitomo), GMP의 금융 서비스 회사, 애버크롬비 & 피치(Abercrombie & Fitch) 등이다.  교차 판매가 수익 비결 오라클은 5월 31일 자로 마감된 이번 분기 매출이 118억 4,000만 달러를 기록했다고 밝혔다. 전년 대비 5% 증가한 수치다. 클라우드 매출(IaaS, SaaS)은 모든 클라우드 제품, 특히 오라클 클라우드 인프라스트럭처(OCI) 수요에 힘입어 전년 동기 대비 19% 늘어난 29억 달러였다. 카츠는 “일반적으로 이러한 분기별 매출 성장률의 지속적인 증가는 자사의 선도적인...

오라클 실적 발표 클라우드 2022.06.16

데이터 마케팅 도우미··· 주요 DMP 플랫폼 15선

‘데이터 관리 플랫폼’(DMP ; Data management platform)이란 광범위한 여러 소스로부터 데이터를 수집하고 관리하며, 각종 데이터 스트림에서 어떤 일이 벌어지고 있는지에 대한 정보를 줄 수 있도록 고안된 도구 그룹을 의미한다. 사실 ‘데이터 관리 플랫폼’이라는 이름은 다소 혼란스러울 수 있다. 각종 모든 형태의 데이터와 호환되는 데이터 과학자용 범용 제품이라는 인상을 주기 때문이다. 하지만 이 용어는 마케팅 분야에서 애용되며, 이로 인해 시중의 여러 DMP는 마케팅 분야에 특화된 기능을 갖추고 있다. 이를테면 다양한 광고 채널에서 생성되는 데이터 피드를 관리하고 마케팅 전문가의 지출을 돕는 기능 등이 대표적이다. 이러한 변화가 나타나는 이유는 현대의 데이터 기반 마케팅팀들이 서로 연결된 여러 데이터 소스와 각종 데이터 포맷을 탐구해야 하기 때문이다. 주요 데이터 소스로는 청중 소통 및 사용자 클릭율에 관한 통계를 유통하는 광고 시장, 고객 구매 정보를 담은 영업 소프트웨어 시스템, 소통을 추적하는 웹 사이트 등이 있다. 이 모든 데이터의 용량은 테라바이트 수준에 달하며, 데이터 관리 플랫폼(DMP)은 마케팅 전문가가 업무를 수행하는데 도움이 될 수 있다. DMP는 마케팅 이외의 분야에도 유익할 수 있다. 광범위한 데이터베이스, 데이터 레이크, 데이터 웨어하우스 등과 상호작용하고 데이터 스트림을 수집한 후 정리하며, 여러 정보를 통합하는 데 뛰어나기 때문이다. 실제로 몇몇 DMP 도구는 실험실, 제조 공장, 정부 기관 등에서 데이터를 수집하고 관리하는데 사용된다.  일부 DMP는 정교한 인포그래픽과 함께 보고서를 생성하는 데 특화되어 있다. 그러나 데이터 수집 및 통합만을 목적으로 하는 DMP가 더 많다. 분석 및 프레젠테이션 작업은 데이터 사이언스와 분석에 특화된 다른 도구가 담당하는 구조다. 한편 최근에는 CDP라는 DMP의 사촌이 발전하고 있다. CDP는 대개 각각의 고객을 추적하기 위해 고안됐다. 광고를 보거나 웹 사...

CMO 디지털 마케팅 데이터 마케팅 2022.06.15

"비즈니스 기회를 포착하고 위험을 완화하는" 행동 분석의 이해

자동차를 사려고 한다. 구매자는 제조사 웹사이트를 방문해 모델의 디자인을 살펴보고, 현지 딜러의 웹사이트에 올라온 매물을 살펴본 다음 대리점을 방문한다. 이때 영업 담당자는 구매자의 요구 사항을 파악하고 최선의 옵션을 제시하기 위해 어떤 정보를 검토해야 할까? 다음과 같은 사례도 생각해 보자. SOC(Security Operation Center)에서 한 직원의 네트워크 활동에 대한 경보를 수신했다. 해당 직원은 평소와 다른 시간에 원격 위치에서 다양한 비즈니스 영역을 알아보면서 일을 하는 것일까? 아니면 SOC의 개입이 필요한 악의적인 행동일까?   위 2가지 상황은 사용자 행동 분석으로 답을 얻을 수 있는 사례다. B2B 및 B2C 판매 증대, 고객 경험 개선, 이상 탐지, 위험 경보, IoT 기기에서 생성되는 데이터를 활용한 위험 식별 등은 행동 분석의 가장 일반적인 사용례다. 나임(KNIME) 수석 데이터 과학자이자 에반젤리즘 책임자인 로사리아 실리포는 행동 분석을 ‘특정 상황에서 사람들의 반응과 행동 패턴을 연구하는 것’이라고 간단히 정의했다.  행동 분석에 있는 비즈니스 기회 행동 분석은 많은 사람이 관여해 수많은 행동을 하는 제품이나 서비스에서 특히 중요하다. 행동 분석으로 결과물을 개선하고 위험을 줄일 수 있다. 가령 대형 전자상거래 웹사이트 고객의 구매 습관, 의료 애플리케이션, 게임 플랫폼, 은행의 자산 관리 업무 등에서 활용할 수 있다. 실리포는 “행동 분석의 목표는 최대한 많은 사람을 연구하는 것이며, 핵심은 많은 데이터를 확보하는 것”이라고 말했다.  아큐멘 애널리틱스(Acumen Analytics)의 CEO 케시 브루너는 한 시장조사 자료를 인용해 전 세계 행동 분석 시장의 규모가 2022년 4억 2,730만 달러에서 2026년 22억 달러에 이를 것으로 예상했다. 연평균 32%의 성장률이다.  브루너는 이런 결과를 비즈니스 기회 측면에서 해석했다. 브루너는 “지금은 행동 분석이 주로 소매...

행동분석 머신러닝 인공지능 2022.06.15

“페이스북, 알고리즘 변경으로 공화당만 이득” 미 대학 공동 연구팀

미국 마이애미 대학교와 라이트 스테이트 대학교의 공동 연구에 따르면, 2018년 페이스북이 알고리즘을 변경한 후, 미국 공화당이 페이스북 상에서 미국 민주당보다 더 높은 반응과 도달 범위를 얻은 것으로 나타났다. 이번 연구는 2016년 1월부터 2021년 8월까지 페이스북과 트위터 상에서 공화당과 민주당의 페이스북 그룹의 활동을 조사했다.   조사 결과, 2018년 말부터 페이스북 상에서 변화가 일어났는데, 같은 변화가 트위터에서는 확인되지 않았다. 연구팀은 공화당의 포스트와 관련한 활동이 가 민주당의 대응 포스트보다 확실하게 증가했다고 밝혔다 심지어 포스트를 더 자주 올린 쪽은 민주당이었다. 또한 페이스북이 알고리즘을 변경한 후, 공화당의 포스트는 민주당의 포스트보다 두 배 더 공유됐다. 이런 패턴을 기반으로 연구팀은 미국 내 정치 문화에 대한 우려를 제기했다. 2021년 미국인 10명 중 7명은 페이스북을 사용하고, 이 중 절반은 매일 사용한다고 밝혔다. 1/3이 넘는 사용자는 매일 페이스북으로부터 메시지를 받는다. 연구팀은 “만약 페이스북의 알고리즘 변경이 페이스북 상에서 양대 정당의 도달 범위에 영향을 미쳤다면, 페이스북이 실수로 또는 의도적으로 미국의 정치 현실에 영향을 미칠 가능성이 있다”고 지적했다. 페이스북은 2018년 알고리즘 변경 당시, “의미있는 소셜 인터랙션(Meaningful Social Interactions, MSI)이란 페이스북 사용자 간의 개인 연결을 강화하는 데 중점을 뒀다고 설명했다. 하지만 결과적으로 대중을 대상으로 한 메시지만 더 커졌고, 페이스북이 부정적인 언급과 혐오 발언에 보상을 제공해 페이스북에서 더 확산되도록 했다. 지난 해 내부 고발자 프란시스 호겐이 공개한 문서에 따르면, 페이스북은 자사 플랫폼의 부정적인 영향을 지나치게 낮게 평가하고 있다. 두 대학 공동 연구팀의 조사는 이런 사실을 확인하는 것으로 보인다. 연구팀이 이런 현상에 대한 다음과 같이 두 가지 가능한 설명을 제시했다. 분노는 소셜...

페이스북 메타 알고리즘 2022.06.14

영국 정부, 공공부문을 위한 디지털 전환 로드맵 공개..."구체적인 관리 체계로 실효성 확보"

영국 정부가 공공부문의 디지털 서비스를 새롭게 혁신하기 위한 디지털 및 데이터 전략안을 공개했다. 이번 전략안은 21가지의 구체적인 목표를 포함하고 있으며, 2025년까지 공무원의 디지털 역량을 강화하고 온라인 행정 절차를 간소화한다는 내용이 주를 이루고 있다.   ‘디지털 미래를 위한 전환: 디지털 및 데이터를 위한 2022-2025 로드맵(Transforming for a digital future: 2022 to 2025 roadmap for digital and data)’이라는 이번 전략안의 목표는 크게 6가지 범주로 나눠져 있으며 ▲올바른 결과를 달성하는 혁신 공공 서비스 ▲정부를 위한 원 로그인(One Login) ▲의사 결정을 위한 더 나은 데이터 ▲안전하고 효율적이며 지속 가능한 기술 ▲대규모 디지털 기술 ▲디지털 전환을 실현하는 시스템이 포함됐다. 구체적으로 살펴보면, 영국 정부는 2025년까지 공공부문에서 가장 많이 이용하는 서비스 중 최소 50%는 업그레이드해서 효율성과 사용성을 높이고, 모바일 기기의 접근성도 높일 예정이다.  ‘원 로그인’ 서비스를 강화하겠다는 내용도 핵심 목표로 제시됐다. 원 로그인은 정부 서비스에서 활용되는 계정 인증 및 로그인 기술로 일반 시민을 위해 개발됐다. 영국 정부는 2023년까지 미리 구축해 놓은 원로그인 전략안과 로드맵을 각 부처가 검토하도록 요청해 2025년까지는 원 로그인의 활용성을 높일 계획이다.  영국 정부는 이번 로드맵을 실행하면 2025년까지 10억 파운드가 넘는 비용을 줄일 수 있다고 설명한다. 행정 처리 과정을 효율화하고 문서 중심의 서비스를 없앨 수 있기 때문이다.  한편 이번 전략안은 중앙 디지털 및 데이터실(Central Digital and Data Office, CDDO)에서 관리 및 감독할 예정이다. CDDO는 내각실 산하 부서로 정부와 관련된 디지털, 데이터, 기술과 관련된 정책 업무를 수행하고 있다.  CDDO의 수석 ...

디지털전환 dx 영국 2022.06.13

컴볼트, 랜섬웨어 대응 위한 ‘인텔리전트 데이터 서비스’ 출시

컴볼트는 랜섬웨어 대응을 위해 보안 기능을 강화한 ‘인텔리전트 데이터 서비스(Intelligent Data Services)’ 11.26 릴리스를 공식 출시했다고 밝혔다.  인텔리전트 데이터 서비스는 외부 공격에 대한 인프라 하드닝과 복구력 향상을 통해 온프레미스와 클라우드, 여러 클라우드 등 모든 인프라 환경 전반에 랜섬웨어를 비롯한 사이버 위협을 완화한다고 업체 측은 설명했다. 업데이트된 주요 기능은 ▲하드웨어 기반 보안 토큰 활용과 공용 액세스 카드(Common Access Card, CAC) 지원을 통한 고객 보안 태세 강화 ▲AWS 키 매니지먼트 시스템(AWS Key Management System, KMS)과 애저 키 볼트(Azure Key Vault) 등 보안성이 뛰어난 클라우드 인증 방식 활용 ▲오브젝트 스토리지 및 빅데이터 파일 시스템까지 지원하는 재해 복구(DR) 오케스트레이션 기능 확장을 통한 대규모 데이터세트 수용 등이 포함된다. 이 중 공용 액세스 카드(CAC) 인증 방식의 경우, 데이터 관리 대시보드를 확인할 수 있는 컴볼트 커맨드 센터와 웹 콘솔 로그인 시에 ‘패스워드 리스(password-less)’ 전략을 토대로 별도 암호를 기입하지 않고도 접속이 가능해 사용자 편의성을 개선한다.  이와 함께 이중(two-factor) 인증 방식을 지원하는 보안 키를 통해 컴볼트 데이터 관리 환경에 보안 수준을 한층 강화할 수 있다. 이는 계정 로그인 시 기존 패스워드와 더불어 수시로 변하는 PIN 코드 또는 하드웨어 보안 키를 연계해 다중 요소(multifactor) 인증을 활용한 방식으로, 단순 패스워드를 기입하는 로그인 방식 대비 컴볼트의 전체 소프트웨어 구성요소인 컴셀(CommCell) 환경을 무단 액세스로부터 보다 효과적으로 보호할 수 있도록 돕는다. 컴볼트 제품 부사장(VP)인 랑가 라자고팔란은 “이번 신규 릴리스 발표는 기존 온프레미스 데이터에 대한 지원을 이어나가는 동시에 견고한 사이버 보안 기준과 클라우...

컴볼트 데이터센터 2022.06.09

대체 데이터에 숨겨진 비용 폭탄 5가지

오늘날 ‘대체 데이터(Alternative Data)’ 소스가 다양한 영역에서 기업의 비즈니스 프로세스에 포함되고 있다. 美 법률회사 로웬스타인 샌들러(Lowenstein Sandler)의 2022년 설문조사 결과에 따르면 헤지펀드부터 사모펀드, 벤처 캐피탈까지 무려 92%의 투자 회사가 의사결정에 정보를 제공하기 위해 중간 또는 상당한 수준으로 대체 데이터를 활용하고 있다고 답했다. 또한 2022년에 대체 데이터 사용이 증가할 것으로 예상됐다.    일반적으로 이는 다른 비즈니스 프로세스에서 나오는 데이터를 말한다. 예를 들면 소셜 미디어 활동, 인공위성 사진, 위치 추적 데이터, 신용카드 거래, 웹 스크랩핑 등이 있다.  대체 데이터는 마케팅부터 영업, 재무, 전략 기획까지 기업 전반에서 사용될 수 있지만, 이런 서드파티 데이터를 소유하고 관리하는 곳은 대부분 IT 부서다. 지난 2019년 포레스터 리서치는 IT 소속의 CIO 및 CDO가 대체 데이터 수집의 56%를 관리하고 있다고 밝혔다.  대체 데이터를 ‘소싱’하고, ‘저장’하며, ‘관리’하는 일은 IT 관리자에게 새로운 과제를 안겨준다. 아울러 불필요하고 상당한 비용을 수반할 수 있다. 여기서는 이에 따른 5가지 문제와 완화하는 방법을 살펴본다.  1. 솔루션 업체 선택 비용(Vendor selection costs) 로웬스타인의 설문조사 결과에 따르면 ‘벤더 선택 비용(61%)’은 대체 데이터 사용자가 가장 우려하는 부분이다. 이 비용은 대체 데이터 벤더를 검토하고, 해당 벤더가 제공하는 데이터의 품질이 충분한지 확인하는 과정에서 발생한다. 이는 특히 데이터가 비즈니스 프로세스의 핵심 요소이며, 쉽게 교체할 수 없을 때 중요하다. 이러한 상황에서 구매자는 벤더가 예측 가능한 미래까지 이 데이터를 지속적으로 제공할 것이라는 확신이 있어야 한다. 이런 위험을 완화하는 방법은 산업 컨소시엄을 조사하여 신뢰할 수 있는 데이터 소스를 식별하는 것이다. ...

대체 데이터 데이터 중심 의사결정 서드파티 데이터 2022.05.24

커리어 로드맵 : 데이터 엔지니어

데이터 엔지니어링은 소프트웨어 엔지니어링과 데이터 과학의 요소를 결합한, IT 영역에서 빠르게 성장 중인 IT 분야 중 하나다. Indeed.com에 따르면, 데이터 엔지니어는 데이터 과학 프로젝트에 사용되는 아키텍처를 개발하고 유지하며 데이터가 서버와 애플리케이션 사이를 중단 없이 흐르도록 한다.  데이터 엔지니어는 다양한 운영체제 및 데이터베이스에 익숙해야 하고 소프트웨어를 쓰고 프로그래밍할 수도 있어야 한다. 데이터 웨어하우스 및 데이터 분석 경험, 그리고 뛰어난 비판적 사고와 커뮤니케이션 역량도 필요하다. 데이터 엔지니어는 교육, 직장 내 훈련, 지속적인 자격증 습득의 조합을 통해 기술력을 쌓을 수 있다. 인디드(Indeed)는 자격증 습득이 자신의 역량을 보여주고 앞서 나가기 위한 좋은 방법이라고 강조한다.  데이터 엔지니어가 되기 위해 무엇이 필요한지를 알아보기 위해 AI 기반의 품질 모니터링 플랫폼 전문업체인 유닛큐(unitQ)의 데이터 엔지니어인 랜스 마일스를 인터뷰했다.    교육과 취업  마일스는 2013년 캘리포니아 산타크루즈 대학에서 신경과학 학사 과정을 졸업한 뒤 2017년 워싱턴 대학에서 데이터 과학 자격증을 취득하고, 2020년에 캘리포니아 버클리 대학에서 정보 및 데이터 과학 석사 학위를 취득했다.  마일스는 “내가 거쳐온 단계를 뒤돌아볼 때 한 가지 큰 영향을 미친 경험이 있다. 대학 마지막 학기의 파이썬 과정이었던 생물학자를 위한 프로그래밍이다. 이 경험이 새로운 열정의 바탕이 됐다”고 말했다.  잘 아는 영역에서 나와 처음부터 시작해야 하는 새로운 영역으로 들어간다는 것은 겁나는 일이었다. 마일스는 매일 코드를 쓰며 방대한 서열 데이터 집합에서 정보를 추출해 단백질 서열의 물리화학적 속성을 계산하기 위한 방법을 개발하고, 유전자의 길이와 위치를 알아내고 바이러스 DNA의 특성을 파악했다.  마일스는 “정리되지 않은 데이터 집합을 간결한 결과로 ...

데이터엔지니어 데이터과학 머신러닝 2022.05.23

"선택 방법부터 톱 10 솔루션까지" 엔터프라이즈 검색 툴의 모든 것

기업에서 생성되는 데이터가 빠르게 증가하면서 이제 데이터 활용과 관리는 모든 기업의 공통된 과제다. 특히 이메일 서버, 데이터베이스, 네트워크 드라이브, 클라우드 드라이브, 그리고 수많은 SaaS 앱에 이르기까지 온갖 곳에 데이터가 저장된 상황에서 직원이 업무에 필요한 정보를 어떻게 찾도록 할 것인가가 큰 문제다. 직원이 생산성을 유지하기 위해 필요한 정보를 찾지 못하면 기업 전체가 효과적으로 기능하지 못하게 된다.   기업에는 작업자가 기업 내의 여러 소스를 대상으로 정보를 검색할 수 있는 툴이 필요하다. 이런 엔터프라이즈 검색 소프트웨어는 HR 정책부터 헬프데스크 문서와 마케팅 자료, 현재 진행 중인 프로젝트 관련 토론에 이르기까지, 정보가 위치한 곳과 관계없이 모든 기업 콘텐츠를 하나의 애플리케이션으로 접근할 수 있도록 지원한다. 이런 툴은 데이터베이스에 저장된 구조적 데이터, 그리고 소셜 미디어 게시물이나 이메일, 채팅, 사물인터넷(IoT) 센서 데이터와 같은 다양한 파일 형식으로 된 비구조적 데이터를 포함한 기업의 모든 데이터 유형에서 정보를 찾고 추출한다. 일부 엔터프라이즈 검색 플랫폼은 전자상거래 또는 고객 서비스 검색과 같은 외부 대면 기능을 핵심 기능의 일부로 포함하거나 추가 모듈로 제공하기도 한다. 여기서는 직원을 위한 지식 관리 툴로서 내부 검색을 중심으로 살펴본다. 포레스터 리서치의 부사장이며 수석 분석가인 마이크 괄티에리는 “엔터프라이즈 검색을 이용하면 기업이 보유한 문서, 콘텐츠, 데이터베이스에서 정보와 지식을 찾을 수 있다. 직원은 필요한 정보에 즉시 액세스할 수 있다”라고 말했다. 업계 애널리스트에 따르면 엔터프라이즈 검색은 직원에게 중요한 비즈니스 질문에 대한 정확한 답과 통찰력을 제공하기 위해 여러 엔터프라이즈 데이터 소스의 데이터를 수집, 정리, 분석해 정보를 합성하는 기술로 발전하고 있다. 포레스터는 이 새로운 검색 범주를 '인지 검색(cognitive search)'으로 지칭하고, 가트너는 '인사이트 엔진...

검색툴 검색 검색엔진 2022.05.18

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.