Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
TOPIC

데이터ㆍ분석

마이크로소프트, 데이터·AI 기반 영업관리 솔루션 ‘비바 세일즈’ 공개

마이크로소프트가 영업관리 프로세스 전반에 새로운 경험을 제공하는 신규 솔루션 ‘마이크로소프트 비바 세일즈(Microsoft Viva Sales)’를 공개했다.   하이브리드 업무 환경에서 영업직 종사자는 근무 시간과 장소는 물론 업무 툴에까지 과거보다 높은 유연성을 필요로 한다. 이에 마이크로소프트는 영업직원들이 사용 중인 시스템에서 상황에 맞는 인사이트를 제공받아 업무를 간소화하고, 조직이 고객에 대한 보다 포괄적인 관찰이 가능하도록 돕는 애플리케이션 비바 세일즈를 선보였다. 비바 세일즈는 지난해 출시된 마이크로소프트 비바의 첫 역할 기반 앱으로 영업직 종사자들을 위해 특별히 설계됐다. 마이크로소프트 비바는 업무 환경에서 근로자들의 참여, 학습, 웰빙, 지식 발견 등을 돕는 직원 경험 플랫폼이다. 데이터와 인공지능(AI)을 기반으로 하는 비바 세일즈는 협업·생산성 솔루션인 마이크로소프트 365와 마이크로소프트 팀즈에서 발생하는 고객 데이터를 어떠한 고객관계관리(CRM) 시스템과도 연동한다. 개인화된 인사이트는 물론 추천, 리마인더 등의 알림도 제공, 영업직원은 판매에 집중하는 시간을 확보하고 고객과의 계약을 보다 원활히 진행할 수 있게 된다. 구체적으로 아웃룩, 팀즈 또는 엑셀, 워드와 같은 마이크로소프트 오피스 앱에서 고객을 태그 하면, 비바 세일즈는 계층화된 모든 고객 관련 데이터에 맞춰 고객의 기록을 자동 수집 및 입력한다. 수집된 데이터는 CRM 시스템에서 다시 입력하거나 검색하지 않아도 팀즈와 오피스 앱 등으로 팀원들과 쉽게 공유할 수 있다. 비바 세일즈가 실시간으로 제공하는 고객 인사이트는 영업직원이 판매 과정과 고객과의 관계에 대해 더 잘 이해하도록 돕는다. 예컨대 영업직원은 판매 행위의 다음 단계와 업무의 우선순위 등을 제안받고, 고객과 주고받은 대화 등 고객 관련 히스토리 일체에 대해 쉽게 접근할 수 있다. 고객과의 통화 내용은 문자로 기록되어 대화에 집중할 수 있고, 통화 이후에는 영업직원이 말하고 들은 비율, 대화 속도...

마이크로소프트 비바 세일즈 2022.06.20

쓰리빅스, 국립암센터 ‘암 환자의 다차원적 연계 데이터 활용 시스템 고도화’ 사업자로 선정

바이오 빅데이터 전문 기업인 쓰리빅스가 국립암센터의 ‘암 환자의 다차원적 연계 데이터 활용시스템’ 2022년 고도화 사업자로 선정되었다고 밝혔다. 보건복지부는 암 환자데이터(총 300만 명) 중 70%를 차지하는 한국인 주요 암 10종에 대해 전국 암 병원의 ▲암 진료데이터 ▲건강검진 데이터 ▲유전체 데이터 ▲사망통계 등을 연계한 한국형 암(K-Cancer) 통합 빅데이터를 구축할 계획이다.  암의 원인 분석 및 진단 바이오 마커 발굴을 위한 다중오믹스 데이터의 분석 및 플랫폼 구축은 암 융합형 빅데이터의 핵심이다. 바이오빅데이터의 구축에 대한 필요성은 누구나 인지하고 있으나 실제로 사업을 수행하기 위한 전문인력과 노하우의 부족으로 사업 수행에는 많은 어려움이 존재한다. 쓰리빅스는 오랫동안 쌓아온 감염병 관련 바이오 빅데이터 분석 및 구축 경험을 토대로 사업자로 선정돼 글로벌 암 빅데이터 전문기업으로 성장할 기반을 확보했다. 쓰리빅스는 지난 13일부터 국제 암 관련 연구기관들의 컨퍼런스인 ICGC(국제암유전체컨퍼런스, 이탈리아 베로나)에 참여해 글로벌 암 유전체 데이터 표준화 및 빅데이터 플랫폼 구축 협력 방안을 논의하는 등 관련 사업의 성공적인 수행을 위한 준비를 마쳤다. 쓰리빅스는 국립암센터의 ‘암단백유전체 데이터 분석시스템 구축’과 ‘암 환자의 다차원적 연계데이터 활용 시스템 구축’ 사업자에 2021년에도 선정되었다. 한국인 유전체 데이터를 분석, 관리, 통합하는 ‘헬스케어 빅데이터 쇼케이스 시스템 구축’ 사업에는 2020년, 2021년에 선정돼 성공적으로 사업을 마쳤으며 지속적으로 시스템의 고도화에 참여하고 있다. 또한, 코로나19로 질병관리청에서 발주한 ‘감염병 및 생물테러 병원체 통합 데이터베이스 구축 전략 기획 수립’ 사업에도 선정된 바 있다. 쓰리빅스 박준형 대표는 “이번 사업의 참여는 국내 암 관련 빅데이터 분석 및 플랫폼 구축 전문기업으로 발돋움할 기회”라며 “바이오 빅데이터 플랫폼과 AI 시스템을 기반으로 한 신약 개발에도...

쓰리빅스 바이오 2022.06.16

오라클, 분기 실적 118억 달러…“클라우드 매출 덕분 5% 성장”

오라클이 클라우드 인프라 서비스 및 SaaS 부문에 힘입어 매출 성장을 달성했다. 대규모 클라우드 리전 확대도 검토 중이다. 클라우드 인프라 수요와 SaaS 서비스 매출 증가가 맞물리면서 오라클의 2022 회계연도 4분기(2~5월) 매출이 미화 118억 4,000만 달러(한화 약 15조 2,700억 원)를 기록했다. 반면 전자의료기록(EHR) 소프트웨어 회사 ‘서너(Cerner)’ 인수는 158억 달러의 부채를 증가시켰다.     오라클 CEO 사프라 카츠는 “클라우드 서비스 수요를 충족하기 위해 다음 회계연도에 자본 지출을 늘릴 예정이다”라고 말했다. 이어서 시킹 알파(Seeking Alpha)에 따르면 오라클은 2023 회계연도에는 이미 서비스를 제공하고 있는 20개국 38개 클라우드 리전 외에 6개 리전을 추가할 계획이다. 오라클 회장 겸 CTO 래리 엘리슨은 대규모 고객 증가를 언급하며, 이번 분기 고객으로 확보한 기업 명단을 소개했다. 유나이티드 헬스케어(United Healthcare), 뉴 사우스 웨일즈 보건당국(New South Wales Ministry of Health), 시티은행(Citibank), 처브(Chubb), PNC, SMBC, 화교은행(Overseas China Banking Corporation), 미즈호(Mizuho), 미쓰이스미토모 은행(Mitsui Sumitomo), GMP의 금융 서비스 회사, 애버크롬비 & 피치(Abercrombie & Fitch) 등이다.  교차 판매가 수익 비결 오라클은 5월 31일 자로 마감된 이번 분기 매출이 118억 4,000만 달러를 기록했다고 밝혔다. 전년 대비 5% 증가한 수치다. 클라우드 매출(IaaS, SaaS)은 모든 클라우드 제품, 특히 오라클 클라우드 인프라스트럭처(OCI) 수요에 힘입어 전년 동기 대비 19% 늘어난 29억 달러였다. 카츠는 “일반적으로 이러한 분기별 매출 성장률의 지속적인 증가는 자사의 선도적인...

오라클 실적 발표 클라우드 2022.06.16

데이터 마케팅 도우미··· 주요 DMP 플랫폼 15선

‘데이터 관리 플랫폼’(DMP ; Data management platform)이란 광범위한 여러 소스로부터 데이터를 수집하고 관리하며, 각종 데이터 스트림에서 어떤 일이 벌어지고 있는지에 대한 정보를 줄 수 있도록 고안된 도구 그룹을 의미한다. 사실 ‘데이터 관리 플랫폼’이라는 이름은 다소 혼란스러울 수 있다. 각종 모든 형태의 데이터와 호환되는 데이터 과학자용 범용 제품이라는 인상을 주기 때문이다. 하지만 이 용어는 마케팅 분야에서 애용되며, 이로 인해 시중의 여러 DMP는 마케팅 분야에 특화된 기능을 갖추고 있다. 이를테면 다양한 광고 채널에서 생성되는 데이터 피드를 관리하고 마케팅 전문가의 지출을 돕는 기능 등이 대표적이다. 이러한 변화가 나타나는 이유는 현대의 데이터 기반 마케팅팀들이 서로 연결된 여러 데이터 소스와 각종 데이터 포맷을 탐구해야 하기 때문이다. 주요 데이터 소스로는 청중 소통 및 사용자 클릭율에 관한 통계를 유통하는 광고 시장, 고객 구매 정보를 담은 영업 소프트웨어 시스템, 소통을 추적하는 웹 사이트 등이 있다. 이 모든 데이터의 용량은 테라바이트 수준에 달하며, 데이터 관리 플랫폼(DMP)은 마케팅 전문가가 업무를 수행하는데 도움이 될 수 있다. DMP는 마케팅 이외의 분야에도 유익할 수 있다. 광범위한 데이터베이스, 데이터 레이크, 데이터 웨어하우스 등과 상호작용하고 데이터 스트림을 수집한 후 정리하며, 여러 정보를 통합하는 데 뛰어나기 때문이다. 실제로 몇몇 DMP 도구는 실험실, 제조 공장, 정부 기관 등에서 데이터를 수집하고 관리하는데 사용된다.  일부 DMP는 정교한 인포그래픽과 함께 보고서를 생성하는 데 특화되어 있다. 그러나 데이터 수집 및 통합만을 목적으로 하는 DMP가 더 많다. 분석 및 프레젠테이션 작업은 데이터 사이언스와 분석에 특화된 다른 도구가 담당하는 구조다. 한편 최근에는 CDP라는 DMP의 사촌이 발전하고 있다. CDP는 대개 각각의 고객을 추적하기 위해 고안됐다. 광고를 보거나 웹 사...

CMO 디지털 마케팅 데이터 마케팅 2022.06.15

"비즈니스 기회를 포착하고 위험을 완화하는" 행동 분석의 이해

자동차를 사려고 한다. 구매자는 제조사 웹사이트를 방문해 모델의 디자인을 살펴보고, 현지 딜러의 웹사이트에 올라온 매물을 살펴본 다음 대리점을 방문한다. 이때 영업 담당자는 구매자의 요구 사항을 파악하고 최선의 옵션을 제시하기 위해 어떤 정보를 검토해야 할까? 다음과 같은 사례도 생각해 보자. SOC(Security Operation Center)에서 한 직원의 네트워크 활동에 대한 경보를 수신했다. 해당 직원은 평소와 다른 시간에 원격 위치에서 다양한 비즈니스 영역을 알아보면서 일을 하는 것일까? 아니면 SOC의 개입이 필요한 악의적인 행동일까?   위 2가지 상황은 사용자 행동 분석으로 답을 얻을 수 있는 사례다. B2B 및 B2C 판매 증대, 고객 경험 개선, 이상 탐지, 위험 경보, IoT 기기에서 생성되는 데이터를 활용한 위험 식별 등은 행동 분석의 가장 일반적인 사용례다. 나임(KNIME) 수석 데이터 과학자이자 에반젤리즘 책임자인 로사리아 실리포는 행동 분석을 ‘특정 상황에서 사람들의 반응과 행동 패턴을 연구하는 것’이라고 간단히 정의했다.  행동 분석에 있는 비즈니스 기회 행동 분석은 많은 사람이 관여해 수많은 행동을 하는 제품이나 서비스에서 특히 중요하다. 행동 분석으로 결과물을 개선하고 위험을 줄일 수 있다. 가령 대형 전자상거래 웹사이트 고객의 구매 습관, 의료 애플리케이션, 게임 플랫폼, 은행의 자산 관리 업무 등에서 활용할 수 있다. 실리포는 “행동 분석의 목표는 최대한 많은 사람을 연구하는 것이며, 핵심은 많은 데이터를 확보하는 것”이라고 말했다.  아큐멘 애널리틱스(Acumen Analytics)의 CEO 케시 브루너는 한 시장조사 자료를 인용해 전 세계 행동 분석 시장의 규모가 2022년 4억 2,730만 달러에서 2026년 22억 달러에 이를 것으로 예상했다. 연평균 32%의 성장률이다.  브루너는 이런 결과를 비즈니스 기회 측면에서 해석했다. 브루너는 “지금은 행동 분석이 주로 소매...

행동분석 머신러닝 인공지능 2022.06.15

“페이스북, 알고리즘 변경으로 공화당만 이득” 미 대학 공동 연구팀

미국 마이애미 대학교와 라이트 스테이트 대학교의 공동 연구에 따르면, 2018년 페이스북이 알고리즘을 변경한 후, 미국 공화당이 페이스북 상에서 미국 민주당보다 더 높은 반응과 도달 범위를 얻은 것으로 나타났다. 이번 연구는 2016년 1월부터 2021년 8월까지 페이스북과 트위터 상에서 공화당과 민주당의 페이스북 그룹의 활동을 조사했다.   조사 결과, 2018년 말부터 페이스북 상에서 변화가 일어났는데, 같은 변화가 트위터에서는 확인되지 않았다. 연구팀은 공화당의 포스트와 관련한 활동이 가 민주당의 대응 포스트보다 확실하게 증가했다고 밝혔다 심지어 포스트를 더 자주 올린 쪽은 민주당이었다. 또한 페이스북이 알고리즘을 변경한 후, 공화당의 포스트는 민주당의 포스트보다 두 배 더 공유됐다. 이런 패턴을 기반으로 연구팀은 미국 내 정치 문화에 대한 우려를 제기했다. 2021년 미국인 10명 중 7명은 페이스북을 사용하고, 이 중 절반은 매일 사용한다고 밝혔다. 1/3이 넘는 사용자는 매일 페이스북으로부터 메시지를 받는다. 연구팀은 “만약 페이스북의 알고리즘 변경이 페이스북 상에서 양대 정당의 도달 범위에 영향을 미쳤다면, 페이스북이 실수로 또는 의도적으로 미국의 정치 현실에 영향을 미칠 가능성이 있다”고 지적했다. 페이스북은 2018년 알고리즘 변경 당시, “의미있는 소셜 인터랙션(Meaningful Social Interactions, MSI)이란 페이스북 사용자 간의 개인 연결을 강화하는 데 중점을 뒀다고 설명했다. 하지만 결과적으로 대중을 대상으로 한 메시지만 더 커졌고, 페이스북이 부정적인 언급과 혐오 발언에 보상을 제공해 페이스북에서 더 확산되도록 했다. 지난 해 내부 고발자 프란시스 호겐이 공개한 문서에 따르면, 페이스북은 자사 플랫폼의 부정적인 영향을 지나치게 낮게 평가하고 있다. 두 대학 공동 연구팀의 조사는 이런 사실을 확인하는 것으로 보인다. 연구팀이 이런 현상에 대한 다음과 같이 두 가지 가능한 설명을 제시했다. 분노는 소셜...

페이스북 메타 알고리즘 2022.06.14

영국 정부, 공공부문을 위한 디지털 전환 로드맵 공개..."구체적인 관리 체계로 실효성 확보"

영국 정부가 공공부문의 디지털 서비스를 새롭게 혁신하기 위한 디지털 및 데이터 전략안을 공개했다. 이번 전략안은 21가지의 구체적인 목표를 포함하고 있으며, 2025년까지 공무원의 디지털 역량을 강화하고 온라인 행정 절차를 간소화한다는 내용이 주를 이루고 있다.   ‘디지털 미래를 위한 전환: 디지털 및 데이터를 위한 2022-2025 로드맵(Transforming for a digital future: 2022 to 2025 roadmap for digital and data)’이라는 이번 전략안의 목표는 크게 6가지 범주로 나눠져 있으며 ▲올바른 결과를 달성하는 혁신 공공 서비스 ▲정부를 위한 원 로그인(One Login) ▲의사 결정을 위한 더 나은 데이터 ▲안전하고 효율적이며 지속 가능한 기술 ▲대규모 디지털 기술 ▲디지털 전환을 실현하는 시스템이 포함됐다. 구체적으로 살펴보면, 영국 정부는 2025년까지 공공부문에서 가장 많이 이용하는 서비스 중 최소 50%는 업그레이드해서 효율성과 사용성을 높이고, 모바일 기기의 접근성도 높일 예정이다.  ‘원 로그인’ 서비스를 강화하겠다는 내용도 핵심 목표로 제시됐다. 원 로그인은 정부 서비스에서 활용되는 계정 인증 및 로그인 기술로 일반 시민을 위해 개발됐다. 영국 정부는 2023년까지 미리 구축해 놓은 원로그인 전략안과 로드맵을 각 부처가 검토하도록 요청해 2025년까지는 원 로그인의 활용성을 높일 계획이다.  영국 정부는 이번 로드맵을 실행하면 2025년까지 10억 파운드가 넘는 비용을 줄일 수 있다고 설명한다. 행정 처리 과정을 효율화하고 문서 중심의 서비스를 없앨 수 있기 때문이다.  한편 이번 전략안은 중앙 디지털 및 데이터실(Central Digital and Data Office, CDDO)에서 관리 및 감독할 예정이다. CDDO는 내각실 산하 부서로 정부와 관련된 디지털, 데이터, 기술과 관련된 정책 업무를 수행하고 있다.  CDDO의 수석 ...

디지털전환 dx 영국 2022.06.13

컴볼트, 랜섬웨어 대응 위한 ‘인텔리전트 데이터 서비스’ 출시

컴볼트는 랜섬웨어 대응을 위해 보안 기능을 강화한 ‘인텔리전트 데이터 서비스(Intelligent Data Services)’ 11.26 릴리스를 공식 출시했다고 밝혔다.  인텔리전트 데이터 서비스는 외부 공격에 대한 인프라 하드닝과 복구력 향상을 통해 온프레미스와 클라우드, 여러 클라우드 등 모든 인프라 환경 전반에 랜섬웨어를 비롯한 사이버 위협을 완화한다고 업체 측은 설명했다. 업데이트된 주요 기능은 ▲하드웨어 기반 보안 토큰 활용과 공용 액세스 카드(Common Access Card, CAC) 지원을 통한 고객 보안 태세 강화 ▲AWS 키 매니지먼트 시스템(AWS Key Management System, KMS)과 애저 키 볼트(Azure Key Vault) 등 보안성이 뛰어난 클라우드 인증 방식 활용 ▲오브젝트 스토리지 및 빅데이터 파일 시스템까지 지원하는 재해 복구(DR) 오케스트레이션 기능 확장을 통한 대규모 데이터세트 수용 등이 포함된다. 이 중 공용 액세스 카드(CAC) 인증 방식의 경우, 데이터 관리 대시보드를 확인할 수 있는 컴볼트 커맨드 센터와 웹 콘솔 로그인 시에 ‘패스워드 리스(password-less)’ 전략을 토대로 별도 암호를 기입하지 않고도 접속이 가능해 사용자 편의성을 개선한다.  이와 함께 이중(two-factor) 인증 방식을 지원하는 보안 키를 통해 컴볼트 데이터 관리 환경에 보안 수준을 한층 강화할 수 있다. 이는 계정 로그인 시 기존 패스워드와 더불어 수시로 변하는 PIN 코드 또는 하드웨어 보안 키를 연계해 다중 요소(multifactor) 인증을 활용한 방식으로, 단순 패스워드를 기입하는 로그인 방식 대비 컴볼트의 전체 소프트웨어 구성요소인 컴셀(CommCell) 환경을 무단 액세스로부터 보다 효과적으로 보호할 수 있도록 돕는다. 컴볼트 제품 부사장(VP)인 랑가 라자고팔란은 “이번 신규 릴리스 발표는 기존 온프레미스 데이터에 대한 지원을 이어나가는 동시에 견고한 사이버 보안 기준과 클라우...

컴볼트 데이터센터 2022.06.09

대체 데이터에 숨겨진 비용 폭탄 5가지

오늘날 ‘대체 데이터(Alternative Data)’ 소스가 다양한 영역에서 기업의 비즈니스 프로세스에 포함되고 있다. 美 법률회사 로웬스타인 샌들러(Lowenstein Sandler)의 2022년 설문조사 결과에 따르면 헤지펀드부터 사모펀드, 벤처 캐피탈까지 무려 92%의 투자 회사가 의사결정에 정보를 제공하기 위해 중간 또는 상당한 수준으로 대체 데이터를 활용하고 있다고 답했다. 또한 2022년에 대체 데이터 사용이 증가할 것으로 예상됐다.    일반적으로 이는 다른 비즈니스 프로세스에서 나오는 데이터를 말한다. 예를 들면 소셜 미디어 활동, 인공위성 사진, 위치 추적 데이터, 신용카드 거래, 웹 스크랩핑 등이 있다.  대체 데이터는 마케팅부터 영업, 재무, 전략 기획까지 기업 전반에서 사용될 수 있지만, 이런 서드파티 데이터를 소유하고 관리하는 곳은 대부분 IT 부서다. 지난 2019년 포레스터 리서치는 IT 소속의 CIO 및 CDO가 대체 데이터 수집의 56%를 관리하고 있다고 밝혔다.  대체 데이터를 ‘소싱’하고, ‘저장’하며, ‘관리’하는 일은 IT 관리자에게 새로운 과제를 안겨준다. 아울러 불필요하고 상당한 비용을 수반할 수 있다. 여기서는 이에 따른 5가지 문제와 완화하는 방법을 살펴본다.  1. 솔루션 업체 선택 비용(Vendor selection costs) 로웬스타인의 설문조사 결과에 따르면 ‘벤더 선택 비용(61%)’은 대체 데이터 사용자가 가장 우려하는 부분이다. 이 비용은 대체 데이터 벤더를 검토하고, 해당 벤더가 제공하는 데이터의 품질이 충분한지 확인하는 과정에서 발생한다. 이는 특히 데이터가 비즈니스 프로세스의 핵심 요소이며, 쉽게 교체할 수 없을 때 중요하다. 이러한 상황에서 구매자는 벤더가 예측 가능한 미래까지 이 데이터를 지속적으로 제공할 것이라는 확신이 있어야 한다. 이런 위험을 완화하는 방법은 산업 컨소시엄을 조사하여 신뢰할 수 있는 데이터 소스를 식별하는 것이다. ...

대체 데이터 데이터 중심 의사결정 서드파티 데이터 2022.05.24

커리어 로드맵 : 데이터 엔지니어

데이터 엔지니어링은 소프트웨어 엔지니어링과 데이터 과학의 요소를 결합한, IT 영역에서 빠르게 성장 중인 IT 분야 중 하나다. Indeed.com에 따르면, 데이터 엔지니어는 데이터 과학 프로젝트에 사용되는 아키텍처를 개발하고 유지하며 데이터가 서버와 애플리케이션 사이를 중단 없이 흐르도록 한다.  데이터 엔지니어는 다양한 운영체제 및 데이터베이스에 익숙해야 하고 소프트웨어를 쓰고 프로그래밍할 수도 있어야 한다. 데이터 웨어하우스 및 데이터 분석 경험, 그리고 뛰어난 비판적 사고와 커뮤니케이션 역량도 필요하다. 데이터 엔지니어는 교육, 직장 내 훈련, 지속적인 자격증 습득의 조합을 통해 기술력을 쌓을 수 있다. 인디드(Indeed)는 자격증 습득이 자신의 역량을 보여주고 앞서 나가기 위한 좋은 방법이라고 강조한다.  데이터 엔지니어가 되기 위해 무엇이 필요한지를 알아보기 위해 AI 기반의 품질 모니터링 플랫폼 전문업체인 유닛큐(unitQ)의 데이터 엔지니어인 랜스 마일스를 인터뷰했다.    교육과 취업  마일스는 2013년 캘리포니아 산타크루즈 대학에서 신경과학 학사 과정을 졸업한 뒤 2017년 워싱턴 대학에서 데이터 과학 자격증을 취득하고, 2020년에 캘리포니아 버클리 대학에서 정보 및 데이터 과학 석사 학위를 취득했다.  마일스는 “내가 거쳐온 단계를 뒤돌아볼 때 한 가지 큰 영향을 미친 경험이 있다. 대학 마지막 학기의 파이썬 과정이었던 생물학자를 위한 프로그래밍이다. 이 경험이 새로운 열정의 바탕이 됐다”고 말했다.  잘 아는 영역에서 나와 처음부터 시작해야 하는 새로운 영역으로 들어간다는 것은 겁나는 일이었다. 마일스는 매일 코드를 쓰며 방대한 서열 데이터 집합에서 정보를 추출해 단백질 서열의 물리화학적 속성을 계산하기 위한 방법을 개발하고, 유전자의 길이와 위치를 알아내고 바이러스 DNA의 특성을 파악했다.  마일스는 “정리되지 않은 데이터 집합을 간결한 결과로 ...

데이터엔지니어 데이터과학 머신러닝 2022.05.23

"선택 방법부터 톱 10 솔루션까지" 엔터프라이즈 검색 툴의 모든 것

기업에서 생성되는 데이터가 빠르게 증가하면서 이제 데이터 활용과 관리는 모든 기업의 공통된 과제다. 특히 이메일 서버, 데이터베이스, 네트워크 드라이브, 클라우드 드라이브, 그리고 수많은 SaaS 앱에 이르기까지 온갖 곳에 데이터가 저장된 상황에서 직원이 업무에 필요한 정보를 어떻게 찾도록 할 것인가가 큰 문제다. 직원이 생산성을 유지하기 위해 필요한 정보를 찾지 못하면 기업 전체가 효과적으로 기능하지 못하게 된다.   기업에는 작업자가 기업 내의 여러 소스를 대상으로 정보를 검색할 수 있는 툴이 필요하다. 이런 엔터프라이즈 검색 소프트웨어는 HR 정책부터 헬프데스크 문서와 마케팅 자료, 현재 진행 중인 프로젝트 관련 토론에 이르기까지, 정보가 위치한 곳과 관계없이 모든 기업 콘텐츠를 하나의 애플리케이션으로 접근할 수 있도록 지원한다. 이런 툴은 데이터베이스에 저장된 구조적 데이터, 그리고 소셜 미디어 게시물이나 이메일, 채팅, 사물인터넷(IoT) 센서 데이터와 같은 다양한 파일 형식으로 된 비구조적 데이터를 포함한 기업의 모든 데이터 유형에서 정보를 찾고 추출한다. 일부 엔터프라이즈 검색 플랫폼은 전자상거래 또는 고객 서비스 검색과 같은 외부 대면 기능을 핵심 기능의 일부로 포함하거나 추가 모듈로 제공하기도 한다. 여기서는 직원을 위한 지식 관리 툴로서 내부 검색을 중심으로 살펴본다. 포레스터 리서치의 부사장이며 수석 분석가인 마이크 괄티에리는 “엔터프라이즈 검색을 이용하면 기업이 보유한 문서, 콘텐츠, 데이터베이스에서 정보와 지식을 찾을 수 있다. 직원은 필요한 정보에 즉시 액세스할 수 있다”라고 말했다. 업계 애널리스트에 따르면 엔터프라이즈 검색은 직원에게 중요한 비즈니스 질문에 대한 정확한 답과 통찰력을 제공하기 위해 여러 엔터프라이즈 데이터 소스의 데이터를 수집, 정리, 분석해 정보를 합성하는 기술로 발전하고 있다. 포레스터는 이 새로운 검색 범주를 '인지 검색(cognitive search)'으로 지칭하고, 가트너는 '인사이트 엔진...

검색툴 검색 검색엔진 2022.05.18

GS ITM, ‘엑스로그’로 실시간 데이터 동기화 시장 공략 박차

GS ITM은 알투비솔루션의 실시간 데이터 동기화 솔루션 ‘엑스로그(X-LOG)’의 총판으로서 본격적인 시장 공략에 나선다고 밝혔다.   2020년 알투비솔루션과 파트너십을 맺은 GS ITM은 엑스로그 총판으로서 컨설팅과 시스템 구축, 운영 및 기술지원까지 통합 수행하고 있다. 체계적 데이터 관리의 중요성이 대두되면서 영업 역량을 집중한 결과 지난해 매출이 전년 대비 30% 성장하는 성과를 거뒀다고 업체 측은 설명했다. GS ITM은 CDC(Change Data Capture) 기반 실시간 데이터 동기화 시장의 가능성을 확인한 만큼 본격적인 공략에 나서겠다는 계획이다. 분야를 막론하고 빅데이터 활용과 클라우드 이전 범위가 늘어나면서 데이터 관리 수요 역시 증가할 수밖에 없기 때문이다. 엑스로그와 같은 CDC 솔루션은 데이터의 수명 주기, 중요도, 사용 빈도 등을 분석해 대용량 데이터 중 활성 데이터만을 구분해낸다. 단, 외산 솔루션의 경우 도입 및 유지보수 비용이 상대적으로 높고, 특정 DBMS에 대한 종속성 부담도 고려해야 한다. GS ITM은 동급의 성능과 합리적인 비용, 그리고 이기종 DBMS 지원을 앞세워 공격적인 제안을 진행 중이다. 실제로 BMT를 통해 주요 완성차 기업의 수주에 성공한 사례도 있다. 특히, 오라클, 티베로, 포스트그레스큐엘(PostgreSQL) 등 국내외 주요 DBMS와 빅데이터 DB에 대한 복제가 가능해 종속성을 탈피할 수 있으며, 데이터 관리 비용을 상당 부분 절감할 수 있다는 점에서 높은 점수를 받았다고 업체 측은 강조했다. GS ITM은 각 기업의 환경을 고려한 맞춤형 구성을 비롯해 기술 지원을 강화하고, 꾸준한 수요를 보이는 제조와 금융 분야를 중심으로 영업을 확대해 나간다는 계획이다. 또한 지난해 출시된 이기종 DB 초기 적재 솔루션 ‘엑스로그 for IDL’과 데이터 수명주기 관리 솔루션 ‘엑스로그 for ILM’도 활성화한다. GS ITM 이윤석 플랫폼본부장은 “데이터의 폭증과 함께 기업의 데이터...

GS ITM 2022.05.16

한국IDC, “2022년 아태지역 빅데이터 및 분석 지출 19% 성장 전망”

한국IDC(www.idc.com/kr)는 최근 발간한 ‘전 세계 빅데이터 및 분석(BDA) 지출 가이드’에서 일본을 제외한 아시아 태평양 지역의 2022년 빅데이터 및 분석 솔루션 지출이 전년대비 19% 성장할 것이라고 전망했다. 관련 시장 지출은 2025년 1.6배 성장해 533억 달러 규모에 이를 것으로 예상된다. 팬데믹, 불안정한 공급망, 빠르게 진화하는 고객의 요구 등 외부 시장 혼란에 실시간 대응하고 운영 효율성 및 회복탄력성을 확보하기 위한 조직의 빅데이터 및 분석 솔루션 투자가 증가하고 있는 것으로 나타났다. IDC 제시 단칭 카이 부 리서치 디렉터는 “팬데믹에서 러시아-우크라이나 전쟁에 이르기까지 세계는 지난 2년간 전례없는 비즈니스 변화를 경험했다”며 “조직은 데이터 리소스에서 가치를 발굴하고, 증거 기반의 의사 결정, 데이터 사이언스 탐색 그리고 실행 가능한 인사이트의 제공을 위해 보다 명확한 전략을 세워야 할 것”이라고 강조했다.   산업별로 살펴보면, 금융 산업이 향후 5년간 빅데이터 분석 솔루션에 가장 많은 투자를 지속할 것으로 나타났으며, 2022년 전체 지출의 15.3%를 차지할 것으로 분석됐다. 사기 행위 탐지 및 고객 경험 개선에 초점을 맞추어 고객 충성도를 높이기 위한 의도로 해석된다. 통신 산업은 2022년 전체 지출의 12.6%를 기록하며 두 번째로 지출이 많은 산업으로 조사됐으며 2025년까지 2위의 자리를 유지할 전망이다. 네트워크 운영의 효율성과 효과 및 처리량을 개선하고, 다운타임을 감소시키기 위한 인사이트를 도출하기 위해 인프라 및 네트워크에 대한 투자를 적극적으로 하고 있는 것으로 나타났다. 두 산업 모두 전망 기간 동안 연평균 성장률 17%를 넘는 성장을 보일 것으로 기대된다. 현재의 연방 및 중앙 정부가 핵심 인프라 관리와 건강/웰니스 모니터링을 주시하는만큼 전망 기간 말까지 빅데이터 및 분석 솔루션에 대한 투자가 16% 증가할 것으로 예측된다. 금융·통신·연방/중앙정부 및 전문서비스 등 상위...

한국IDC 2022.05.13

"주피터부터 R스튜디오까지" 데이터 과학자의 필수 아이템 8선

데이터 과학의 열기가 식을 줄 모른다. 한때 데이터를 수집하고 분석하는 일은 연구소에 있는 소수의 과학자만 할 수 있다고 여겨졌다. 하지만 이제는 모든 기업이 데이터 과학을 활용해 조직을 간소화하고 고객을 만족시키고 싶어 하며, 데이터 과학 관련 툴 시장은 이런 수요를 충족시키기 위해 빠르게 성장 중이다. 불과 몇 년 전만 해도 데이터 과학자는 명령줄 그리고 몇 안 되는 오픈소스 패키지를 사용했다. 이제는 데이터 과학의 많은 허드렛일(예: 데이터 클렌징 등)을 처리하는 전문 툴이 속속 개발되고 있다.  규모도 변하고 있다. 원래 데이터 과학은 과학자가 열심히 실험한 후 행하는 숫자 작업에 불과했다. 이제 데이터 과학은 워크플로우의 가장 중요한 부분이다. 오늘날 기업은 현황을 신속하게 파악하기 위해 비즈니스 보고에 수학적 분석을 통합하고 대시보드를 구축한다. 아울러 속도도 빨라지고 있다. 한때 연간 또는 분기로 이뤄졌던 분석 작업은 이제 실시간으로 실행된다. 기업들은 관리자와 직원이 현명한 결정을 내릴 뿐만 아니라 데이터 과학이 제공하는 모든 것을 활용할 수 있도록 현재 무슨 일이 일어나고 있는지 파악하고 싶어 한다.  여기서는 끝없는 데이터 흐름 분석에 정확성과 과학을 더하는 주요 툴을 소개한다.    주피터 노트북(Jupyter Notebooks) 단어, 코드, 데이터 묶음은 ‘공통어(lingua franca)’가 됐다. 변하지 않는 분석과 콘텐츠로 채워진 정적 PDF는 영구적 기록을 생성하기 때문에 여전히 가치 있지만, 데이터 과학자는 하부의 메커니즘을 이리저리 손보고 싶어 한다. 주피터 노트북을 사용하면 단순히 정보를 확인하는 것 이상의 일을 할 수 있다. 주피터 노트북은 매스매티카(Mathermatica; 계산용 소프트웨어)의 유연성을 차용하고자 했던 파이썬 사용자에 의해 처음 개발됐다. 오늘날 표준 주피터 노트북은 40개 이상의 프로그래밍 언어를 지원한다(R, 줄리아(Julia), 자바, C 언어가 주를 이...

데이터 과학 데이터 애널리틱스 애널리틱스 도구 2022.05.11

브이엔티지, 제조 현장 데이터 통합 플랫폼 ‘데이터포지’ 개발

브이엔티지(www.vntgcorp.com)가 제조 현장 데이터를 통합 저장해 모니터링할 수 있는 플랫폼 ‘데이터포지(DataForge)’를 개발했다고 밝혔다.    데이터포지는 크게 데이터 저장 툴과 가시화 툴로 구성한 빅데이터 수집·관리 플랫폼이다. 데이터를 초단위로 저장하고 상황을 손쉽게 확인할 수 있다. 특히, 연속 공정인 철강 산업에 편리하다. PLC 제어 데이터나 ERP·MES에 입력된 관리 정보 등을 모니터링해 원하는 형태로 분석할 수 있는 데이터를 제공한다. 브이엔티지는 자체 연구한 태그 표준화 기술을 통해 공장별로 수천개에 이르는 제조 데이터를 체계화했다. 단계별 식별정보를 잇는 ID매칭 기술을 적용했다. 이를 통해 공정별 상황 데이터가 유기적으로 연결된다. 불량 원인이 될 수 있는 설비나 공정 상황을 체크할 수 있다. 데이터 접근 또한 엣지 컴퓨팅과 클라우드 구성을 함께 적용해 활용성을 높였다. 사용자는 별도의 코딩 없이 손쉽게 웹 기반 데이터 대시보드를 꾸밀 수 있어 공정보고서 제작을 위한 기초 데이터를 쉽게 확인할 수 있다. 생산량이나 실적 등을 들여다보고 올바른 작업지시 계획이나 생산 통계를 뽑는 것이 가능하다. 브이엔티지는 제조 현장 디지털 전환(DT) 노하우를 바탕으로 데이터포지를 개발했다. 빅데이터·AI 전문가, 클라우드 기술 인력, 전략 컨설턴트들이 머리를 맞대 데이터 통합 수집·저장·시각화 도구를 한 곳에 담았다. 브이엔티지 관계자는 “데이터 통합 수집과 저장, 사후 분석을 위한 대시보드 제작 등을 모두 아우를 수 있는 원스톱 플랫폼”이라며 “생산부터 출하, 향후 계획까지 담은 제조 인프라를 구축할 수 있다”고 말했다. editor@itworld.co.kr

브이엔티지 2022.05.11

앤시스-BMW 그룹, 자율 주행 시뮬레이션 소프트웨어 공동 개발 확대

앤시스코리아(www.ansys.com/ko-kr)은 본사가 BMW 그룹과 협력을 확대해 ADAS(첨단 운전자 보조 시스템) 및 자동/자율 주행 기능을 개발 및 검증하기 위해 안전 수칙에 맞춰 안내되는 엔드투엔드 시뮬레이션 툴 체인을 공동 개발한다고 밝혔다.   이번 협력 강화를 통해 BMW 그룹은 앤시스의 시뮬레이션 역량을 활용해 L3 단계(조건부 보조 자율주행으로, 운전자는 탑승하지만, 차량 상황에 대한 모니터링은 차량이 주도적으로 하는 상태)의 자율주행 차량을 생산해 고객에게 판매하는 자동차 제조업체 중 하나가 된다. 양사의 협력은 ADAS와 자율 주행 차량(AV) 시스템 안정성을 높여 신차 출시까지 소요되는 기간을 크게 단축시키는 데 핵심적인 역할을 할 것으로 기대된다. 무인 기술은 지도 설정 및 유지 관리, 인간 상호 작용 모방, 기상 조건 및 설계 규정 극복, 사이버 보안 관리를 포함하여 자동차 제조업체에 수많은 문제가 발생되는 복잡한 시스템이다. L3 단계의 자율 주행 기능을 구현하려면 자동차 제조업체는 AV 시스템이 어떻게 작동할지 이해하기 위해 수백만 마일에 걸쳐 실행된 잘 정의된 테스트 데이터를 기반으로 상세한 안전 주행 사례들을 다수 구축해야 한다. BMW 그룹은 자율 주행 테스트 계획을 수립하고, 실행을 모의로 진행해 보고, 데이터에 중요한 시스템 정보를 수집 및 수정을 위한 도구로서 앤시스의 시뮬레이션 소프트웨어 솔루션을 사용할 계획이다. 앤시스 소프트웨어를 사용해 BMW 엔지니어는 시뮬레이션된 워크플로우의 강력한 설계 최적화 및 오케스트레이션(조정)을 보다 신속하게 진행할 수 있다. 앤시스 소프트웨어는 특정 알고리즘을 사용하여 효율적이고 자동으로 검색하고 가장 강력한 설계 구성이 가능해, 설계 프로세스 초기에 중요한 결정을 내리는 데 도움을 주는 것은 물론, 개발 시간을 단축하고 전체 프로젝트 비용을 절감할 수 있도록 지원한다. 앤시스는 BMW 그룹과 함께 자동차 산업에 특화된 과제를 해결하고 향후에도 지속적으로 확대 ...

앤시스 2022.05.04

데이터 복구가 백업보다 오래 걸리는 5가지 이유

데이터 복구 속도가 백업 속도보다 느리다는 데 놀라는 사람들이 많지만 알고 보면 전혀 놀라운 일이 아니다. 오히려 이 시간 차이를 백업 계획에 반영해야 한다. 복구 속도가 일반적으로 백업보다 느린 데는 몇 가지 이유가 있다.     RAID 쓰기 페널티 대부분의 현대 디스크 어레이는 패리티(parity) 기반의 독립 디스크 중복 어레이(RAID)인 RAID 레벨 3~6을 사용해 구축한다. 그 외에 이레이저 코딩(erasure coding)을 사용하는 방법도 있는데 직면하는 어려움은 패리티 기반 RAID와 비슷하다. 패리티 기반 RAID는 어레이에 데이터를 쓸 때 패리티 정보를 계산해야 한다. 같은 어레이에서 데이터를 읽을 때는 이 계산이 불필요하다. 그래서 쓰기보다 읽기 속도가 훨씬 더 빠르다. RAID 레벨 또는 이레이저 코딩에 사용된 설정에 따라서 쓰기 성능 페널티는 미미할 수도, 상당히 클 수도 있다. 어쨌든 이와 같은 어레이에서 얼마간의 쓰기 패널티는 필연적이므로 각자의 환경에서 어느 정도인지 확인해야 한다.   쓰기 시 복사(copy-on-write) 스냅샷 쓰기 시 복사 스냅샷을 사용하는 어레이와 NAS 파일러에도 쓰기 페널티와 비슷한 개념이 적용된다. 쓰기 시 복사 스냅샷을 생성한다는 것은 간단히 비유하면 참조 지점으로 삼을 막대기를 땅에 꽂는 것과 같다. 스냅샷이 처음 생성될 때는 거의 아무런 I/O도 일어나지 않고 모든 무거운 작업은 그 뒤에 실행된다. 스냅샷을 위해 저장해야 하는 블록을 쓰기가 덮어쓰려고 시도할 경우 먼저 해당 블록을 스냅샷 영역으로 복사한 후 쓰기가 허용된다(그래서 '쓰기 시 복사'라고 함) 이 현상은 RAID 쓰기 페널티와 마찬가지로 쓰기에서만 발생한다. 특정 볼륨에 보관 중인 스냅샷의 수에 따라 스냅샷 페널티 역시 상당히 커질 수 있다. 스냅샷이 많을수록 각 쓰기가 진행되기에 앞서 개별 블록을 복사해야 할 가능성도 커진다. 따라서 쓰기 시 복사 볼륨에 스냅샷의 수가 많을수록 새 데이터를 ...

복구 백업 데이터 2022.05.03

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.