Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
TOPIC

빅 데이터

오픈서베이, 설문 데이터 분석 플랫폼 ‘오픈애널리틱스’ 출시

오픈서베이(www.opensurvey.co.kr)가 설문 데이터 분석 플랫폼 ‘오픈애널리틱스’를 출시했다.  오픈애널리틱스는 기존 오픈서베이 결과페이지의 기능과 인터페이스는 유지하고 데이터 분석 업무의 자유도와 편의성을 높인 신제품이라고 업체 측은 설명했다.   오픈애널리틱스에는 매달 40만 부의 설문 응답을 수집하고 분석하는 오픈서베이 소비자 데이터 전문가의 노하우가 집약돼 있다. 또한 오픈애널리틱스의 알고리즘은 통계적으로 의미 있는 데이터를 찾고 완성도 높은 자동 보고서를 작성해준다. 사용자는 이에 들어가는 시간을 줄여 전략과 액션에 더 집중할 수 있게 된다. 오픈서베이는 오픈애널리틱스의 주요 기능을 ▲자유로운 데이터 분석과 공유 기능 ▲알고리즘이 의미 있는 데이터를 읽어주는 스탯인사이트(StatInsight) ▲자유롭게 편집할 수 있는 PPT 보고서 다운로드라고 밝혔다.  오픈애널리틱스는 웹에서 실시간으로 데이터를 분석하고, 저장하고, 공유할 수 있다. 클릭 몇 번으로 세대 간 비교 및 세그멘테이션 등 전문가 수준으로 분석할 수 있으며, 내가 만든 교차분석표를 보관함에 저장해 공동 작업자에게 손쉽게 공유할 수도 있다. 나아가 엑셀, CSV, PDF, 이미지 등의 포맷으로 결과 데이터를 자유롭게 다운로드하는 기능도 제공한다. 스탯인사이트는 오픈서베이 고유 알고리즘이 데이터의 의미를 자동으로 읽어주는 기능이다. 응답자 특성이나 분석 단위 및 대상에 따라서 꼭 봐야 할 중요한 수치를 자동으로 분석해서 알려준다. 이를 통해 통계적으로 의미 있는 데이터를 찾고 해석하는데 드는 시간을 크게 절약할 수 있으며, 데이터 전문가가 아니라도 주요 조사 결과를 손쉽게 파악하고 분석할 수 있다. 오픈애널리틱스는 PPT 보고서 다운로드 기능을 제공한다. 다운로드한 PPT 보고서는 오픈애널리틱스 화면에서 보는 것과 동일한 표와 스탯인사이트로 구성돼 있으며, 바로 보고에 활용해도 손색이 없을 만큼 완성도가 높다. 텍스트·표·그래프 등 요소를...

오픈서베이 2020.09.14

크라우드웍스, ‘2020 데이터 라벨러 현황 보고서’ 발간

크라우드웍스는 국내 데이터 라벨러들의 활동 현황과 실태를 분석한 ‘2020 데이터 라벨러 현황 보고서’를 발간했다. 데이터 라벨러는 인공지능(AI) 학습에 필요한 데이터를 수집하고 가공하는 데이터 라벨링 작업을 전문으로 하는 새로운 직업군이다. 관련 업계에서는 국내에만 20만 명 이상이 종사 중인 것으로 추정하고 있다. 이번 보고서는 크라우드웍스의 15만 활성 회원 데이터와 지난 7월 31일부터 8월3일까지 나흘간 국내에서 활동 중인 데이터 라벨러 2,611명을 대상으로 진행한 온라인 설문조사 결과를 토대로 작성됐다. 직업과 관련해 데이터 라벨러의 절반 이상은 본업을 가지고 있는 다중 직업 종사자인 것으로 나타났다. 데이터 라벨러의 본업으로는 일반 기업에 다니는 직장인의 비중이 가장 높았으며 이어 자영업자, 공무원 순으로 조사됐다. 데이터 라벨링을 주요 결제활동으로 삼고 있는 데이터 라벨러 비율도 40% 이상을 기록했다. 데이터 라벨러의 대다수는 온라인 환경에 익숙하며, 최신 트렌드의 영향을 많이 받는 것으로 조사됐다. 데이터 라벨링에 대한 정보를 처음 알게 된 경로는 네이버와 구글, 유튜브, 인스타그램 등 온라인이 대부분을 차지했다. 지인의 추천을 받아 데이터 라벨링을 시작했다는 비율도 20% 이상으로 나타났다. 국내 데이터 라벨링 시장의 경우 아직은 공급 대비 수요가 우세한 것으로 분석됐다. 데이터 라벨러의 과반수는 데이터 라벨링 작업에 참여하기 위해 플랫폼에 상시 접속하고 있지만 일평균 작업 시간은 2시간 미만으로 집계됐다. 또한 라벨링 작업 선택 기준으로는 수익과 직간접적으로 연관된 보상과 난이도, 시간 등을 고려하는 것으로 나타났다. 작업 데이터 역시 이미지와 텍스트 등 비교적 수집과 가공이 간편한 유형을 선호하는 것으로 조사됐다. 인공지능 기술의 고도화에 따라 적합성과 신뢰성 높은 데이터 수요가 증가하면서 데이터 라벨러의 전문성도 동반 상승하고 있다. 크라우드웍스의 활성 회원 3명 중 1명은 국가공인과 어학 등 전문 자격증을 보유하고...

크라우드웍스 2020.09.02

SK텔레콤, ‘빅데이터 국제회의’서 빅데이터 기반 코로나19 대응 사례 발표

SK텔레콤(www.sktelecom.com)은 9월 2일까지 빅데이터 유엔 글로벌워킹그룹(Big Data UN Global Working Group)과 한국 통계청 주관으로 열리는 ‘제6회 빅데이터 국제회의(6th International Conference on Big Data for Official Statistics)’에서 자사의 빅데이터 플랫폼 ‘지오비전(Geovision)’ 기반 코로나19 대응 사례를 발표한다고 밝혔다. 지난 2014년 창설된 ‘빅데이터 유엔 글로워킹그룹’은 한국, 미국, 일본 등 주요 국가 통계청을 중심으로 구성돼 있으며 ▲빅데이터와 지속 가능한 발전 ▲위성 데이터 및 지리/공간 데이터 ▲모바일 데이터 ▲SNS 데이터 등 다양한 영역의 빅데이터 관련 연구를 공동 시행하고 있다. 이번 빅데이터 국제회의의 주제는 ‘빅데이터가 코로나19 대응에 어떻게 도움이 될 수 있을까’이다. 이번 회의에 참석한 세계 각 국의 통계 전문가들은 코로나 대응 및 향후 지속가능한 성장 추진에 빅데이터가 기여할 수 있는 방법과 협력 방안에 대해 논의한다. SK텔레콤은 이번 회의에서 통계청과 함께 실시한 코로나19 관련 인구 이동 조사 사례를 발표한다. 모바일 빅데이터를 바탕으로 코로나19 발생 후 국민들의 이동(거주하고 있는 시군구를 30분 이상 벗어난 경우)량을 분석한 결과는 정부의 코로나19 확산 대응에 활용됐다. 또한 SK텔레콤은 코로나19 대응 확산 방지를 위해 자사의 빅데이터 기반 실시간 유동인구 분석 서비스 ‘지오비전’을 여러 공공 기관에 무상 제공한 사례를 발표했다. 공공 기관들은 지오비전을 적극 활용, 특정 지역 방역 강화 및 핀포인트 순찰을 시행하는 등 코로나19 확산 방지에 나서기도 했다. 지오비전은 전국 방방곳곳의 유동인구를 5분 단위로 확인할 수 있는 빅데이터 및 공간 데이터 분석 서비스다. SK텔레콤이 자체 개발한 빅데이터 분석 플랫폼 ‘지라프(GIRAF)’를 통해 60테라바이트(TB)에 이르는 방대한 양의 데이터를 5분 단위...

SK텔레콤 2020.08.31

“정보는 제5의 물질” 2245년에 지구 질량의 절반 차지 : AIP

한 이론 물리학자는 디지털 정보를 생성하고 저장하는 데 사용되는 전력과 자원의 양 때문에 데이터를 물리적인 존재로 고려해야만 한다고 주장한다.   포츠머스대학 수석 강사이자 “정보 대재앙(The information catastrophe)의 저자 멜빈 밥슨은 AIP 어드밴스(미국 물리연구소의 연구 간행물)를 통해 디지털 콘텐츠를 고체, 액체, 기체, 그리고 플라스마에 이어 다섯 번째 물질 상태로 간주해야 한다고 주장했다. 데이터를 물리적으로, 그리고 디지털로 생성하고 저장하고 분배하는 데 사용되는 전력과 자원 때문에 데이터는 진화했고, 이제 질량을 가진 것으로 생각해야 한다는 것이다.  밥슨은 또한 디지털 비트가 지구를 압도하게 될 것이며, 결국에는 원자보다 더 많아질 것이라고 주장했다. 디지털 정보에 질량을 매기는 개념은 일부 기존 데이터를 기반으로 한다. 밥슨은 매일 생성되는 데이터의 양이 2,500경 바이트에 달한다는 IBM의 추정치를 인용했다. 그리고 1비트의 크기를 원자 하나의 크기와 비교해 1인치당 1테라비트 이상인 데이터 스토리지의 집적도로 나누었다. 데이터 생성이 매년 50%씩 증가한다고 가정하면, 비트의 수는 약 150년 뒤에는 지구 상의 모든 원자의 수와 같아진다. 밥슨의 연구 결과를 발표하는 보도자료를 통해 “약 130년 뒤면 디지털 정보를 생성하고 유지하는 데 필요한 전력이 행성 지구에서 현재 생산하는 모든 전력과 맞먹을 것이며, 2245년에는 지구 상의 질량 절반이 디지털 정보 질량으로 변환될 것”이라고 추정했다.  또 코로나19 팬데믹은 디지털 데이터 생성 속도를 높여 이 과정을 가속화할 것이라고 덧붙였다. 밥슨은 임박한 포화 지점도 경고했다. “미래 기술 진보가 비트의 크기를 원자 자체의 크기에 가깝게 만든다고 가정하더라도, 디지털 정보의 규모는 지구 전체의 크기 이상을 차지할 것이며, 우리가 정보 대재앙이라고 정의하는 사태가 발생할 것”이라고 설명했다. 전직 씨게이트 테크놀로지 연구개발 과학...

물질 이론물리학 질량 2020.08.31

모비젠, IPO 추진…주관사 선정 나서

지란지교시큐리티의 자회사인 모비젠은 기업공개(IPO) 작업에 착수했다고 밝혔다. 최근 모비젠은 IPO 주관사 선정을 위해 국내 증권사를 대상으로 입찰제안서를 요청했다. 제안서 검토 후 프레젠테이션 등의 과정을 거쳐 9월 초 IPO 주관사를 선정하고 상장 준비에 박차를 가할 계획이다. 모비젠은 데이터 기반의 기업 비즈니스 환경을 제공하는 빅데이터 전문 업체로, 2000년 3월 설립됐다. 독자 개발한 빅데이터 플랫폼 ‘아이리스(IRIS)’를 기반으로 빅데이터 플랫폼 구축을 위한 토털 솔루션을 제공하고 있다. 지난해 수원시청, 대한무역진흥공사, 교통연구원 등 공공 부문에 대형 빅데이터 플랫폼을 연이어 구축하면서 매출 230억 원의 성과를 이뤘다. 이로써 18년 연속 흑자를 기록, 지속적인 성장 곡선을 이어가는 데 성공했다. 최근 데이터 3법 발효와 함께 높아지고 있는 빅데이터 시장 수요에 적극 대응, 사업영역을 확대해 나갈 방침이다. 모비젠은 지난 2017년 보안소프트웨어 전문업체인 지란지교시큐리티의 자회사로 편입됐다. 지란지교시큐리티는 지분 40.8%를 134억 5,000만 원에 인수했다. 양사는 빅데이터, 인공지능 등 4차 산업혁명 시대의 핵심 기술 협력을 통해 신성장 동력 확보에 주력하면서 본격적인 시너지 효과를 창출할 것으로 기대하고 있다.  모비젠 김태수 대표이사는 “이번 IPO 추진은 투자재원 확보를 통한 사업 확장과 추가 성장 가속화가 목적”이라며, “이를 계기로 데이터 경제 시대를 선도하는 국내 대표 빅데이터 전문 기업으로 거듭날 것”이라고 밝혔다. editor@itworld.co.kr

지란지교시큐리티 모비젠 2020.08.27

NH농협은행, 빅데이터 분석 시각화 포털 ‘마이크로스트레티지 솔루션’으로 구축

NH농협은행은 자사 빅데이터 분석 플랫폼인 ‘NH빅스퀘어’의 시각화 포털을 ‘마이크로스트레티지 2020’ 소프트웨어 기반으로 구축했다고 마이크로스트레티지코리아(이하 MSTR)가 밝혔다. 빅데이터 분석 시각화 포털 구축은 NH농협은행이 수립한 빅데이터 추진 로드맵에 따라 2018년 오픈한 NH빅스퀘어 플랫폼의 사용자 접근성 및 분석 지원 강화를 위해 추진됐다. 이번에 NH빅스퀘어에 구축된 마이크로스트레티지 2020 솔루션은 ▲복잡한 데이터 표현을 위한 복합 그리드, 대화형 디자인 및 자유 형식 캔버스 같은 강력한 시각화 기능 ▲200개 이상의 데이터베이스 및 애플리케이션에 대한 커넥터 지원 기능 ▲메타데이터 기반의 엔터프라이즈 시맨틱 레이어를 통한 전사 차원의 보안 및 확장성으로 기존 텍스트 형태 데이터 분석을 사용자가 손쉽게 시각화해 데이터의 가시성 확보 및 분석 편의성을 높여준다. 생성된 분석 결과를 영업점을 포함한 모든 사용자에게 공유해 업무에 바로 활용할 수 있는 채널을 지원하며 외부 데이터 수집 단계에서 비즈니스 프로세스를 개선해 ‘빅스퀘어 비전(외부 데이터 분석결과 조회 화면을 제공하는 웹 기반 채널)’을 통해 업무의 효율성을 향상시킨다. NH농협은행 데이터사업부 정지선 팀장은 “데이터를 기반으로 한 의사 결정 및 분석 문화를 전 지점으로 확산해 급변하는 금융 환경에 민첩하게 대응하고 내부 디지털 역량 강화로 디지털 부문에 앞서가는 핵심 경쟁력을 지속해서 강화하는 게 이번 프로젝트 최종 목표”라며 “마이크로스트레티지 솔루션은 내·외부 변화에 유연하게 대처할 수 있는 핵심 업무의 프로세스를 지원해 비즈니스 효율성을 높였다”라고 말했다. 마이크로스트레티지코리아 양천금 지사장은 “마이크로스트레티지가 비즈니스 인텔리전스 분야에 31년간 독자적으로 성장할 수 있었던 것은 데이터 분석의 글로벌 기술력과 다양한 글로벌 고객 사례가 있었기 때문”이라며, “국내 고객에게 글로벌 선진 기업의 분석 사례를 소개해 기업의 디지털 혁신을 지원하겠다”라고 밝혔다. e...

NH농협은행 마이크로스트레티지 2020.08.14

KT, ABC사업 비전 공유 위한 ‘AI/DX 데이’ 개최

KT(www.kt.com)가 ‘인공지능/디지털혁신 데이(AI/DX 데이)’를 개최하고, ABC(AI, Big data, Cloud)사업 현황과 계획을 임직원들과 공유했다고 밝혔다.  이번 행사는 코로나19 확산방지를 위한 70여 명의 임직원이 거리를 유지한 채 참석했으며, 현장 영상을 KBN(KT 사내방송) 스트리밍 중계로 전 임직원들에게 PC 및 모바일로 실시간 제공했다. KT는 코로나19로 인한 생활과 산업 전반의 변화에 능동적으로 대응하고, 코로나19 극복을 위한 ‘디지털 뉴딜’에 적극 발맞추기 위해 이번 행사를 기획했다고 밝혔다. 처음으로 열리는 KT AI/DX 데이는 ABC사업과 관련해 사내외 성공사례와 추진방향을 KT의 모든 구성원들과 공유하는 자리다.  AI/DX 데이는 KT AI/DX융합사업부문장 전홍범 부사장의 ‘AI에 기반한 디지털혁신 사업’에 대한 기조발표로 시작했다. 세션1에서는 KT에서 ABC사업을 담당하는 임원들이 발표자로 나서 ABC 분야에서 새로운 도전을 강조했다. AI/빅데이터사업본부장 김채희 상무는 ‘AI·빅데이터 사업현황 및 추진방향’을, 인더스트리 AI 플랫폼 TF장 한자경 상무는 ‘산업용 AI 기반의 DX 추진사례’를, 인프라서비스단장 이미희 상무는 ‘AI/DX를 가능케 하는 KT 클라우드’를 주제로 발표했다. 김채희 상무는 기가지니가 2017년 서비스 도입 3년여 만에 250만 이상의 가입자를 확보한 가운데 가정을 넘어 아파트, 호텔, 자동차 등으로 AI의 영역을 넓혀 가고 있다고 설명했다. 또한 AI는 고객센터, 로봇, 식음료, 제조, 물류 등 다양한 분야에 확대 적용 중이라고 밝혔다. 김 상무는 KT의 AI·빅데이터 역량이 4가지 방향으로 확산 중이라고 강조했다. 4가지 방향은 ▲산학연이 참여하는 ‘AI 원팀’을 중심으로 대한민국과 기업들의 AI 경쟁력을 높이는 ‘첨병’ 역할 ▲AI와 GEPP를 결합해 코로나19와 같은 감염병 확산방지에 기여하는 ‘감시자’ 역할 ▲AI와 빅데이터에 기반한...

Kt 2020.08.10

마이데이터허브, 차량정보조회 패키지 API 출시

비즈니스 데이터 API 스토어인 ‘마이데이터허브’를 운영하는 기웅정보통신이 ‘차량정보조회 패키지 API’를 출시했다고 밝혔다.  ‘차량정보조회 패키지 API’는 간단한 소유주 인증절차만 거치면 차량번호 입력을 통해 차량의 사양(등급, 타이어사이즈, 배터리용량 등의 세부 트림 정보)과 차량 모델의 실시간 시세 정보까지 조회할 수 있다. 다양한 기기(웹, 모바일, 서버 등)와 운영환경(윈도우, 리눅스 등)을 지원해 현재 운영중인 서비스/시스템과의 연동이 간편하며, 연동 이후에는 서비스 모니터링, 안전진단, 장애대응 등의 서비스를 제공한다.  이 API의 주요 고객은 자동차담보대출을 취급하는 금융기관, 자동차보험가입 및 손해보상을 취급하는 보험원수사 및 GA, 자동차정보를 활용하고자 하는 핀테크 기업 등이다.  중고차 시세를 계산하고 담보대출에 활용하거나, 트림 정보를 기반으로 맞춤형 타이어 정보를 제공하거나, 차량 트림 선택을 자동화(프로그램화)해 서비스 이탈률을 감소시키거나, 차량번호 입력만으로 보험 만기 전 적합한 보험상품을 추천해주는 등 다양한 비즈니스에 활용할 수 있다. editor@itworld.co.kr

마이데이터허브 2020.08.04

"데이터가 방대하고 복잡할수록" 그래프 데이터베이스에 주목할 이유

20년 전, 필자가 있었던 개발 팀은 채용, 자동차, 부동산 광고에서 검색 가능한 범주를 스캔하는 자연어 처리 엔진을 만들었다. 데이터 관리 문제가 어렵다는 점은 알고 있었다. 광고 형태마다 달라서 데이터가 비교적 간단하다면 자동차 제조사와 모델을 쉽게 알아낼 수 있었지만, 스킬 목록을 기반으로 직업 범주를 파악하는 작업처럼 더 많은 추론이 필요한 경우도 있었다.   검색 가능한 모든 용어를 캡처하는 메타데이터 모델을 개발했지만 자연어 처리 엔진을 위해서는 유의미한 메타데이터 관계를 드러낼 모델이 필요했다. 관계형 데이터베이스의 데이터 포인트 간의 임의적인 연결로 메타데이터 모델을 설계하기는 복잡했으므로 객체 데이터베이스를 사용해서 모델을 관리하는 방안을 살펴봤다.   당시 우리가 객체 데이터베이스로 했던 작업을 지금은 그래프 데이터베이스로 더 효과적으로 할 수 있다. 그래프 데이터베이스는 정보를 노드와 데이터로 저장해서 다른 노드와의 관계를 명시한다. 그래프 데이터베이스는 복잡한 관계를 가진 데이터를 저장하는 용도로 적합성이 입증된 아키텍처다.   지난 10년 동안 기업이 다른 NoSQL 및 빅 데이터 기술에 관심을 가지면서 그래프 데이터 사용도 확실히 증가했다. 2018년 전 세계 그래프 데이터베이스 추정 시장 규모는 약 6억 5,100만 달러이며 2026년에는 37억 3,000만 달러에 이를 것으로 전망된다. 그러나 하둡, 스파크를 비롯한 다른 빅 데이터 관리 기술의 인기와 도입, 프로덕션 사용 사례는 그래프 데이터베이스에 비해 훨씬 더 크게 성장했다. 2018년 빅 데이터 기술 추정 시장 규모는 368억 달러이며 2026년에는 1,043억 달러까지 성장할 것으로 전망된다.   필자는 더 많은 기업이 그래프 데이터베이스를 고려하지 않는 이유가 궁금했다. 개발자는 일상적으로 객체 단위로 사고하고 XML과 JSON으로 된 계층적 데이터 표현을 사용한다. 인터넷이 하이퍼링크, 그리고 소셜 네트워크의 친구, 친구의 친구 같...

그래프데이터베이스 개발자 범주화 2020.07.27

IBM 더 웨더 컴퍼니, ‘네이버’에 전 세계 기상 정보 제공

한국IBM은 자회사인 IBM 더 웨더 컴퍼니가 국내 포털 사이트 ‘네이버’에 전세계 날씨 정보를 제공한다고 발표했다. 이로써 사용자들은 네이버에서 IBM 더 웨더 컴퍼니가 제공하는 해외 도시 기상 정보를 검색할 수 있다.  네이버는 해외 교류의 증가에 따라 특정 도시에 한정해 제공하던 해외 날씨 정보 서비스를 확대할 필요가 있다고 판단했다. IBM 더 웨더 컴퍼니의 기상 데이터를 도입해 더 많은 도시에 대한 다양한 날씨 정보 서비스를 제공함으로써 포털 사용자의 경험과 만족도를 향상시키고자 했다고 업체 측은 설명했다.  네이버 신상희 날씨 서비스 매니저는 “네이버 날씨 정보 서비스는 네이버의 다양한 서비스 중에서 가장 인기있는 서비스 중의 하나”라며, “해외 교류가 증가함에 따라 해외 기상 정보에 대한 네이버 사용자들의 요구가 증가했고, 검색 포털 사이트로서 사용자들에게 가장 신뢰도 높은 정보를 제공할 책임이 있다고 믿기 때문에 IBM의 기상 정보를 제공하게 되었다”라고 밝혔다. 한국IBM 코그너티브 애플리케이션 웨더 비즈니스 솔루션 담당 박송미 상무는 “기상 예보는 기업과 소비자들이 미리 준비하고 대처할 수 있도록 한 나라의 국경을 넘어 지구 전체에 대해 신뢰할 수 있는 정보를 제공해야 한다”며, “기상 데이터를 AI, 클라우드 및 빅데이터 분석과 같은 기술과 결합해 제공하는 IBM과 네이버를 통해 소비자들과 기업들은 보다 신속하고 효과적으로 날씨 관련 의사 결정을 내릴 수 있다”라고 말했다.  IBM 더 웨더 컴퍼니와 같은 일기 예보는 데이터, 수퍼컴퓨팅, 수치 모델과 AI의 융합에 의해 만들어진다. IBM은 테라바이트 단위의 데이터를 100여 개의 날씨 모델과 혼합한 후, AI를 활용해 예측의 시작점을 정확하게 집어낸다. 이 내용은 IBM 기상 서비스를 제공받는 기업과 네이버를 통해 날씨를 확인하는 소비자들에게 배포된다. IBM의 일기 예보는 더 정확한 기상 예측을 위해 글로벌 고해상 기상 예측 시스템(IBM GRAF...

IBM 더 웨더 컴퍼니 네이버 2020.07.27

"NoSQL을 넘어" 분산 SQL의 당위성

처음에는 파일이 있었다. 이후 구조적 파일을 기반으로 한 탐색형 데이터베이스가 나왔다. 그 다음으로 IMS와 CODASYL에 이어 약 40년 전에 최초의 관계형 데이터베이스가 등장했다. 1980년대와 1990년대에 걸쳐 “데이터베이스”는 곧 “관계형 데이터베이스”를 의미했다. SQL이 지배했던 시기다. 이후 객체 지향 프로그래밍 언어가 인기를 끌자 객체 지향 언어와 관계형 데이터베이스 간의 “임피던스 불일치”에 대한 해결책은 데이터베이스에 객체를 매핑하는 것이라고 생각하는 사람들이 나타났다. 그 결과로 나온 것이 “객체 지향 데이터베이스”다. 객체 데이터베이스에서 재미있는 점은 많은 경우 기본적으로 일반 데이터베이스에 객체 매퍼가 내장된 형태였다는 것이다. 이와 같은 데이터베이스의 인기가 식은 후 등장한 진정한 보편적 솔루션이 바로 2010년대의 “NoSQL”이다.     SQL에 대한 공격 NoSQL은 같은 맥락에서 관계형 데이터베이스와 SQL을 모두 공격했다. 이 당시의 가장 큰 문제는 인터넷이 40년 된 관계형 데이터베이스 관리 시스템(RDBMS) 아키텍처의 기반 전제를 무너뜨렸다는 것이다. 이들 데이터베이스는 귀중한 디스크 공간을 절약하고 수직으로 확장되도록 만들어진 것이다.  그런데 사용자 수가 너무 많아져서 하나의 대형 서버로는 감당할 수 없게 됐다. NoSQL 데이터베이스의 중심 개념은 조인(join)이 없고 표준 쿼리 언어도 없고(SQL 구현에는 시간이 소요되므로) 데이터 무결성도 없는 데이터베이스가 있다면, 수평 확장이 가능하고 막대한 볼륨의 데이터를 처리할 수 있다는 것이다. 이렇게 해서 수직 확장의 문제는 해결됐지만 대신 새로운 문제가 발생했다. 온라인 트랜잭션 처리 시스템(OLTP)과 함께 온라인 분석 처리 시스템(OLAP)으로 불린 또 다른 형태의 관계형 데이터베이스가 개발됐다. OLAP 데이터베이스는 관계형 구조를 지원했지만 방대한 데이터가 반환된다는 점을 전제로 쿼리를 실행했다. 1980년대와 19...

NoSQL 데이터베이스 객체지향 2020.07.22

“사용 가능한 비즈니스 데이터의 68%가 방치” 씨게이트 발표

씨게이트 테크놀로지는 1,500명의 글로벌 기업 경영진을 대상으로 조사한 ‘리싱크 데이터(Rethink Data): 엣지에서 클라우드까지–비즈니스 데이터 가치의 극대화’ 보고서를 발간했다.  씨게이트가 의뢰하고 IDC가 조사한 이 보고서(www.seagate.com/our-story/rethink-data)는 데이터 관리의 어려움을 소개하고 이에 대한 해결 방안을 제시했다. 해당 보고서는 비즈니스에 사용할 수 있는 데이터의 68%가 활용되지 않은 채 방치되고 있다는 점을 강조했다. 씨게이트 데이브 모슬리 CEO는 “이번 보고서와 조사를 보면 성공적인 비즈니스를 위해서는 강력한 대량 데이터 작업이 수반되어야 한다는 점을 확실히 알 수 있다”며, “데이터로부터 얻는 가치는 기업의 성공 여부에 직접적인 영향을 미친다”고 강조했다. 보고서에 따르면, 향후 2년간 기업 데이터양이 연간 42.2%의 속도로 증가할 것이라고 예상했고, 기업이 활용 가능한 데이터 중 단 32%만이 사용되고 있으며, 68%는 방치되고 있다고 밝혔다. 데이터를 활용하는 데 있어 최대 걸림돌은 ▲수집된 데이터를 사용 가능하게 만드는 것 ▲수집된 데이터를 저장하는 것 ▲필요한 데이터가 반드시 수집될 수 있도록 하는 것 ▲수집된 데이터의 보안을 보장하는 것 ▲개별로 분산된 수집 데이터를 사용할 수 있는 것으로 나타났다.   향후 2년간 기업이 예상하는 최대 데이터 관리 과제는 멀티 클라우드 및 하이브리드 클라우드 환경에서의 데이터 관리라고 밝혔다. 설문 응답자 2/3는 데이터 보안이 불충분하다고 응답함에 따라, 효율적인 데이터 관리에 있어 데이터 보안이 필수적인 요소로 대두됐다. 이 보고서는 데이터 관리에서 간과되고 있는 데이터 운영 즉 데이터옵스(DataOps)에 초점을 맞추고 있다. IDC는 데이터옵스를 ‘데이터 생성자와 데이터 소비자를 연결하는 제어 능력’이라고 정의했다. 조사에 따르면, 대다수의 응답자는 데이터옵스가 ‘매우’ 또는 ‘극히’ 중요하다는데 동의했...

씨게이트 2020.07.16

데이터 분석 플랫폼을 선택하는 방법

소프트웨어 개발, 데브옵스(devops), 시스템, 클라우드, 테스트 자동화, 사이트 안정성, 스크럼 팀 리더, 정보보안 또는 기타 정보 기술 영역에 이르기까지, 어떤 일을 맡고 있든 관계없이 데이터와 분석, 머신러닝(machine learning)에 대한 기회와 요구사항은 앞으로 함께 늘어날 것이다. 분석은 보통 IT 데이터를 통해 접하게 된다. 예를 들어 애자일(agile), 데브옵스 또는 웹사이트 메트릭스에서 메트릭스와 인사이트를 개발하는 경우가 있다. 데이터, 분석, 머신러닝에 대한 기본적인 기술과 툴을 익히기에 가장 좋은 방법은 이를 자신이 아는 데이터에 적용해 행동을 이끌 수 있는 인사이트를 발굴하는 것이다.  IT 데이터 세계를 벗어나 데이터 과학자 팀, 시민 데이터 과학자, 기타 데이터 시각화와 분석, 머신러닝을 수행하는 비즈니스 분석가에게 서비스를 제공한다면 조금 더 복잡해진다. 먼저 데이터를 로드하고 정제해야 한다. 그 이후에는 데이터의 볼륨, 다양성, 속도에 따라 여러 백엔드 데이터베이스 및 클라우드 데이터 기술에 직면하게 된다. 마지막으로, 수년 전에는 비즈니스 인텔리전스와 데이터 시각화 툴 사이의 간단한 선택이 이제는 분석 및 머신러닝 플랫폼의 전체 라이프라이클에 대한 복잡한 매트릭스로 발전했다. 분석 및 머신러닝이 중요해지면서 여러 영역에서 IT의 책임도 늘어났다. 예를 들면 다음과 같다.   IT는 데이터 통합, 백엔드 데이터베이스, 분석 플랫폼에 대한 서비스를 제공하는 경우가 많다. 데브옵스 팀은 머신러닝 모델에 대한 테스트를 가능하게 하고 이후 프로덕션 데이터 처리를 지원하기 위해 데이터 인프라를 배포, 확장하는 경우가 많다. 네트워크 운영 팀은 SaaS 분석 툴, 멀티 클라우드, 데이터센터 간에 안전한 연결을 설정한다. IT 서비스 관리 팀은 데이터 및 분석 서비스 요청과 사고에 대응한다. 정보보안은 데이터 보안 거버넌스와 구현을 감독한다. 개발자는 분석과 머신러닝 모델을 애플리케이션으로 통...

데이터 데이터분석 머신러닝 2020.07.15

효성인포메이션시스템, 양정규 신임 대표이사 선임

효성인포메이션시스템(www.his21.co.kr)이 양정규 신임 대표이사를 선임했다고 밝혔다. 양정규 대표이사는 30년 이상 IT 업계에 종사해 온 전문가로, 한국전력, 쌍용정보통신, 삼성SDS를 거쳐 효성인포메이션시스템에서 기술 및 금융사업본부를 총괄했다. 2011년부터 2013년까지 효성인포메이션시스템의 대표이사직을 역임한 바 있다. 양정규 신임 대표이사는 “모두가 어려운 시기지만 넥스트 노멀 시대를 대비할 수 있도록, 효성인포메이션시스템은 고객들의 디지털 트랜스포메이션(DX)을 돕는 진정한 동반자로서 노력하겠다”라고 밝혔다. editor@itworld.co.kr

효성인포메이션시스템 2020.07.15

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.