Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
TOPIC

데이터ㆍ분석

"선택 방법부터 톱 10 솔루션까지" 엔터프라이즈 검색 툴의 모든 것

기업에서 생성되는 데이터가 빠르게 증가하면서 이제 데이터 활용과 관리는 모든 기업의 공통된 과제다. 특히 이메일 서버, 데이터베이스, 네트워크 드라이브, 클라우드 드라이브, 그리고 수많은 SaaS 앱에 이르기까지 온갖 곳에 데이터가 저장된 상황에서 직원이 업무에 필요한 정보를 어떻게 찾도록 할 것인가가 큰 문제다. 직원이 생산성을 유지하기 위해 필요한 정보를 찾지 못하면 기업 전체가 효과적으로 기능하지 못하게 된다.   기업에는 작업자가 기업 내의 여러 소스를 대상으로 정보를 검색할 수 있는 툴이 필요하다. 이런 엔터프라이즈 검색 소프트웨어는 HR 정책부터 헬프데스크 문서와 마케팅 자료, 현재 진행 중인 프로젝트 관련 토론에 이르기까지, 정보가 위치한 곳과 관계없이 모든 기업 콘텐츠를 하나의 애플리케이션으로 접근할 수 있도록 지원한다. 이런 툴은 데이터베이스에 저장된 구조적 데이터, 그리고 소셜 미디어 게시물이나 이메일, 채팅, 사물인터넷(IoT) 센서 데이터와 같은 다양한 파일 형식으로 된 비구조적 데이터를 포함한 기업의 모든 데이터 유형에서 정보를 찾고 추출한다. 일부 엔터프라이즈 검색 플랫폼은 전자상거래 또는 고객 서비스 검색과 같은 외부 대면 기능을 핵심 기능의 일부로 포함하거나 추가 모듈로 제공하기도 한다. 여기서는 직원을 위한 지식 관리 툴로서 내부 검색을 중심으로 살펴본다. 포레스터 리서치의 부사장이며 수석 분석가인 마이크 괄티에리는 “엔터프라이즈 검색을 이용하면 기업이 보유한 문서, 콘텐츠, 데이터베이스에서 정보와 지식을 찾을 수 있다. 직원은 필요한 정보에 즉시 액세스할 수 있다”라고 말했다. 업계 애널리스트에 따르면 엔터프라이즈 검색은 직원에게 중요한 비즈니스 질문에 대한 정확한 답과 통찰력을 제공하기 위해 여러 엔터프라이즈 데이터 소스의 데이터를 수집, 정리, 분석해 정보를 합성하는 기술로 발전하고 있다. 포레스터는 이 새로운 검색 범주를 '인지 검색(cognitive search)'으로 지칭하고, 가트너는 '인사이트 엔진...

검색툴 검색 검색엔진 5일 전

GS ITM, ‘엑스로그’로 실시간 데이터 동기화 시장 공략 박차

GS ITM은 알투비솔루션의 실시간 데이터 동기화 솔루션 ‘엑스로그(X-LOG)’의 총판으로서 본격적인 시장 공략에 나선다고 밝혔다.   2020년 알투비솔루션과 파트너십을 맺은 GS ITM은 엑스로그 총판으로서 컨설팅과 시스템 구축, 운영 및 기술지원까지 통합 수행하고 있다. 체계적 데이터 관리의 중요성이 대두되면서 영업 역량을 집중한 결과 지난해 매출이 전년 대비 30% 성장하는 성과를 거뒀다고 업체 측은 설명했다. GS ITM은 CDC(Change Data Capture) 기반 실시간 데이터 동기화 시장의 가능성을 확인한 만큼 본격적인 공략에 나서겠다는 계획이다. 분야를 막론하고 빅데이터 활용과 클라우드 이전 범위가 늘어나면서 데이터 관리 수요 역시 증가할 수밖에 없기 때문이다. 엑스로그와 같은 CDC 솔루션은 데이터의 수명 주기, 중요도, 사용 빈도 등을 분석해 대용량 데이터 중 활성 데이터만을 구분해낸다. 단, 외산 솔루션의 경우 도입 및 유지보수 비용이 상대적으로 높고, 특정 DBMS에 대한 종속성 부담도 고려해야 한다. GS ITM은 동급의 성능과 합리적인 비용, 그리고 이기종 DBMS 지원을 앞세워 공격적인 제안을 진행 중이다. 실제로 BMT를 통해 주요 완성차 기업의 수주에 성공한 사례도 있다. 특히, 오라클, 티베로, 포스트그레스큐엘(PostgreSQL) 등 국내외 주요 DBMS와 빅데이터 DB에 대한 복제가 가능해 종속성을 탈피할 수 있으며, 데이터 관리 비용을 상당 부분 절감할 수 있다는 점에서 높은 점수를 받았다고 업체 측은 강조했다. GS ITM은 각 기업의 환경을 고려한 맞춤형 구성을 비롯해 기술 지원을 강화하고, 꾸준한 수요를 보이는 제조와 금융 분야를 중심으로 영업을 확대해 나간다는 계획이다. 또한 지난해 출시된 이기종 DB 초기 적재 솔루션 ‘엑스로그 for IDL’과 데이터 수명주기 관리 솔루션 ‘엑스로그 for ILM’도 활성화한다. GS ITM 이윤석 플랫폼본부장은 “데이터의 폭증과 함께 기업의 데이터...

GS ITM 7일 전

한국IDC, “2022년 아태지역 빅데이터 및 분석 지출 19% 성장 전망”

한국IDC(www.idc.com/kr)는 최근 발간한 ‘전 세계 빅데이터 및 분석(BDA) 지출 가이드’에서 일본을 제외한 아시아 태평양 지역의 2022년 빅데이터 및 분석 솔루션 지출이 전년대비 19% 성장할 것이라고 전망했다. 관련 시장 지출은 2025년 1.6배 성장해 533억 달러 규모에 이를 것으로 예상된다. 팬데믹, 불안정한 공급망, 빠르게 진화하는 고객의 요구 등 외부 시장 혼란에 실시간 대응하고 운영 효율성 및 회복탄력성을 확보하기 위한 조직의 빅데이터 및 분석 솔루션 투자가 증가하고 있는 것으로 나타났다. IDC 제시 단칭 카이 부 리서치 디렉터는 “팬데믹에서 러시아-우크라이나 전쟁에 이르기까지 세계는 지난 2년간 전례없는 비즈니스 변화를 경험했다”며 “조직은 데이터 리소스에서 가치를 발굴하고, 증거 기반의 의사 결정, 데이터 사이언스 탐색 그리고 실행 가능한 인사이트의 제공을 위해 보다 명확한 전략을 세워야 할 것”이라고 강조했다.   산업별로 살펴보면, 금융 산업이 향후 5년간 빅데이터 분석 솔루션에 가장 많은 투자를 지속할 것으로 나타났으며, 2022년 전체 지출의 15.3%를 차지할 것으로 분석됐다. 사기 행위 탐지 및 고객 경험 개선에 초점을 맞추어 고객 충성도를 높이기 위한 의도로 해석된다. 통신 산업은 2022년 전체 지출의 12.6%를 기록하며 두 번째로 지출이 많은 산업으로 조사됐으며 2025년까지 2위의 자리를 유지할 전망이다. 네트워크 운영의 효율성과 효과 및 처리량을 개선하고, 다운타임을 감소시키기 위한 인사이트를 도출하기 위해 인프라 및 네트워크에 대한 투자를 적극적으로 하고 있는 것으로 나타났다. 두 산업 모두 전망 기간 동안 연평균 성장률 17%를 넘는 성장을 보일 것으로 기대된다. 현재의 연방 및 중앙 정부가 핵심 인프라 관리와 건강/웰니스 모니터링을 주시하는만큼 전망 기간 말까지 빅데이터 및 분석 솔루션에 대한 투자가 16% 증가할 것으로 예측된다. 금융·통신·연방/중앙정부 및 전문서비스 등 상위...

한국IDC 2022.05.13

"주피터부터 R스튜디오까지" 데이터 과학자의 필수 아이템 8선

데이터 과학의 열기가 식을 줄 모른다. 한때 데이터를 수집하고 분석하는 일은 연구소에 있는 소수의 과학자만 할 수 있다고 여겨졌다. 하지만 이제는 모든 기업이 데이터 과학을 활용해 조직을 간소화하고 고객을 만족시키고 싶어 하며, 데이터 과학 관련 툴 시장은 이런 수요를 충족시키기 위해 빠르게 성장 중이다. 불과 몇 년 전만 해도 데이터 과학자는 명령줄 그리고 몇 안 되는 오픈소스 패키지를 사용했다. 이제는 데이터 과학의 많은 허드렛일(예: 데이터 클렌징 등)을 처리하는 전문 툴이 속속 개발되고 있다.  규모도 변하고 있다. 원래 데이터 과학은 과학자가 열심히 실험한 후 행하는 숫자 작업에 불과했다. 이제 데이터 과학은 워크플로우의 가장 중요한 부분이다. 오늘날 기업은 현황을 신속하게 파악하기 위해 비즈니스 보고에 수학적 분석을 통합하고 대시보드를 구축한다. 아울러 속도도 빨라지고 있다. 한때 연간 또는 분기로 이뤄졌던 분석 작업은 이제 실시간으로 실행된다. 기업들은 관리자와 직원이 현명한 결정을 내릴 뿐만 아니라 데이터 과학이 제공하는 모든 것을 활용할 수 있도록 현재 무슨 일이 일어나고 있는지 파악하고 싶어 한다.  여기서는 끝없는 데이터 흐름 분석에 정확성과 과학을 더하는 주요 툴을 소개한다.    주피터 노트북(Jupyter Notebooks) 단어, 코드, 데이터 묶음은 ‘공통어(lingua franca)’가 됐다. 변하지 않는 분석과 콘텐츠로 채워진 정적 PDF는 영구적 기록을 생성하기 때문에 여전히 가치 있지만, 데이터 과학자는 하부의 메커니즘을 이리저리 손보고 싶어 한다. 주피터 노트북을 사용하면 단순히 정보를 확인하는 것 이상의 일을 할 수 있다. 주피터 노트북은 매스매티카(Mathermatica; 계산용 소프트웨어)의 유연성을 차용하고자 했던 파이썬 사용자에 의해 처음 개발됐다. 오늘날 표준 주피터 노트북은 40개 이상의 프로그래밍 언어를 지원한다(R, 줄리아(Julia), 자바, C 언어가 주를 이...

데이터 과학 데이터 애널리틱스 애널리틱스 도구 2022.05.11

브이엔티지, 제조 현장 데이터 통합 플랫폼 ‘데이터포지’ 개발

브이엔티지(www.vntgcorp.com)가 제조 현장 데이터를 통합 저장해 모니터링할 수 있는 플랫폼 ‘데이터포지(DataForge)’를 개발했다고 밝혔다.    데이터포지는 크게 데이터 저장 툴과 가시화 툴로 구성한 빅데이터 수집·관리 플랫폼이다. 데이터를 초단위로 저장하고 상황을 손쉽게 확인할 수 있다. 특히, 연속 공정인 철강 산업에 편리하다. PLC 제어 데이터나 ERP·MES에 입력된 관리 정보 등을 모니터링해 원하는 형태로 분석할 수 있는 데이터를 제공한다. 브이엔티지는 자체 연구한 태그 표준화 기술을 통해 공장별로 수천개에 이르는 제조 데이터를 체계화했다. 단계별 식별정보를 잇는 ID매칭 기술을 적용했다. 이를 통해 공정별 상황 데이터가 유기적으로 연결된다. 불량 원인이 될 수 있는 설비나 공정 상황을 체크할 수 있다. 데이터 접근 또한 엣지 컴퓨팅과 클라우드 구성을 함께 적용해 활용성을 높였다. 사용자는 별도의 코딩 없이 손쉽게 웹 기반 데이터 대시보드를 꾸밀 수 있어 공정보고서 제작을 위한 기초 데이터를 쉽게 확인할 수 있다. 생산량이나 실적 등을 들여다보고 올바른 작업지시 계획이나 생산 통계를 뽑는 것이 가능하다. 브이엔티지는 제조 현장 디지털 전환(DT) 노하우를 바탕으로 데이터포지를 개발했다. 빅데이터·AI 전문가, 클라우드 기술 인력, 전략 컨설턴트들이 머리를 맞대 데이터 통합 수집·저장·시각화 도구를 한 곳에 담았다. 브이엔티지 관계자는 “데이터 통합 수집과 저장, 사후 분석을 위한 대시보드 제작 등을 모두 아우를 수 있는 원스톱 플랫폼”이라며 “생산부터 출하, 향후 계획까지 담은 제조 인프라를 구축할 수 있다”고 말했다. editor@itworld.co.kr

브이엔티지 2022.05.11

앤시스-BMW 그룹, 자율 주행 시뮬레이션 소프트웨어 공동 개발 확대

앤시스코리아(www.ansys.com/ko-kr)은 본사가 BMW 그룹과 협력을 확대해 ADAS(첨단 운전자 보조 시스템) 및 자동/자율 주행 기능을 개발 및 검증하기 위해 안전 수칙에 맞춰 안내되는 엔드투엔드 시뮬레이션 툴 체인을 공동 개발한다고 밝혔다.   이번 협력 강화를 통해 BMW 그룹은 앤시스의 시뮬레이션 역량을 활용해 L3 단계(조건부 보조 자율주행으로, 운전자는 탑승하지만, 차량 상황에 대한 모니터링은 차량이 주도적으로 하는 상태)의 자율주행 차량을 생산해 고객에게 판매하는 자동차 제조업체 중 하나가 된다. 양사의 협력은 ADAS와 자율 주행 차량(AV) 시스템 안정성을 높여 신차 출시까지 소요되는 기간을 크게 단축시키는 데 핵심적인 역할을 할 것으로 기대된다. 무인 기술은 지도 설정 및 유지 관리, 인간 상호 작용 모방, 기상 조건 및 설계 규정 극복, 사이버 보안 관리를 포함하여 자동차 제조업체에 수많은 문제가 발생되는 복잡한 시스템이다. L3 단계의 자율 주행 기능을 구현하려면 자동차 제조업체는 AV 시스템이 어떻게 작동할지 이해하기 위해 수백만 마일에 걸쳐 실행된 잘 정의된 테스트 데이터를 기반으로 상세한 안전 주행 사례들을 다수 구축해야 한다. BMW 그룹은 자율 주행 테스트 계획을 수립하고, 실행을 모의로 진행해 보고, 데이터에 중요한 시스템 정보를 수집 및 수정을 위한 도구로서 앤시스의 시뮬레이션 소프트웨어 솔루션을 사용할 계획이다. 앤시스 소프트웨어를 사용해 BMW 엔지니어는 시뮬레이션된 워크플로우의 강력한 설계 최적화 및 오케스트레이션(조정)을 보다 신속하게 진행할 수 있다. 앤시스 소프트웨어는 특정 알고리즘을 사용하여 효율적이고 자동으로 검색하고 가장 강력한 설계 구성이 가능해, 설계 프로세스 초기에 중요한 결정을 내리는 데 도움을 주는 것은 물론, 개발 시간을 단축하고 전체 프로젝트 비용을 절감할 수 있도록 지원한다. 앤시스는 BMW 그룹과 함께 자동차 산업에 특화된 과제를 해결하고 향후에도 지속적으로 확대 ...

앤시스 2022.05.04

데이터 복구가 백업보다 오래 걸리는 5가지 이유

데이터 복구 속도가 백업 속도보다 느리다는 데 놀라는 사람들이 많지만 알고 보면 전혀 놀라운 일이 아니다. 오히려 이 시간 차이를 백업 계획에 반영해야 한다. 복구 속도가 일반적으로 백업보다 느린 데는 몇 가지 이유가 있다.     RAID 쓰기 페널티 대부분의 현대 디스크 어레이는 패리티(parity) 기반의 독립 디스크 중복 어레이(RAID)인 RAID 레벨 3~6을 사용해 구축한다. 그 외에 이레이저 코딩(erasure coding)을 사용하는 방법도 있는데 직면하는 어려움은 패리티 기반 RAID와 비슷하다. 패리티 기반 RAID는 어레이에 데이터를 쓸 때 패리티 정보를 계산해야 한다. 같은 어레이에서 데이터를 읽을 때는 이 계산이 불필요하다. 그래서 쓰기보다 읽기 속도가 훨씬 더 빠르다. RAID 레벨 또는 이레이저 코딩에 사용된 설정에 따라서 쓰기 성능 페널티는 미미할 수도, 상당히 클 수도 있다. 어쨌든 이와 같은 어레이에서 얼마간의 쓰기 패널티는 필연적이므로 각자의 환경에서 어느 정도인지 확인해야 한다.   쓰기 시 복사(copy-on-write) 스냅샷 쓰기 시 복사 스냅샷을 사용하는 어레이와 NAS 파일러에도 쓰기 페널티와 비슷한 개념이 적용된다. 쓰기 시 복사 스냅샷을 생성한다는 것은 간단히 비유하면 참조 지점으로 삼을 막대기를 땅에 꽂는 것과 같다. 스냅샷이 처음 생성될 때는 거의 아무런 I/O도 일어나지 않고 모든 무거운 작업은 그 뒤에 실행된다. 스냅샷을 위해 저장해야 하는 블록을 쓰기가 덮어쓰려고 시도할 경우 먼저 해당 블록을 스냅샷 영역으로 복사한 후 쓰기가 허용된다(그래서 '쓰기 시 복사'라고 함) 이 현상은 RAID 쓰기 페널티와 마찬가지로 쓰기에서만 발생한다. 특정 볼륨에 보관 중인 스냅샷의 수에 따라 스냅샷 페널티 역시 상당히 커질 수 있다. 스냅샷이 많을수록 각 쓰기가 진행되기에 앞서 개별 블록을 복사해야 할 가능성도 커진다. 따라서 쓰기 시 복사 볼륨에 스냅샷의 수가 많을수록 새 데이터를 ...

복구 백업 데이터 2022.05.03

MS 데이터 관리 솔루션, '퍼뷰' 프레임워크로 통합된다

마이크로소프트의 주요 데이터 관리 솔루션 대부분이 '퍼뷰(Purview)' 브랜드로 통합된다. 애저 퍼뷰(Azure Purview)와 마이크로소프트 365(Microsoft 365) 컴플라이언스 기능을 결합해 데이터 거버넌스와 리스크 관리를 위한 단일 프레임워크를 완성한다는 구상이다.   이에 따라 여러 가지 개별 제품의 이름이 바뀐다. 대부분 마이크로소프트 365 제품군에 속한 것으로, 새로운 '마이크로소프트 퍼뷰' 브랜드에 맞추게 된다. 업체는 이번 통합으로 멀티클라우드와 멀티플랫폼 환경을 운영하는 기업이 데이터 거버넌스 기술을 더 쉽게 도입할 수 있을 것으로 기대하고 있다. 마이크로소프트는 이외에도 조직 구조를 바꾸고 리브랜딩하는 작업을 진행 중이다. 최근에는 맥OS 엔드포인트용 데이터 손실 방지 기술을 공개했고 민감한 정보 타입 카테고리에 50가지 이상의 새로운 분류기를 추가했다. 마이크로소프트 퍼뷰 라이프사이클 매니지먼트(Microsoft Purview Lifecycle Management, 이전까지 마이크로소프트 인포메이션 거버넌스(Microsoft Information Governance)라고 불렸다)용 멀티스테이지 리텐션 기능의 퍼블릭 프리뷰도 내놓았다. 또한, 마이크로소프트는 2가지 신기능의 프리뷰를 공개했다. 하나는 iOS나 안드로이드를 사용하는 모바일 기기에서 암호화된 문서를 공동으로 만들 수 있는 기능이고, 다른 하나는 특정 앱이 미리 지정한 데이터에만 접근할 수 있도록 개별적으로 제한하는 윈도우 엔드포인트용 앱 그룹화 기능이다. 리스크 관리와 법률 담당 임원을 위한 제품 개선 사항도 있다. 인사이더 리스크 매니지먼트(Insider Risk Management)의 탐지 및 조사 기능이 업그레이드됐고, 이제 이디스커버리(eDiscovery) 제품을 통해 관련 팀즈(Teams) 데이터를 식별할 수 있다. 커뮤니케이션 컴플라이언스(Communication Compliance)는 운영 원칙을 어긴 코드나 민감 정보를 공유하는 것...

퍼뷰 데이터관리 보안 2022.04.21

아크로니스, 마리아DB 백업 및 복구 기능 확장

아크로니스(www.acronis.co.kr)는 오픈소스 데이터베이스관리시스템(DBMS) 소프트웨어 기업인 마리아DB와 파트너십을 맺고, 마리아DB 데이터베이스에 백업 및 복구 기능을 제공한다고 밝혔다   아크로니스 사이버 프로텍트 클라우드(Acronis Cyber Protect Cloud)용 어드밴스드 백업(Advanced Backup) 팩이 제공하는 새로운 기능을 사용해, 서비스 제공업체(SP)는 마리아DB 관리 기술에 대한 전문 지식 없이도 고객의 마리아DB 데이터베이스에서 가장 중요한 데이터를 백업해 보호할 수 있게 되었다고 업체 측은 설명했다. 마리아DB 서비스 제공업체는 아크로니스 사이버 프로텍트 클라우드로 마리아DB 데이터베이스의 전체 또는 세분화된 복구 서비스를 제공할 수 있다. 복구가 필요할 때 전체 워크로드를 확인할 필요 없이 데이터와 테이블을 빠르게 탐색하고 복구할 수 있다. 이 세분화된 복구는 인스턴스, 데이터베이스 및 테이블 수준에서 지원되므로 서비스 공급업체가 RTO(복구 시간 목표)를 줄이고 다운타임을 최소화하면서 클라이언트의 가장 중요한 데이터에 안전하게 액세스 할 수 있도록 높은 유연성을 제공한다. 아크로니스는 아크로니스 사이버 프로텍트 클라우드의 백업 및 복구 기능을 마리아DB로 확장함으로써, 기존 마이크로소프트 SQL 서버, 오라클 DBMS 및 SAP HANA, MySQL을 포함해 오픈소스 데이터베이스에 대한 사이버 보호 범위를 확장할 수 있게 되었다. 아크로니스 사이버 프로텍트 클라우드를 사용하면 서비스 제공업체가 이미 익숙한 아크로니스 사이버 프로텍트 클라우드 콘솔을 통해 마리아DB를 사용하는 모든 클라이언트를 원활하게 지원해, 마리아DB 데이터베이스 백업을 쉽게 실행할 수 있다. 아크로니스 코리아 고목동 지사장은 “아크로니스의 광범위하고 포괄적인 사이버 보호 접근 방식의 일환으로 완전한 데이터 보호를 통해 파트너인 서비스 제공업체가 고객의 데이터, 애플리케이션 및 시스템을 안전하게 유지하는 데 도움이 될...

아크로니스 마리아DB 2022.04.14

“SQL을 넘어” 데이터 쿼리를 위한 8가지 새로운 언어

지난 30년 동안 데이터베이스와 SQL(Structured Query Language, 구조적 쿼리 언어)는 거의 동의어로 사용됐다. 데이터베이스에서 정보를 추출하려면 누구나 SQL을 배워야 했고 데이터베이스에 관심이 있거나 데이터베이스 관리자를 직업으로 선택하는 누구나 SQL의 복잡한 구문을 마스터해야 했다.    SQL 자체는 예전 방식, 즉 메인프레임 사용자들이 했던 방식대로 생각하고 코딩하는 계기가 된다. 온 세계가 소문자를 받아들이는 동안에도 SQL 사용자들은 SELECT, WHERE와 같은 단어를 계속 사용했다. 틱톡에는 이를 두고 왜 항상 고함을 질러야 하는지 물으며 조롱하는 사람들도 있지만, SQL 사용자 대부분은 그런 조롱에 신경 쓰지 않는다. 넥타이와 반팔 셔츠를 입고 펀치카드를 다뤘던 사람들이 전체 대문자를 아무 문제없이 사용했다면, 곰인형 무늬 잠옷을 입고 일하는 지금의 재택 근무자도 아무 문제없이 사용할 수 있다.  그러나 데이터 불러오기 영역에서 SQL의 입지는 조금씩 좁아지고 있다. 새로운 데이터베이스가 등장하고 있으며, 그중 일부는 완전히 새로운 언어를 사용한다. 그렇다고 SQL의 인기가 떨어지는 것은 아니다. 오히려 지금 SQL은 과거 어느 때보다 많이 쓰이고 있다. 단지 데이터 스토리지 세계가 그보다 더 빠른 속도로 성장하면서 그 여파로 실험과 새로운 분기가 활발히 이뤄지고 있을 뿐이다.  여기서는 데이터를 불러오기 위한 8가지 새로운 접근 방법을 소개한다. 외형적인 부분에 국한되는 혁신도 있다. 어떤 개발자는 조금 더 깔끔하고 읽기 쉽도록 SQL 구문을 업데이트해서 브라우저를 위한 코드 쓰기와 데이터 불러오기 사이에서 작업을 전환할 때의 부조화를 완화했다. 이런 툴의 제작자는 기반 구조가 사실상 SQL과 동일하다는 점을 강조한다. 배우기도 여전히 쉬우므로 걱정하지 않아도 된다.  완전히 다른 사고 방식으로의 전환이 필요한 툴도 있다. 그래프 또는 시계열로 비트를 저장하는 데...

SQL 쿼리 그래프QL 2022.04.01

"오라클부터 포스트그레SQL까지" DBMS 7종 추천 백업 방법과 이유

데이터베이스 백업 방법은 다양하고, 데이터베이스와 데이터베이스 작동 방식에 따라 최선이 무엇인지도 달라진다. 이런 고민에 도움이 되도록 7가지 데이터베이스를 위한 추천 백업 방법과 이유를 정리했다.     오라클  오라클 백업 방법은 많지만 대체로 리커버리 매니저(Recovery Manager, 또는 RMAN)를 사용한다. RMAN은 실제 이 툴이 호출하는 명령의 이름이기도 하다. RMAN은 이전 증분 백업을 전체 백업에 병합하는 기능을 지원하므로 여러 전체 백업을 만들지 않고도 다양한 복구 지점을 둘 수 있다. RMAN은 효율적인 덤프 앤 스윕(dump and sweep) 백업 옵션이지만 전체 백업과 일련의 증분을 모두 저장하기 위해 꽤 많은 디스크 공간이 필요하다. 디스크 공간이 부족하면 백업 전에 SQL 명령 alter database begin backup을 사용하고 백업 후 alter database end backup을 사용하면 된다. 참고로 윈도우에서 오라클을 사용하면 볼륨 섀도 복사본 서비스(VSS)와 통합되므로 스크립트 없이 핫 백업을 할 수 있다. RMAN 이미지 옵션과 덤프 앤 스윕 방식을 조합하면 복구 속도를 극대화할 수 있다.   SQL 서버  backup database 명령을 이용하면 디스크(덤프 앤 스윕), 애저(클라우드 백업)로 데이터베이스 또는 트랜잭션 로그의 전체 또는 증분 백업을 자동화하거나 서드파티 백업 툴로 바로 스트리밍할 수 있다. 오라클과 마찬가지로 SQL 서버 역시 윈도우에서 VSS를 사용해 핫 백업이 가능하다. VSS 방법으로 VM 백업을 쉽게 통합할 수 있으며, 디스크 스테이징 영역이 필요 없는 장점이 있다. 대부분 DBA가 덤프 앤 스윕 방식을 선호한다.    DB2  backup database 명령을 사용해 DB2 데이터베이스와 트랜잭션 로그의 전체 또는 증분 백업을 디스크에 수행하거나(덤프 앤 스윕), 서드파티 백업 툴로 바로 스...

DBMS 백업 2022.03.29

"성급하면 결국 골칫거리 된다" 데이터베이스 선택 팁 5가지

데이터베이스 선택은 먼 미래의 애플리케이션과 개발에까지 큰 영향을 미친다. 그런데도 개발자의 데이터베이스 선택은 감정적으로 흐르는 경향이 있고, 오로지 지금의 애플리케이션 요구사항만을 기준으로 데이터베이스를 고르는 경우가 많다.    예를 들어 어떤 데이터베이스에 대한 느낌이 좋다는 이유로 개발자는 단순히 직감을 따르곤 한다. 데이터베이스가 현재와 미래의 애플리케이션에 맞게 효과적으로 작동할지에 대한 분석은 생략한다. 선택할 수 있는 데이터베이스가 너무 많아 비교할 엄두를 내지 못하는 때도 있다. 이럴 때는 사고가 마비되고 결국 현재의 애플리케이션에 필요한 요소를 충족하는 데이터베이스를 선택하게 된다.  문제는 미래의 모든 애플리케이션 요구사항을 미리 알 수 없다는 것이다. 보통 애플리케이션은 처음에는 단순하게 시작했다가 시간이 지날수록 복잡해지기 마련이다. 실제로 많은 개발자가 포스트그레SQL로 시작한다. 반구조적 데이터를 다뤄야 하고 유연한 스키마가 필요해지면 몽고DB를 추가한다. 그런 다음 로그 검색이나 패싯 검색을 하기 위해 일래스틱서치(Elasticsearch)로 눈을 돌린다. 하지만 속도가 매우 빠르지 않다는 것을 발견하고, 레디스(Redis)를 캐시로 덧붙인다. 분석을 해야 할 때가 오면 스노우플레이크(Snowflake)와 같은 데이터 웨어하우스를 불러들인다. 결국 모든 상황이 이내 혼란스럽게 된다. 데이터베이스 난립으로 데이터베이스 간의 데이터 이동과 값비싼 ETL(추출, 변환, 로드) 프로세스가 개발자의 걱정거리가 된다.  이처럼 많은 개발자가 종종 실패의 길로 걸어가지만 필요한 모든 것을 얻을 수 있는 다른 방법도 있다. 모든 요구사항을 충족하는 데이터베이스를 선택하는 방법을 알아보자.    한 치 앞이 아니라 먼 미래를 보라 데이터베이스 마이그레이션과 플랫폼 변경은 간단한 일이 아니다. 데이터베이스를 한 번 선택하면 되돌리기 어렵고 한 아키텍처에 종속될 수 있음을 항상 의식해야 ...

데이터베이스 2022.03.22

마이크로스트레티지, ‘도요타 아스트라 모터’에 분석 플랫폼 구축

마이크로스트레티지코리아는 도요타 인도네시아 법인 ‘도요타 아스트라 모터(Toyota Astra Motor)’에 자사의 분석 플랫폼을 구축했다고 밝혔다. 도요타 아스트라 모터는 데이터 통합의 중요성을 인식하고, 몇 가지 주요 비즈니스 과제를 해결하고자 했다. 이러한 과제에는 최신 정보를 기반으로 하는 보고서 및 데이터의 시각화, 추정에 기초한 데이터가 아닌 실제 데이터를 활용한 분석, 정확한 예측 생성 등이 포함된다. 이러한 과제를 해결하기 위해 도요타 아스트라 모터는 마이크로스트레티지의 분석 플랫폼을 구축했다. 도요타 아스트라 모터의 최고정보책임자(CIO) 윌버투스 다르마디는 “모든 자동차 매장의 전 차량 모델 및 유형에 대한 판매 데이터를 시각화하는 것은 필수 사항이며, 이것이 이뤄지지 않는 경우 큰 문제가 된다”며, “마이크로스트레티지는 데이터를 효율적으로 대조, 시각화, 분석하여 예측 및 전망을 제공하는 동시에 처방적 전략을 사전에 채택할 수 있도록 지원한다”고 말했다. 마이크로스트레티지의 분석 플랫폼 구축 이후, 도요타 아스트라 모터의 비즈니스 개발 팀은 영업 성과를 실시간 모니터링하고, 상호 비교를 위해 히스토리 데이터를 안정적으로 활용하며, 통찰력을 기반으로 수집한 실행 가능한 정보를 통해 자동차 매장을 보다 효율적으로 운영할 수 있게 되었다. 결과적으로 도요타 아스트라 모터는 마이크로스트레티지에서 제공하는 대시보드 및 솔루션을 기반으로 판매량을 보다 체계적으로 예측할 수 있게 되었다. 또한, 데이터 수집에서 분석에 이르기까지 전체 프로세스가 자동으로 간소화되어 사용자들의 액세스가 용이해졌고, 효율성도 크게 향상되었다. 또한, 대시보드 생성 및 분석에 대한 리드 타임이 단축되고, 데이터가 자동 업데이트되며, 모바일 및 웹 기반 애플리케이션에 대한 용이한 액세스를 제공할 수 있게 되었다. 한편, 국내 제조업에서는 삼성전자, LG전자, LG화학, LG 에너지솔루션, 현대자동차, SK가스 등이 마이크로스트레티지 플랫폼을 도입했다.  ed...

마이크로스트레티지 2022.03.17

블로그 | 공공 데이터의 영향력 확대에 앞서 해결해야 할 과제들

지난 20년 동안의 슬로건이 오픈소스였다면 향후 20년의 목표는 ‘공공 데이터(Open Data)’가 될지도 모른다. 단, 공공 데이터가 무슨 뜻인지 그 의미를 정확히 파악할 수 있어야 할 것이다. 필자는 최근 트위터에 공공 데이터의 중요성과 확보 방법을 이야기하고 좋은 반응을 얻었다. 그럼에도 모든 사용자가 각기 다른 것을 응원하는 것 같았다. 좋든 싫든, 오픈소스는 OSI(Open Source Initiative)의 노력으로 상대적으로 표준화된 것을 의미하게 되었다. 그러나 공공 데이터에는 이런 조직이 존재하지 않는다. 누군가 공공 데이터에 대한 표준을 설정해야 한다는 생각이 들었다. 오픈소스를 넘어선 공공 데이터는 다음 컴퓨팅 시대를 정의할 것이다. 하지만 공공 데이터는 과연 어떤 의미일까? 디르크 리엘 교수가 말한 것처럼 앞으로 20년 후에도 같은 질문을 던지고 있을까?     소스와 표준 기업이 소프트웨어/소스가 아니라 관리형 서비스를 원하는 클라우드 시대에 오픈소스가 특징을 잃어버렸다는 주장은 잘못된 가정이다. 오픈소스가 관찰가능성 영역의 오픈 텔레메트리(Open Telemetry) 또는 데이터베이스의 PostgreSQL 같은 표준을 조성하는 데 도움이 되기 때문이다. 오픈 텔레메트리가 일부 표준기관이 몇 년 동안 접근성 등에 대한 규칙을 정의한 표준이라는 의미는 아니다. 다양한 제공업체가 자체적인 배포판 또는 부가 소프트웨어/서비스를 위한 보편적인 시작점으로써 수용하는 프로젝트라는 의미이다. 소프트웨어가 (OSD(Open Source Definition) 하의) 오픈소스일 필요는 없지만 도움은 분명히 된다. 예를 들어, SQL 덕분에 다양한 제공업체에서 호환되는 여러 제품이 등장한 것이 사실이다. 효과도 있는 것 같다. 제공업체가 마이크로소프트 윈도우 같은 순수 전매 특허 소프트웨어를 판매하는 것도 마찬가지다. 2020년 AWS에서 근무할 때에는 윈도우가 마이크로소프트 애저가 아니라 AWS에서 가장 잘 구동되는 이유에 관...

공공데이터 2022.03.10

아비바, 5월 ‘아비바 PI 월드 2022’ 개최…"산업 혁신을 위한 데이터 핵심 역할 제시"

아비바(www.aveva.com/ko-kr)가 ‘아비바 PI 월드(AVEVA PI World)’ 컨퍼런스를 5월 16일부터 19일까지 네덜란드 암스테르담 RAI 컨벤션 센터에서 개최한다고 밝혔다.    이번 행사에는 옥스퍼드 대학 산하 웰컴 연구소의 캐서린 그린 박사와 켈로그, 코그니전트 및 마이크로소프트 등의 글로벌 기업 담당자들이 참석해, 기업들이 어떻게 데이터와 AI를 기반으로 인사이트를 공유하고 빠르게 변화하는 시대에 혁신을 주도하며 민첩성과 탄력성의 새로운 기준을 설정하는지에 대해 설명할 예정이다.  또한, 이번 행사에서는 아비바 솔루션을 활용하여 데이터에서 실제 활용 가능한 인사이트를 도출하고 경쟁력을 강화함으로써 혁신의 가속화하는 방안도 직접 확인할 수 있다고 업체 측은 설명했다. 아비바 PI 월드 2022에서는 기업들이 데이터를 활용해 위기를 기회로 전환하는 방법을 알아보고, 자동화 기술의 이점을 극대화하는데 있어 인간의 인사이트가 왜 중요한지에 대해 심도 있게 논의할 예정이다. 이번 행사에서 아비바 피터 허웍 CEO는 상호 연결된 디지털 인사이트가 에코시스템 전반에 걸쳐 가치를 창출하는 방식 및 데이터 기반의 실제 비즈니스 운영 사례를 발표한다. 또한 옥스퍼드 대학 웰컴 인류 유전학 센터의 캐서린 그린 박사는 데이터가 옥스퍼드 백신 개발에 도움을 준 방법 및 기업이 주목해야 하는 내부 패러다임을, 인플루언서 겸 전 유엔 청소년 대표단의 자힌키 비셀링크는 차세대 산업 인력으로서 Z세대가 디지털 사고방식을 고취시키는 방법에 대해 논의한다.  아비바 정보 부문 EVP 및 롭 맥그리비 운영 부문 EVP인 로난 드 후지는 아비바 데이터 허브에 통합된 PI 시스템이 고객을 위한 가치 제고를 가속화하는 방법 및 아비바 솔루션의 로드맵을 설명하고, 아비바 리사 존스턴 최고마케팅책임자 겸 최고지속가능성책임자는 뉴노멀 시대, 성공을 위한 디지털 탄력성 강화 전략 패널 세션을 진행할 예정이다.  editor@...

아비바 2022.03.02

마크비전-KOCLA, 글로벌 콘텐츠 IP 보호 데이터베이스 구축 위해 협력

마크비전이 한국문화콘텐츠라이선싱협회(KOCLA)와 함께 글로벌 콘텐츠 IP(지식재산권) 보호를 위한 데이터베이스 구축에 나선다고 밝혔다.   지난 28일 MOU를 체결한 마크비전과 KOCLA는 오픈마켓, 쇼핑몰 등 국내외 이커머스 플랫폼에서 유통되고 있는 위조상품 현황 데이터를 분석하고, 효과적으로 대응할 수 있는 콘텐츠 IP 보호 전략 수립을 위해 협력한다는 방침이다.  2005년 설립된 KOCLA는 로보트태권브이, 마시마로, 코코몽, 뽀로로, 뿌까, 마린블루스, 둘리 등 국내 대표 캐릭터들의 저작권자를 회원사로 보유하고 있으며, 캐릭터 크리에이터 시장 및 콘텐츠 산업 활성화에 주력하고 있다. 양사는 KOCLA 회원사들의 캐릭터&콘텐츠 IP를 중심으로 ▲글로벌 이커머스 플랫폼에서 유통되는 K 콘텐츠 위조상품 현황 분석, ▲빅데이터 기반의 콘텐츠 IP 보호 전략 수립 등에 관해 적극적인 협력을 이어간다는 방침이다. 마크비전은 이번 협약을 통해 캐릭터 무단도용과 관련된 다양한 사례 및 분석 데이터를 확보, 플랫폼의 정밀도를 한단계 높이고, KOCLA 회원사들의 IP 비즈니스 전략 도출에도 많은 도움을 줄 수 있게 됐다. 마크비전은 현재, 26개국 100여 개에 달하는 이커머스 사이트에서 위조상품 적발 및 삭제 신고를 자동화해주는 AI 기반 모니터링 서비스 ‘마크커머스(MARQ Commerce)’와 온라인상의 불법 콘텐츠를 감식하고 차단해주는 ‘마크콘텐츠(MARQ Contents)’ 플랫폼을 운영 중이다. 고도화된 SaaS 플랫폼 역량을 바탕으로 산업 협회 및 기관 단체들과의 파트너십을 지속적으로 확대하면서, 브랜드 및 콘텐츠 지식재산권 보호에 관한 인사이트 도출과 글로벌 비즈니스 전략 컨설팅을 제공하고 있다. 마크비전 이도경 한국대표는 “최근 몇 년 사이 K콘텐츠의 위상이 전세계적으로 높아지면서, 각종 온라인 플랫폼을 통해 캐릭터 IP가 침해되는 사례가 급증하고 있다”며, “저작권자들의 지식재산권을 효율적으로 보호할 수 있는...

마크비전 2022.03.02

스트리밍 데이터 플랫폼을 선택하는 방법

스트리밍 데이터는 보통 센서, 서버 로그와 같은 수많은 데이터 소스에 의해 지속적으로 생성된다. 스트리밍 데이터 레코드는 대체로 작아서 각각 몇 킬로바이트에 불과하지만, 수가 많고 끊임없이 이어진다. 여기서는 스트리밍 데이터에 대한 기본 정보와 함께 스트리밍 데이터 플랫폼을 선택하는 방법을 알아본다.      스트리밍 데이터 플랫폼은 어떤 식으로 움직이는가?  흡수(Ingesttion) 및 데이터 내보내기(Export). 일반적으로 데이터 흡수와 데이터 내보내기는 모두 외부 시스템에 특화된 데이터 커넥터에 의해 처리된다. 경우에 따라서는 목적지에 맞게 데이터를 재정렬, 정제, 조절하기 위해 ETL(extract, transform, load 추출, 변환, 로드) 또는 ELT(extract, load, transform, 추출, 로드 및 변환) 프로세스가 사용되기도 한다.  스트리밍 데이터 흡수에서는 보통 여러 소스, 경우에 따라 수천 개의 소스에 의해 생성되는 데이터를 읽어 들인다. 예를 들어 IoT 디바이스가 여기에 해당된다. 데이터 내보내기는 심층 분석과 머신러닝을 위해 데이터 웨어하우스 또는 데이터 레이크를 대상으로 하기도 한다.  게시/구독과 주제. 아파치 카프카(Kafka), 아파치 펄사(Pulsar)를 포함한 많은 스트리밍 데이터 플랫폼은 데이터가 주제별로 구성되는 게시 및 구독 모델을 사용한다. 흡수된 데이터에는 하나 이상의 주제가 태깅되어 해당 주제를 구독하는 클라이언트가 데이터를 받을 수 있다. 온라인 뉴스 게시를 예로 들면, 정치인의 연설에 대한 기사라면 속보, 미국 뉴스, 정치 태그가 달릴 수 있고, 그러면 페이지 레이아웃 소프트웨어는 섹션 편집자(사람)의 감독 하에 각 해당 섹션에 이 기사를 포함한다.  데이터 분석. 데이터 스트리밍 플랫폼에서 분석을 수행할 수 있는 기회는 일반적으로 파이프라인의 두 지점에 있다. 첫 번째 지점은 실시간 스트림 부분, 두 번째 지점은 ...

스트리밍데이터 카프카 ETL 2022.02.28

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.