하둡

“하이브리드 네이티브 시대의 데이터 관리” 데이터 패브릭에 주목해야 하는 이유 - Summary

플래시와 클라우드를 지나 인텔리전스 시대가 본격 도래하는 가운데 데이터 관리의 중요성이 더 커지고 있다. 특히 온프레미스부터 클라우드는 물론 오픈소스부터 상용소프트웨어까지 파편화된 데이터를 어떻게 관리할 것인가를 놓고 많은 기업이 어려움을 겪고 있다....

HPE 데이터패브릭 하둡 2024.03.14

"하둡과 헤어질 결심" 레이크하우스와의 만남

하둡에서 Databricks로 마이그레이션해야 하는 이유 Databricks 지원 방안 Why Databricks Runs Best on Azure 하둡 마이그레이션 가속화를 위한 Azure Databricks 진단 프로그램...

데이터레이크 데이터웨어하우스 레이크하우스 2022.11.24

“데이터 레이크의 잠재력을 깨운다” 차세대 스토리지 포맷 ‘아파치 아이스버그’의 이해 - Tech Summary

하둡 생태계는 방대한 데이터를 좀 더 쉽고 효과적으로 저장할 수 있기 때문에 데이터 레이크의 표준 생태계로 자리잡고 있다. 하지만 데이터를 둘러싼 환경은 빠르게 변화하고 있다. 특히 ‘데이터 폭풍’이라고 불리는 현재의 데이터 환경은 성능과 용량, 가용...

데이터레이크 데이터웨어하우스 하둡 2022.06.28

특화된 모듈과 편리한 GUI로 복잡한 SAP 데이터에 쉽게 접근하기    

글로벌 ERP 시장 점유율 1위이자 시장의 31.6%(2019년 기준)를 차지하고 있는 SAP는 영업, 제조 및 재무 프로세스의 중요한 정보를 저장하는 핵심 비즈니스 애플리케이션이다. 기업 SAP  ERP 데이터를 다양한 비즈니스 라인에서 수...

ERP 하둡 카프카 2022.01.27

"하둡을 제압한 빅데이터 플랫폼" 아파치 스파크란 무엇인가

아파치 스파크(Apache Spark)는 매우 큰 데이터 집합을 대상으로 빠르게 처리 작업을 수행하는 한편, 단독으로 또는 다른 분산 컴퓨팅 툴과 조율해 여러 컴퓨터로 데이터 처리 작업을 분산할 수 있는 데이터 처리 프레임워크다. 거대한 데이터 스토...

아파치 스파크 하둡 2020.03.20

신간 ∣ 빅데이터 전문가의 하둡 관리

성안당은 ‘하둡’ 관리자의 필독서인 <빅데이터 전문가의 하둡 관리>을 발표했다. 빅데이터 시대에 속도와 신뢰성이 답보되면서 비용도 저렴해 효율적인 솔루션으로 각광받는 하둡은 2003년, 2005년에 발표된 구글 분...

하둡 성안당 2018.11.05

F#을 사용해야 하는 14가지 분명한 이유

F#은 강한 형식의 함수 우선 프로그래밍 언어로, 복잡한 문제를 단순한 코드로 해결할 수 있게 해준다. ML을 기반으로 .NET 프레임워크 상에 구축된 F#은 우수한 상호운용성, 이식성, 런타임 속도, 그리고 “5C”인 간결함(c...

프로그래밍 하둡 개발언어 2018.04.26

하둡 해결사, "쿠두"와 "임팔라"의 이해 - IDG Summary

빅데이터 솔루션의 대표격인 하둡은 빠르게 확산되고 있으나 기대만큼의 혁신적인 결과를 얻지 못하고 있다. 그동안 하둡은 스몰 파일 문제부터 업데이트와 삭제가 되지 않고, 속도가 느린 점 등의 많은 문제점이 드러났다. 이를 해결하기 위한 새로운 솔루션들이...

하둡 빅데이터 임팔라 2018.02.02

대세로 자리잡은 빅데이터 분석 플랫폼, "아파치 스파크"의 이해

아파치 스파크(Apache Spark)는 2009년 버클리대학교의 AMPLab에서 소소하게 시작된 이후, 발전을 거듭해 세계에서 가장 중요한 빅데이터 분산 처리 프레임워크 가운데 하나로 부상했다. Credit: Getty Images Bank...

아파치 스파크 하둡 2017.11.15

“빅데이터란 무엇인가?” 구성요소와 기반 기술의 이해

인간은 매일 먹고 일하고 놀고 데이터를 생산한다. IBM에 따르면 인류가 하루에 생산하는 데이터의 양은 무려 250경 바이트에 이른다. DVD를 쌓는다면 달까지 왕복할 만큼의 데이터다. 이 데이터에는 우리가 전송하는 텍스트와 업로드하는 사진부터 산업용...

하둡 NoSQL 맵리듀스 2017.09.12

“모든 스트리밍 데이터는 아파치 카프카로” 실시간 데이터 인기와 함께 급부상

느린 하둡 및 데이터 호수(Data Lake)에서 실시간 스트림으로 시장의 관심이 이동하면서 아파치 카프카가 꾸준히 부상하고 있다. 아파치 카프카(Kafka)가 순풍을 타고 있다. 레드몽크(Redmonk)의 핀탄 라이언이 전했듯이 작년 한해 동안...

실시간 아파치 스파크 2017.08.02

과대포장의 속도를 따라가지 못하는 12가지 ‘최신 유행’ 기술

과대포장의 속도를 따라가지 못하는 12가지 ‘최신 유행’ 기술 기술이다. 기술이 미래를 만든다. 그러나 생각만 앞선 경우가 많다. 상상하거나 주장했던 이야기가 실현되지 못하고 지지부진한 경우가 비일비재하다. 아마 좋은 기술이...

자바스크립트 맥북프로 하둡 2017.07.10

빅데이터 분석 전략을 여는 6개의 열쇠

 빅데이터에서 필요한 것이 무엇인지, 그리고 그것을 얻기 위해서는 어떻게 해야 하는지를 전문가가 알려줍니다. 대부분의 조직에 있는 비즈니스와 기술 리더들은 빅데이터 분석의 능력을 잘 알고 있습니다. 그렇지만, 자신들이 원하는 방식으로 그...

분석 하둡 빅데이터 2017.07.04

"하둡에 대한 투자 대폭 강화"…호튼웍스와 IBM 전격 인터뷰

호튼웍스(Hortonworks)와 IBM이 최근 파트너십 확대를 발표했다. 내용은 머신러닝과 데이터 과학 툴을 하둡 생태계 전반의 개발자를 대상으로 확대하기 위해 IBM의 데이터 사이언스 익스피리언스(Data Science Experience, DSX...

하둡 호튼웍스 IBM 2017.06.28

"빅데이터, 차별화 요소가 아닌 필수 불가결한 기술"…클라우데라와 마스터카드

"하둡이 나온 지 벌써 10년이 됐으며, 은행에서는 이 기술을 활용한 지 8년정도 됐다. 지금까지 은행들은 하둡 사례를 공개하지 않았지만, 최근 들어 이들은 빅데이터를 활용하는 방안에 대해 설파하기 시작했다. 이는 그동안 빅데이터 기술이 차별...

금융 하둡 빅데이터 2017.05.15

수익창출에 기여하는 비즈니스 통찰력으로써의 빅데이터 전환

오늘날의 빅 데이터 기술을 통해 기업은 빠르게 증가하는 데이터로부터 가치 있는 통찰력을 구할 수 있습니다. 그러나 데이터 리소스를 최대한 효과적으로 활용하기 위해서는 기업이 데이터를 수집, 처리, 저장, 관리 및 분석하는 방식에 대한 새로운 사고 방식...

통찰력 하둡 수익창출 2017.01.16

2017년 빅데이터와 BI 트렌드, "머신러닝, 데이터 레이크, 그리고 하둡과 스파크"

2016년과 마찬가지로 2017년을 맞이하면서 여전히 자사의 데이터를 운영하는 조직에 대해 얘기하고 있다. 비즈니스 사용자들이 유용하고 실행 가능한 데이터가 필요로 할 때 언제 어디서나 제공받을 수 있을 것이다. 데이터 저장 비용은 지속적...

BI 스파크 하둡 2016.12.30

리뷰 | 머신러닝을 밝히는 스파크

지난 3월에도 썼지만 데이터브릭스(Databricks) 서비스는 데이터 과학자를 위한 뛰어난 제품이다. 다양한 수집(ingestion), 특징 선택, 모델 구축, 평가 기능을 갖췄고 데이터 소스와의 통합 기능과 확장성도 장점이다. 스파크 관련한 기존 ...

리뷰 스파크 하둡 2016.11.29

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.