필자는 기술 전문가로서 작업에 적합한 도구를 선택해야 한다는 말을 잘 인지하고 있다. 사용자가 적어도 향후 10년 동안 계속 스프레드시트를 사용할 이유는 많다. 스프레드시트는 가벼운 데이터 분석과 공유, 제시에 사용되는 다용도 도구이지만 데이터 세트 확장, 협업 및 비즈니스에 필수적인 워크플로우 증가로 인해 유용성이 감소하고 있다.
필자의 저서인 ‘디지털 추진(Driving Digital)’은 엔론(Enron)과 같은 기업에 닥친 대규모 스프레드시트 문제와 구체화된 위험에 관해 공유한다. ESRIG(European Spreadsheet Risks Interest Group)는 스프레드시트 관련 문제를 추적한다. 작년 BBC 뉴스는 16,000개의 손실된 코로나19 검사 결과와 병원 개업 지연의 문제를 다루기도 했다. 이처럼 스프레드시트는 데이터 지향적인 조직이 되려는 노력을 약화시킬 수 있으며, 대책이 없는 경우 과도한 스프레드시트 사용으로 인해 비즈니스가 파산할 가능성도 있다.
따라서 사용자는 문제를 파악하고 솔루션을 모색하며 전환을 위해 이해관계자와 협력해야 한다. 대규모 스프레드시트가 문제가 될 수 있는 이유 5가지를 살펴보자.
스프레드시트는 데이터 품질 문제를 유발한다
리툴(Retool)의 커뮤니티 책임자 저스틴 게이지는 개인 사용자와 팀이 데이터 입력과 워크플로우 요소에 스프레드시트를 사용하고 있다는 것을 알고 있다. 스프레드시트에 데이터 검증 도구가 있지만 사용자를 날짜, 숫자, 기타 원시적인 데이터 유형을 중심으로 표시하는 것은 기본에 불과하다. 많은 스프레드시트 사용자가 이를 활용하는 방법을 모르고 있으며 이름과 주소, 전화번호, 기타 단순 정보가 여러 형식으로 기록될 수 있다.게이지는 스프레드시트의 확장되는 입력 검증이 문제라고 밝혔다. 게이지는 “데이터를 추적하거나 단순한 트렌드를 차트로 표시하고, 기본적인 도구를 개발해야 하는 경우 스프레드시트는 빠르게 시작할 수 있는 좋은 수단이다. 하지만 확장되지 않는다는 단점이 있다. 입력 검증과 사용자 액세스 관리, 기타 사용자 정의에 대해 생각해야 할 때 이러지도 저러지도 못하는 상황이 발생한다”라고 말했다.
복잡한 스프레드시트는 오류에 취약한 경우가 많다
스프레드시트는 수동 프로세스레서 사용되는 주요 툴이며, 복사하여 붙여 넣은 셀, 수식의 실수, 추가된 열과 행, 기타 결함에서 오류가 발생할 수 있다. 이들 모든 것이 합쳐져 오류 있는 결과가 생성된다.셀리고(Celigo)의 CTO 스콧 헨더슨은 “일상적인 스프레드시트와 같은 수동 프로세스는 모든 부서의 비용이 높은 오류와 고립된 데이터 사일로, 생산성 감소의 원인이 된다. 기업 전반의 프로세스 자동화는 시간과 자원을 절약하고 더 나은 의사결정을 위한 전체론적인 관점을 제공한다”라고 말했다.
복잡한 수식, 스크립트 작성, 기타 발전된 기법은 디버깅이 어렵기 때문에 문제가 악화될 수 있다. 프라이스FX(PriceFX)의 수석 VP 더그 푸엔은 “수동 생성 및 불가해한 경우가 많은 수식 때문에 오류가 흔하며 찾아서 없애기 힘들다”라고 설명했다.
스프레드시트 유지관리는 시간이 소요되며, 컴플라이언스 위험이 있다
스프레드시트 결함과 잠재적인 문제를 뛰어넘어 스프레드시트를 개발해도 시간이 많이 소요될 수 있으며, 유지관리가 어렵다. 엔캠프(Encamp)의 CEO 루크 제이콥스는 “스프레드시트를 사용하는 것은 지루하며 시간이 소요되는 프로세스이기 때문에 많은 실수가 생길 수 있다. 스프레드시트는 인적 오류의 위험을 높일 뿐만 아니라 다른 중요한 작업에 투입할 수 있는 막대한 양의 시간이 필요하다”라고 말했다.차트홉(ChartHop)의 CEO 이안 화이트는 직원 데이터 및 다른 민감한 정보를 다룰 때의 오류와 수동 작업, 잠재적인 컴플라이언스 문제에 대한 우려를 발생시키는 흥미로운 사용례를 공유했다. 화이트는 “스프레드시트는 오랫동안 HR팀이 일반적으로 사용하는 모든 시스템에서 직원 데이터를 수집하는 유일한 수단이었다. 많은 양의 시간이 스프레드시트 제조에 낭비되며, 모든 기업이 직원 수에 관해 대답할 수 있어야 하는 가장 기본적인 질문에 유의미하게 답할 수 없다”라고 밝혔다.
스프레드시트는 협업을 저해하고 데이터 사일로를 생성할 수 있다
스프레드시트를 이메일로 보내달라는 말을 자주 들었을 것이다. 직원이 원드라이브나 구글 드라이브에서 액세스를 공유하고 있음에도 불구하고 여전히 문서를 이메일로 보내고 있다. 여러 사용자가 하나의 스프레드시트로 협업하는 것은 까다로울 수 있다. 팀이 워크플로우를 관리하는 데 다른 툴이 아닌 협업용 스프레드시트를 사용하는 경우, 누가 데이터를 변경했고 행이 어떻게 사라졌으며, 수식이 왜 바뀌었는지와 같은 변경사항을 추적하기 어렵다.푸엔은 “스프레드시트는 여러 당사자가 업데이트와 변경사항을 적용하고 로직을 이해해야 하는 팀 환경을 쉽게 지원하지 못한다. 이들 요소의 조합으로 인해 기업은 매출 위험뿐만 아니라 높은 운영 비용에 직면하게 된다”라고 말했다.
스프레드시트를 통한 협업으로 데이터 사일로가 발생할 가능성이 높아진다. 애널리스트가 데이터소스에 연결하고 데이터를 다운로드하며, 수식과 피벗, 기타 데이터 연산을 생성할 때 고립되고 파생된 데이터 소스를 구성하게 된다. 데이터 처리 단계를 수집하고 파생된 데이터를 중앙에 집중시킬 수 있는 활동이 없으면, 조직 내 다른 사용자가 이들 데이터 소스를 알 수 있는 가능성이 낮아진다. 기타 애널리스트가 동일한 데이터를 사용하고 파생된 데이터 소스 복제본을 만들게 되면 이런 사이클은 영구화될 수 있다.
물론, 직원이 기업 네트워크에 액세스 권한이 없는 고객 및 파트너와 스프레드시트를 공유하면 문제가 악화될 뿐이다. 많은 상황에서 사용자는 파일을 이메일로 전송하고 민감한 데이터를 보호하기 어렵다.
대규모 데이터 세트는 성능이 안 좋은 경우가 많다
얼마 전 까지만 해도 엑셀은 6만 5,000개의 데이터 행을 지원했다. 심지어 지금도 마이크로소프트는 워크시트를 약 1백만 개의 행과 1만 6,000개의 열, 255자의 열 너비를 가진 셀, 기타 요소로 제한하고 있다. 많은 애널리스트가 기가바이트나 테라바이트 수준의 데이터 세트를 다루고 있으며, 이들을 스프레드시트로 분석하는 것은 적합하지 않을 것이다. 푸엔은 이런 점이 기업에게 문제가 된다고 말했다. 그 이유에 대해 푸엔은 “스프레드시트는 확장되지 않기 때문이다. 시장 데이터 또는 많은 양의 거래 데이터에 의존하는 복잡한 계산은 업데이트가 느리고 프리징이 발생하는 경우가 많다”라고 말했다.심지어 중간 규모의 데이터 세트도 성능보다 더욱 심각한 문제를 야기한다. 사용할 수 있는 모든 데이터 시각화 툴과 머신러닝 역량을 고려하면 길고 광범위한 데이터 세트를 분석하는 더욱 효율적이고 현명한 수단이 있다.
따라서 스프레드시트가 여러 작업에 많이 사용되기는 하지만 기업이 더욱 탄탄한 플랫폼을 필요로 하는 요즘, 더 나은 데이터 관리, 시각화, 협업, 통합 옵션이 있다. 필자는 추후 개발자와 기술 전문가가 스프레드시트를 대체하거나 업그레이드할 때 고려해야 할 툴과 플랫폼의 종류에 관해 공유할 예정이다.
editor@itworld.co.kr
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.