새로운 디지털 정책을 앞장서 추진하고 있는 EU는 최근 공공 부문 기관이 무료로 사용할 수 있는 새로운 '고가치 데이터 세트'를 추가한 오픈 데이터 지침(Open Data Directive)을 시행했다. 이 데이터 세트에는 지리공간과 환경, 기상, 통계, 모빌리티, 기업 데이터가 포함되는데, 이를 통해 사회의 디지털 혁신을 장려하고 이동성과 의료, 에너지 절약, 지속 가능성을 개선하는 것을 목표로 한다. 티에리 브르통 EU 집행위원장은 "스타트업과 중소기업이 이 데이터를 활용해 EU와 전 세계 시민의 삶을 개선하는 신제품과 혁신적인 솔루션을 개발하기를 기대한다"라고 말했다.
오버추어 맵 파운데이션
오버추어 맵 재단(Overture Maps Foundation)에서는 누구나, 어디서나, 상호 운용 가능한 맵핑 서비스를 구축하는 데 사용할 수 있는 세계 최대 엔터프라이즈급 오픈 지도 데이터 컬렉션을 수집하고 있다. 이런 정확한 데이터가 있으면 내비게이션, 지역 검색, 물류 관리, 위치 기반 증강 현실 같은 서비스를 빠르게 실현할 수 있다.그러나 정확성, 적시성, 고급 기능에 대한 요구사항이 계속 늘어나면서 개방형 데이터베이스 레이어의 필요성도 커지고 있다. 공통의 개방형 데이터 기반 레이어를 구축하면 부가가치 높은 데이터를 더 쉽게 결합하고 플랫폼 간 상호 운용성을 개선할 수 있다. 끊임없이 변화하는 세계를 맵핑하는 데 필요한 이런 데이터 고급 맵핑 기능을 구축하고 유지하는 작업은 너무 방대하고 복잡하며 비용이 많이 들기 때문에 한 기관이 처리하기에는 역부족이다.
기존까지 가장 정확한 지도 데이터는 특정 기업 혹은 조직이 소유한 유료 자산이었다. 그러나 이들 데이터 역시 구축하고 유지하는 데 드는 비용이 증가하고 있다. 데이터를 수집하고 제시하는 소스와 방법이 너무 다양하기 때문에 상호 운용성이 어렵고 느리며 제한적이었다. 이런 문제를 해결하는 방법이 바로, 지도 서비스를 활발하게 사용하면서 데이터의 정확성에 대한 피드백을 제공하는 광범위한 사용자 네트워크를 구축하는 것이다. 이를 통해 업계 전체가 최고의 지도 데이터를 구축할 수 있다.
이런 과정에서 오픈 라이선스를 통한 개방적 사용이 핵심적인 역할을 한다. 오픈 지도 데이터의 기본 개념은 오픈소스 소프트웨어와 마찬가지로 누구나 사용하고, 변경하고, 재배포할 수 있는 자산을 공동으로 구축하는 것이다. 최근 하버드 비즈니스 스쿨의 보고서에 따르면, 약 30년 전 리눅스 운영체제 개발을 위해 시작된 개방형 모델은 현재 수조 달러의 가치를 지닌 오픈소스 소프트웨어 산업으로 발전했다. 오픈소스 소프트웨어가 없었다면 기업은 소프트웨어에 지금보다 3.5배 더 많은 비용을 지출해야 했을 것이라고 보고서는 분석했다.
AWS, 메타, 톰톰(TomTom), 마이크로소프트와 같은 세계 최대 IT 및 위치 기반 기업도 오픈소스가 기업과 경제에 미치는 가치를 인정해 오픈소스를 적극 옹호하고 있다. 2022년 말 이런 기업이 모여 리눅스 재단 산하에 세계 최대 규모의 오픈 데이터 프로젝트인 오버추어를 출범시킨 것도 같은 맥락이다.
오버추어의 목표는 다양한 맵핑 애플리케이션과 지리공간 분석을 지원하는 오픈 지도 데이터를 구축하는 것이다. 지도 데이터는 물리적 세계를 디지털로 표현한 것으로, 방대하고 복잡하며 서로 연관된 데이터의 집합이다. 이를 구축하기 위해 오버추어는 다양한 신호에서 발생하는 데이터를 집계, 중복 제거, 개선, 표준화, 유지 관리해 지도 제작자에게 가치 있는 포괄적인 기초 데이터 세트를 제공한다.
예를 들어, 오버추어의 건물 데이터는 오픈스트리트맵의 크라우드소싱 데이터, 에스리의 커뮤니티 맵 프로그램의 정부 데이터, 마이크로소프트와 구글의 AI 생성형 건물 데이터 등을 종합한 것이다. 이 데이터 세트에는 23억 개의 건물이 등록돼 있으며, 이는 세계에서 가장 큰 규모의 오픈 빌딩 데이터 세트다. 주소, 도로망, 관심 장소도 오픈소스 데이터도 앞으로 다룰 주요 분야다.
오픈 데이터와 오픈소스의 차이
오픈 데이터 프로젝트와 오픈소스 프로젝트 사이에는 많은 유사점이 있지만 뚜렷한 차이도 있다. 이런 차이는 누구와 협업할 것인가를 결정할 때 중요한 영향을 줄 수 있다. 필자는 오버추어에서 9개월 동안 일하면서 오픈소스와 오픈 데이터가 어떻게, 왜 다른지 알게 됐다. 오픈 데이터 프로젝트에 중요한 영향을 미치는 오픈소스와의 차이점 6가지를 정리하면 다음과 같다.- 데이터 생성. 소프트웨어 코드는 사람의 두뇌 또는 점점 AI 기반 코딩 어시스턴트를 통해 생성된다. 반면, 데이터는 측정이나 관찰을 통해 생성되므로 시스템이나 프로젝트가 이런 탐지를 직접 수행해야 한다. 지도 데이터의 경우, 새로운 도로의 건설, 기업의 변경, 기존 건물의 파괴 등을 직접 관찰, 확인해야 한다. 오픈 데이터 프로젝트의 커뮤니티는 이런 역할을 수행할 수 있는 시스템을 직접 개발해야 한다. 시간이 지남에 따라 변화하는 데이터를 측정해야 하므로 이는 점점 더 중요해지고 있다.
- 정확성. 오픈 데이터는 현실을 반영하므로, 가능한 한 정확해야 한다. 지도 데이터는 물리적 세계를 디지털로 표현한 것이고, 이 표현은 가능한 한 현실에 충실해야 한다. 오픈소스 소프트웨어 개발에서는 특정 사용 사례에 맞게 나중에 코드를 수정하는 것이 일반적이다. 이를 통해 코드를 더 빨리 공유하고 개선한다. 반면 오픈 데이터의 경우 처음부터 정확성에 대한 엄격성이 훨씬 더 높다.
- 적시성. 대기질, 도로 상황 또는 상점의 개폐업 등은 끊임없이 변화하는 데이터다. 매월, 매주, 심지어 매일 새로 고쳐야 하는 경우도 있다. 이 때문에 오픈 데이터 프로젝트는 생산 라인처럼 운영된다. 현재 매달 새로운 데이터 릴리즈를 발표하고 있으며, 발표 주기를 줄이기 위해 노력하고 있다. 오픈소스 소프트웨어에서는 누군가가 며칠, 몇 달, 심지어 몇 년 동안 사용되거나 검토되거나 수정되지 않은 코드를 공개할 수도 있다. 반면 오픈 데이터로 작업하는 개발자는 작업 방식과 관련해 다양한 시간 요구 사항과 기대치에 부응해야 한다.
- 비용과 규모. 오픈소스 코드는 일반적으로 관리 가능한 크기다. 가장 간단한 경우는 노트북에서 로컬로 코드를 실행할 수 있을 정도다. 코드를 저장하고 제공하는 데 드는 비용도 일반적으로 중요한 요소가 아니다. 반면 지도 데이터는 다르다. 전 세계 지도 데이터와 같은 빅 데이터는 테라바이트, 페타바이트 규모다. 가장 기본적인 형태로 사용하려고 해도 이런 데이터를 저장하고 사용자와 유지 관리자에게 제공해야 하므로 상당한 사전 투자가 필요할 수 있다.
- 라이선싱. 데이터는 어딘가 소스가 있기 마련이다. 민간 기업처럼 누군가가 '소유'하고 있을 수도 있고, 기존의 여러 오픈 데이터 리포지토리를 결합한 것일 수도 있다. 데이터가 다양한 소스에서 파생됐기 때문에 데이터 스키마를 하나의 일관된 시스템으로 병합해야 한다. 때로는 일부 데이터를 다른 데이터와 병합하기 위해 데이터 소유자의 명시적인 허가가 꼭 필요한 경우도 있다. 반면 오픈소스는 기존 코드 베이스의 라이선스가 명확하므로 그 권리 하에서 작성자가 자유롭게 코드를 작성할 수 있다.
- 개인정보 보호. 데이터에는 실제 사람의 주소나 전화번호와 같은 개인 정보가 포함될 수 있고, 개인을 식별할 수 있는 이미지도 있을 수 있다. 따라서 모든 개인 식별 정보가 제거되도록 주의를 기울여야 한다. 반면 오픈소스 코드를 작성하거나 재사용할 때는 일반적으로 이런 종류의 정리 작업이 필요 없다.
앞으로 나아갈 길
오픈소스 코드가 주류로 확산하기까지 수십 년이 걸렸다. 오픈 데이터 역시 오픈소스의 역사에서 얻은 교훈을 활용할 수 있지만, 앞으로 자체적인 모범 사례를 개발해야 한다. 그래야 산업, 정부, 경제 전체에 걸쳐 새로운 제품과 서비스가 등장할 수 있다. 오픈소스가 오픈소스를 사용하는 기업에 혜택을 준 것처럼, 오픈 데이터는 오픈 데이터를 기반으로 서비스를 제공하는 기업에 혜택을 줄 것이다. 소비자, 정부, 기업 모두 더 많은 더 좋은 상품과 서비스를 누릴 수 있게 될 것이다.Marc Prioleau는 오버추어 맵 재단의 전무이사다.
editor@itworld.co.kr
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.