마인즈랩에서 공개한 ‘코로나19 동선 추적 데이터셋’은 확진자의 경로, 연령, 성별, 진단 날짜 등 기초적인 환자 경로 데이터는 물론 22가지의 주요 전염병, 16개의 백신, 의료 시설 등을 포함한 의료 통계 데이터와 다양한 변수에 따른 시각화 된 데이터로 AI 모델 개발 등 머신러닝에 필요한 데이터 집합이다.
마인즈랩의 데이터셋은 기존 코로나19 관련 오픈 데이터셋들에 비해 데이터의 양과 품질 그리고 데이터 시각화 부분에서 차별화를 둬 미국의 커뮤니티 사이트 레딧(Reddit)의 개발/딥러닝 부문 1위에 오르는 등 해외 네티즌들 사이에서도 큰 관심을 끌고 있다.
마인즈랩 브레인팀 이중건 선임 연구원은 “공익적 가치를 고려해 누구나 쉽게 사용할 수 있도록 소셜 코딩 플랫폼인 깃허브(Github)에 오픈소스로 공개했다”며, “빠르게 확산하고 있는 코로나19를 막기 위해 질병의 최전선에서 사투를 벌이는 의료진과 관계자들에게 마인즈랩이 구축한 데이터셋이 큰 도움이 되기를 바란다”라고 밝혔다.
마인즈랩 브레인팀이 구축한 코로나19 동선 추적 오픈 데이터셋은 깃허브에서 누구나 이용할 수 있다. editor@itworld.co.kr