이번 크라우드웍스가 추진하는 사업은 과기정통부가 AI 통합지원 플랫폼인 ‘AI허브(www.aihub.or.kr)’를 통해 AI 개발에 필요한 데이터를 누구나 활용할 수 있는 양질의 데이터를 대규모로 구축·개방하는 것이다. 이번에 크라우드웍스가 10개 지정공모 사업 중 2개를 수주했다.
’랜드마크 이미지 AI 데이터’ 과제는 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터를 구축하는 것이다. 이를 통해 전국 주요 50개 도시의 랜드마크 이미지 총 500만 장 이상을 AI 학습용 데이터로 구축하게 된다.
크라우드웍스는 자사가 운영하는 플랫폼에 등록된 15만 명 이상의 작업자를 활용해 데이터 전처리 과정으로 진행한다. 수집하고자 하는 랜드마크는 ▲버스정류장 또는 지하철 역사 이름에 사용되는 랜드마크, ▲초·중·고 교과서 분석 결과 건물·지형·유적/유물에 해당되는 랜드마크다. 랜드마크 성격은 지역별 공공기관, 주요 건물, 관광명소, 편의시설, 유적/유물로 특정하게 된다. 크라우드웍스가 구축한 랜드마크 이미지 AI 학습용 데이터는 AI 기술 및 응용 서비스 개발에 활용 가치를 높여준다고 업체 측은 설명했다.
사람의 얼굴을 악의적으로 변조한 ‘딥페이크 방지영상 AI 데이터’는 한국인 특성을 반영하는 얼굴 합성과 탐지용 합성 데이터의 생성을 주요 사업 내용으로 한다. 이 사업은 GAN(Generative Adversarial Networks) 기반의 다양한 변형 알고리즘을 통해 생성된 변조 영상(딥페이크)의 탐지‧검출하는 AI 기술 개발을 위한 학습용 변조 영상 데이터로 활용하게 된다.
이를 위해 크라우드웍스는 15만 명 이상의 국내외 작업자를 보유한 크라우드소싱 플랫폼을 통해 성별, 연령, 키, 몸무게가 다양한 참여자를 모집하고, 동시에 많은 사람이 셀프 동영상을 쉽게 업로드할 수 있도록 모바일 기반의 크라우드소싱 플랫폼도 사용(300명 분량 셀프 동영상으로 수집)한다. 그리고 참여자들이 크라우드웍스 모바일 앱을 사용해 제시된 시나리오에 따라 쉽고 빠르게 동영상을 셀프 촬영해 업로드할 수 있도록 지원할 예정이다. editor@itworld.co.kr