산업뉴스
크라우드웍스, 전국 랜드마크 이미지와 변조영상 탐지 AI 데이터 구축 참여
정하나 기자 | 2020-07-31 09:36:04

크라우드소싱 기반 인공지능(AI) 데이터 수집·가공 플랫폼 기업 크라우드웍스는 오늘 과학기술정보통신부가 추진하는 ‘딥페이크 방지영상’과 ‘랜드마크 이미지’의 AI 학습용 데이터 구축 사업을 진행한다고 밝혔다. 이로써 크라우드소싱 기반의 AI 학습용 데이터 수집과 가공 사업으로 쌓아온 크라우드웍스의 경험과 노하우, 기술력을 정부기관과 관련 기업으로부터 인정을 받았다.


이번 크라우드웍스가 추진하는 AI 학습용 데이터 구축 사업은 과기정통부가 AI통합지원 플랫폼인 AI허브를 통해 AI 개발에 필요한 데이터를 누구나 활용할 수 있는 양질의 데이터를 대규모로 구축 · 개방하는 것으로, 이번에 크라우드웍스가 10개 지정공모 사업 중 2개를 수주했다.

 

’랜드마크 이미지 AI데이터’ 과제는 국내 특성(지리 공간적, 기능적)이 반영된 국내 도심 민간건물, 공공기관, 관광명소, 편의시설 등 국내 도시별 주요 랜드마크 이미지 데이터를 구축하는 것이다. 이를 통해 전국 주요 50개 도시의 랜드마크 이미지 총 500만장 이상을 AI 학습용 데이터로 구축하게 된다.

 

크라우드웍스는 자사가 운영하는 플랫폼에 등록된 15만명 이상의 작업자를 활용해 데이터 전처리 과정으로 진행한다. 수집하고자 하는 랜드마크는 버스정류장 또는 지하철 역사 이름에 사용되는 랜드마크, 초·중·고 교과서 분석 결과 건물·지형·유적/유물에 해당되는 랜드마크로 선정하며, 랜드마크 성격은 지역별 공공기관, 주요 건물, 관광명소, 편의시설, 유적/유물로 특정하게 된다. 크라우드웍스가 구축한 랜드마크 이미지 AI 학습용 데이터는  AI 기술 및 응용 서비스 개발에 활용 가치를 높여주게 된다.


사람의 얼굴을 악의적으로 변조한 ‘딥페이크 방지영상 AI 데이터’는 한국인 특성을 반영하는 얼굴 합성과 탐지용 합성 데이터의 생성을 주요 사업 내용으로 한다. 이 사업은 GAN(Generative Adversarial Networks) 기반의 다양한 변형 알고리즘을 통해 생성된 변조 영상(딥페이크)의 탐지‧검출하는 AI 기술 개발을 위한 학습용 변조 영상 데이터로 활용하게 된다.


이를 위해 크라우드웍스는 15만명 이상의 국내외 작업자를 보유한 크라우드소싱 플랫폼을 통해 성별, 연령, 키, 몸무게가 다양한 참여자를 모집하고, 동시에 많은 사람이 셀프 동영상을 쉽게 업로드할 수 있도록 모바일 기반의 크라우드소싱 플랫폼도 사용(300명 분량 셀프 동영상으로 수집)한다. 그리고 참여자들이 크라우드웍스 모바일 앱을 사용해 제시된 시나리오에 따라 쉽고 빠르게 동영상을 셀프 촬영해 업로드할 수 있도록 지원할 예정이다.


한편, 크라우드웍스는 최근 광주광역시와 AI 중심도시 광주 만들기 및 국가 AI  산업 육성을 위한 상호협력 체계를 구축하기로 했다. 이를 위해 박민우 대표는 이용섭 광주광역시장과 업무 협약식 맺고, 광주 AI 클러스터 조성과 데이터 비즈니스 플랫폼 구축을 위한 기술, 정책 자문 수행을 비롯해 광주지역 AI 분야 인재육성과 일자리 창출을 위한 지역사무소 개설할 예정이다.


현재 크라우드웍스를 통해 생산된 데이터는 네이버, 카카오, 삼성전자, SK텔레콤, KT, LG-CNS 등의 대기업과 마인즈랩, 우아한형제들 등의 스타트업, KAIST, 포항공대, 경북대학교, ETRI 등의 대학 및 정부연구기관에 등에서 폭넓게 사용되고 있다.
 

저작권자 @ 여기에 무단전재 - 재배포 금지