AIㆍML / BI|분석 / 미래기술

AI에 좋은 영양소를 섭취시키는 방법

Heidi Maher | Computerworld 2016.07.25
인공지능은 아이들을 닮았다. 잠재력을 100% 실현시키기 위해서는 적절한 육아가 필요하다. 그리고 육아의 출발점은 건강한 식단, 즉 좋은 데이터이다.

빠른 의사결정에 도움을 주는 AI의 잠재력을 인식하는 기업과 기관이 증가하고 있다. 그러나 AI 내부에서 일어나는 일을 걱정하는 기업과 기관이 많다. AI 품질은 AI가 처리하는 데이터가 결정한다. 물론 예전에도 '쓰레기를 넣으면 쓰레기가 나온다 '는 말이 분석 분야의 격언 중 하나였다. 그러나 AI에서는 이 격언의 중요성이 훨씬 더 크다.

왜 그럴까? 둘의 차이점을 보면 알 수 있다. 분석(애널리틱스) 솔루션은 보통 결과가 우선순위대로 표시된 그래프를 제공한다. 분석 프로그램에 미국 북동부 지역의 매출이 감소한 이유를 분석하라고 명령했다고 가정하자. 공급망의 문제, 인구통계 변화, 소셜 미디어 트렌드 등 여러 요인들로 구성된 목록을 얻게 될 것이다. 그러면 사람이 결과에서 최종 결정에 반영할 요인을 결정한다. 그런데 인지 AI는 덜 투명하다. AI에게 동일한 질문을 물으면, 단 하나의 확정적인 대답만 얻게 된다. 더 이상은 없다.

AI는 비즈니스 사용자의 꿈을 실현시켜줄 수 있다. 질문을 던지면 확실한 답을 내놓는다. 사용자는 이에 맞게 조치를 취하면 된다. 시간을 절약시켜주고, 더 빨리 결과를 제시하고, 비즈니스 의사결정을 개선한다.

그런데 AI의 분석이 잘못됐다면 어떻게 될까? 더 중요하게, 비즈니스 사용자가 AI의 분석이 잘못됐다는 것을 모른다면 어떻게 될까? 이런 점 때문에 AI는 분석 솔루션보다 신뢰도가 훨씬 더 높아야 한다. 최고 데이터 책임자와 데이터 과학자의 AI 육아는 겸허한 태도를 유지해야 하는 책임이다.

AI의 양육을 책임진 사람들은 완전하고 건강한 식단을 준비해 제공해야 한다. 깨끗하고, 관련성과 신뢰도가 높고, 출처를 추적할 수 있는 데이터를 의미한다. 공급되는 데이터 큐레이트가 AI의 영양과 건강을 결정한다.

범위 지정
AI가 데이터 호수의 물을 그대로 들이마시게 해서는 안 된다. 정수를 하고, 포장을 하고, 체계화해 쉽게 소화할 수 있도록 만들어야 한다. CGOC(Compliance, Governance and Oversight Counsel)에 따르면, 기업이 생산 및 수집하는 데이터 중 비즈니스, 법률, 컴플라이언스 측면에서 가치가 없는 데이터가 약 70%에 달한다. 따라서 AI에 공급할 데이터에 대한 기준과 범위를 이해하고 지정할 방법을 개발해야 한다. '저장된 데이터와 파일의 종류는?', '데이터 간의 관계는?', '결정자와 최종 승인자는?' 등의 질문을 던져야 한다.

소스 검토 및 관리
소스를 규정했다면, 데이터 품질을 확보해야 한다. AI 응답의 신뢰도를 높이려, 수집된 데이터에 기여한 콘텐츠의 진위(감사 추적 이용), 정확성, 가치를 평가할 수 있어야 한다. 히트 맵과 시각화를 이용해 이를 처리할 수 있다.

여러 소스의 데이터를 복제했다면, 데이터 과학자와 주제 전문가가 AI '브레인' 교육에 사용할 고품질의 정보를 찾고, 검토하고, 추적할 수 있는 능률적인 프로세스를 갖고 있어야 한다.

태깅 및 분류
데이터가 적절히 소화될 수 있도록, 데이터를 태깅 및 분류해야 한다. AI가 수행할 작업에 따라 일부 메타데이터는 다른 데이터보다 더 큰 가치를 갖는다. 예를 들어, 마케팅 인사이트를 찾을 경우, 소셜 미디어 이미지와 연결되어 있는 지리적 소재지, 타임스탬프, 카메라 종류, 일련 번호 등 EXIF에서 추출한 메타데이터가 값진 데이터이다. 의료 관련 정보의 경우, 환자 ID, 생년월일, 소스 타임스탬프, 프라이버시 콘텐츠 같은 메타데이터 요소가 필수적이다.

응답 추적과 업데이트
마지막으로 시스템에 사용한 정보에 대한 응답을 추적하고, 데이터를 적절하게 조정할 수 있는 거버넌스 기능을 구현해야 한다.

AI에는 모순적인 점이 하나 있다. 궁극적으로 자동화된 컴퓨팅 기술이고, 데이터 큐레이션 프로세스에 이용할 자동화 기술도 존재하지만, AI 양육은 AI라는 주제에 대한 전문성과 지식을 갖춘 사람이 책임져야 한다. 데이터 큐레이션 프로세스에서 사람의 중요성을 인식해야 한다. 그래야만 AI를 올바르게 구현하는 과정에서 직면하는 문제를 제대로 평가하고, 지나친 기대나 과신을 피할 수 있다.

사람은 AI의 부모이다. AI가 성장 단계를 통과하면서 잘 정립된 요건을 충족하는 새로운 기능, 전문 기능을 마스터하게끔 지속적으로, 그리고 참을성 있게 영양소를 공급해야 한다.  editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.