2021.10.08

글로벌 칼럼 | AI와 사람의 조화가 필요한 시점

Matt Asay | InfoWorld
우리는 꽤 오랫동안 현재 AI의 능력을 과대평가했다. AI의 미래가 밝지 않다는 의미가 아니다. 스탠포드 대학교에서 지난 2016년 ‘인공 지능에 대한 100년간의 연구(AI100)’ 시리즈를 구상한 이유도 마찬가지일 것이다. 스탠포드 연구팀은 오는 2116년까지 5년마다 AI 발전상을 제시한 보고서를 발표할 계획이다. 첫 번째 보고서 출간 후 5년이 지난 지금, 두 번째 보고서가 나왔다.

긴 내용을 정리해 보자. 현재 AI는 계속해서 발전하는 데이터 인프라에 힘입어 5년 동안 놀랍도록 성장했다. 그럼에도 AI가 목표로 하는 ‘완전히 사람 같은 지능’에는 여전히 못 미친다. 하지만 현재 우리는 AI 발전을 위해 사람과 기계를 조화시는 것이 얼마나 중요한지 깨닫고 있다. 이것은 진정한 AI일까? 우리가 처음 생각했던 AI 개념과는 거리가 멀지만, 더 괜찮은 방법임은 분명하다.


빅데이터보다 ‘쉬운 데이터’를 사용하자

데이터 과학과 AI 실현의 대표적인 방해물은 과학이 아닌 데이터와 관련이 있다. 퍼스크마크(FirstMark) 투자 전문가 맷 터크는 “최근 들어 데이터 웨어하우스가 발전하면서 엄청난 자금과 유지보수를 위한 대규모 인력 없이도 방대한 데이터를 저장하는 것이 가능해졌다”라며 머신러닝, AI, 데이터(MAD) 지형에 대한 견해를 전했다. 그렇다. 수십 년 전에도 데이터 웨어하우스가 있었지만, 당시에는 이용하기 복잡하고 비용이 많이 들었다. 최근에는 아파치 하둡과 같은 프레임워크가 등장해 가격이 저렴해졌으나 구조는 여전히 복잡하다. 

데이터 업계가 비전문가도 접근하기 쉬운 데이터 인프라 성숙에 주력한 것은 고작 몇 년 전부터다. 터크는 “마침내 효율적인 비용으로 빅데이터를 저장하고 처리할 수 있게 됐다. 이는 3가지 측면에서 데이터와 AI 분야에 풀리지 않은 부분이 있었음을 증명한 것이다”라고 설명했다. 터크가 제시한 3가지 측면은 다음과 같다. 
 
  • 데이터 웨어하우스가 떠오르면서 해당 분야는 물론 데이터 및 AI 생태계 전체의 시장 규모가 상당히 커졌다.
  • 데이터 웨어하우스는 기존 데이터 처리방식인 ELT(extract, load, transform) 중심으로 돌아가는 도구와 기업의 전반적인 생태계를 발전시켰다.
  • 데이터 웨어하우스로 인해 기업이 데이터 니즈 계층에서 더 상위에 있는, 즉 가치가 높은 프로젝트에 집중할 수 있는 환경이 마련됐다.

터크는 현대적인 데이터 웨어하우스의 긍정적 영향에 초점을 맞췄지만, AI의 발전은 분산형 데이터베이스나 NoSQL과 같은 데이터베이스와 클라우드 발전에도 영향을 받았다. 데이터 반복 처리가 더 쉬워졌기 때문이다. 이런 요소 덕분에 데이터 저장과 처리가 더 쉬워졌으며 결과적으로 기업은 데이터로 더 많은 일을 할 수 있게 됐다. 

이제 다시 스탠포드 AI100 이야기로 돌아가 보자. 


경쟁이 아닌 보완

우리는 매일 AI와 상호작용하면서 단점을 인식하기 시작했다. 테슬라를 예를 들어 보자. AI 기반 ‘완전한 자율 주행’이라는 마케팅은 잘못됐다. 테슬라 전기 자동차로 탑승자가 안전하게 이동하기까지는 아직 갈 길이 멀다. 아주 세밀하게 통제되는 환경에서만 안전한 이동이 가능하다. 그럼에도 우리는 전기 자동차의 미래에 흥미를 느끼고 희망을 품고 있다.

AI100 연구진은 AI가 실질적인 발전을 보인 3가지 분야를 선정했다.
 
  • 자기 지도 및 자기 주도적 학습
  • 다양한 분야에 대한 폭넓은 재학습 없이 각 분야의 문제를 해결하는 지속적인 학습 
  • 특정 작업에서 획득한 지식과 기술을 새로운 상황에 맞게 조정하는 작업 일반화

가까운 미래에 AI가 사람을 대체할 것이라는 의미가 아니다. AI가 의미 있는 방식으로 사람을 보완하는 능력이 개선되고 있다는 뜻이다. 연구진은 “AI와 사람이 상호 보완적인 강점을 갖는 상황에서 AI가 사람을 보완하는 능력은 매우 가치 있다. AI 시스템은 가용한 데이터를 합성하고, 특징이 명확한 문제에 대한 의사결정을 내리는 데 사람보다 더 적합할 수 있다. 반면 사람은 데이터에 함축된 의미를 이해하는 데 더 능숙할 것이다”라고 설명했다. 

예컨대 기계는 고령자를 돌보는 일을 절대 대신할 수 없다. 연구진은 “좋은 돌봄은 존중과 존엄이 필요하다. 사람은 절차적인 알고리즘에 존중과 존엄을 코딩하는 방법을 모른다”라고 말했다. 다만 AI는 다량의 데이터를 분석해 고령자가 언제 약과 기타 지원이 필요한지 돌봄 노동자에게 제안할 수는 있다. 또는 AI 기반 이미지 처리로 의약품을 평가해 섭취량이나 맞지 않는 약품 성분 등의 위험성을 알려주는 것도 가능하다. 환상의 호흡이다.

가끔은 AI 모델이 자유롭게 데이터를 분석하도록 설정한 다음 어떻게 그 결론에 도달했는지 살펴보는 것도 좋은 방법이다. 연구진은 “예측을 잘 하도록 AI 모델을 먼저 훈련하고, 왜 이런 예측이 최선인지 이유를 파악하는 방법으로 질병부터 지진 역학까지 모든 분야에 대한 과학적 이해가 심화되어왔다”라고 말했다. 이 사례에서 사람은 기계로 인해 데이터를 심층적으로 이해하게 됐으며, 기계가 이해하지는 못하지만 어쨌든 결론을 낼 수 있다는 것을 배웠다. 

즉, 기계는 많은 정보를 분석해 사람이 더 쉽게 이해할 수 있는 방식으로 정보를 요약하거나 다른 방식으로 제시한다. 이런 방법을 통해 인간은 지능을 더 효과적으로 활용할 수 있다. 인간은 기계를 대체하지 못하며, 기계도 사람을 대체하지 못한다. 사람의 역할은 방대한 데이터를 이용할 수 있도록 데이터 인프라를 구축하는 것이며, 기계의 역할은 엄청난 데이터를 납득할 수 있게 바꾸는 것이다. 그야말로 최고의 협력 관계다. editor@itworld.co.kr


2021.10.08

글로벌 칼럼 | AI와 사람의 조화가 필요한 시점

Matt Asay | InfoWorld
우리는 꽤 오랫동안 현재 AI의 능력을 과대평가했다. AI의 미래가 밝지 않다는 의미가 아니다. 스탠포드 대학교에서 지난 2016년 ‘인공 지능에 대한 100년간의 연구(AI100)’ 시리즈를 구상한 이유도 마찬가지일 것이다. 스탠포드 연구팀은 오는 2116년까지 5년마다 AI 발전상을 제시한 보고서를 발표할 계획이다. 첫 번째 보고서 출간 후 5년이 지난 지금, 두 번째 보고서가 나왔다.

긴 내용을 정리해 보자. 현재 AI는 계속해서 발전하는 데이터 인프라에 힘입어 5년 동안 놀랍도록 성장했다. 그럼에도 AI가 목표로 하는 ‘완전히 사람 같은 지능’에는 여전히 못 미친다. 하지만 현재 우리는 AI 발전을 위해 사람과 기계를 조화시는 것이 얼마나 중요한지 깨닫고 있다. 이것은 진정한 AI일까? 우리가 처음 생각했던 AI 개념과는 거리가 멀지만, 더 괜찮은 방법임은 분명하다.


빅데이터보다 ‘쉬운 데이터’를 사용하자

데이터 과학과 AI 실현의 대표적인 방해물은 과학이 아닌 데이터와 관련이 있다. 퍼스크마크(FirstMark) 투자 전문가 맷 터크는 “최근 들어 데이터 웨어하우스가 발전하면서 엄청난 자금과 유지보수를 위한 대규모 인력 없이도 방대한 데이터를 저장하는 것이 가능해졌다”라며 머신러닝, AI, 데이터(MAD) 지형에 대한 견해를 전했다. 그렇다. 수십 년 전에도 데이터 웨어하우스가 있었지만, 당시에는 이용하기 복잡하고 비용이 많이 들었다. 최근에는 아파치 하둡과 같은 프레임워크가 등장해 가격이 저렴해졌으나 구조는 여전히 복잡하다. 

데이터 업계가 비전문가도 접근하기 쉬운 데이터 인프라 성숙에 주력한 것은 고작 몇 년 전부터다. 터크는 “마침내 효율적인 비용으로 빅데이터를 저장하고 처리할 수 있게 됐다. 이는 3가지 측면에서 데이터와 AI 분야에 풀리지 않은 부분이 있었음을 증명한 것이다”라고 설명했다. 터크가 제시한 3가지 측면은 다음과 같다. 
 
  • 데이터 웨어하우스가 떠오르면서 해당 분야는 물론 데이터 및 AI 생태계 전체의 시장 규모가 상당히 커졌다.
  • 데이터 웨어하우스는 기존 데이터 처리방식인 ELT(extract, load, transform) 중심으로 돌아가는 도구와 기업의 전반적인 생태계를 발전시켰다.
  • 데이터 웨어하우스로 인해 기업이 데이터 니즈 계층에서 더 상위에 있는, 즉 가치가 높은 프로젝트에 집중할 수 있는 환경이 마련됐다.

터크는 현대적인 데이터 웨어하우스의 긍정적 영향에 초점을 맞췄지만, AI의 발전은 분산형 데이터베이스나 NoSQL과 같은 데이터베이스와 클라우드 발전에도 영향을 받았다. 데이터 반복 처리가 더 쉬워졌기 때문이다. 이런 요소 덕분에 데이터 저장과 처리가 더 쉬워졌으며 결과적으로 기업은 데이터로 더 많은 일을 할 수 있게 됐다. 

이제 다시 스탠포드 AI100 이야기로 돌아가 보자. 


경쟁이 아닌 보완

우리는 매일 AI와 상호작용하면서 단점을 인식하기 시작했다. 테슬라를 예를 들어 보자. AI 기반 ‘완전한 자율 주행’이라는 마케팅은 잘못됐다. 테슬라 전기 자동차로 탑승자가 안전하게 이동하기까지는 아직 갈 길이 멀다. 아주 세밀하게 통제되는 환경에서만 안전한 이동이 가능하다. 그럼에도 우리는 전기 자동차의 미래에 흥미를 느끼고 희망을 품고 있다.

AI100 연구진은 AI가 실질적인 발전을 보인 3가지 분야를 선정했다.
 
  • 자기 지도 및 자기 주도적 학습
  • 다양한 분야에 대한 폭넓은 재학습 없이 각 분야의 문제를 해결하는 지속적인 학습 
  • 특정 작업에서 획득한 지식과 기술을 새로운 상황에 맞게 조정하는 작업 일반화

가까운 미래에 AI가 사람을 대체할 것이라는 의미가 아니다. AI가 의미 있는 방식으로 사람을 보완하는 능력이 개선되고 있다는 뜻이다. 연구진은 “AI와 사람이 상호 보완적인 강점을 갖는 상황에서 AI가 사람을 보완하는 능력은 매우 가치 있다. AI 시스템은 가용한 데이터를 합성하고, 특징이 명확한 문제에 대한 의사결정을 내리는 데 사람보다 더 적합할 수 있다. 반면 사람은 데이터에 함축된 의미를 이해하는 데 더 능숙할 것이다”라고 설명했다. 

예컨대 기계는 고령자를 돌보는 일을 절대 대신할 수 없다. 연구진은 “좋은 돌봄은 존중과 존엄이 필요하다. 사람은 절차적인 알고리즘에 존중과 존엄을 코딩하는 방법을 모른다”라고 말했다. 다만 AI는 다량의 데이터를 분석해 고령자가 언제 약과 기타 지원이 필요한지 돌봄 노동자에게 제안할 수는 있다. 또는 AI 기반 이미지 처리로 의약품을 평가해 섭취량이나 맞지 않는 약품 성분 등의 위험성을 알려주는 것도 가능하다. 환상의 호흡이다.

가끔은 AI 모델이 자유롭게 데이터를 분석하도록 설정한 다음 어떻게 그 결론에 도달했는지 살펴보는 것도 좋은 방법이다. 연구진은 “예측을 잘 하도록 AI 모델을 먼저 훈련하고, 왜 이런 예측이 최선인지 이유를 파악하는 방법으로 질병부터 지진 역학까지 모든 분야에 대한 과학적 이해가 심화되어왔다”라고 말했다. 이 사례에서 사람은 기계로 인해 데이터를 심층적으로 이해하게 됐으며, 기계가 이해하지는 못하지만 어쨌든 결론을 낼 수 있다는 것을 배웠다. 

즉, 기계는 많은 정보를 분석해 사람이 더 쉽게 이해할 수 있는 방식으로 정보를 요약하거나 다른 방식으로 제시한다. 이런 방법을 통해 인간은 지능을 더 효과적으로 활용할 수 있다. 인간은 기계를 대체하지 못하며, 기계도 사람을 대체하지 못한다. 사람의 역할은 방대한 데이터를 이용할 수 있도록 데이터 인프라를 구축하는 것이며, 기계의 역할은 엄청난 데이터를 납득할 수 있게 바꾸는 것이다. 그야말로 최고의 협력 관계다. editor@itworld.co.kr


X