AIㆍML / 클라우드

글로벌 칼럼 | 생성형 AI의 비용과 지속가능성

David Linthicum | InfoWorld 2023.02.20
모두가 달리(DALL-E)를 사용해 이미지를 생성하고 ChatGPT에게 기말 과제 작성을 시킨다면, 엄청난 양의 클라우드 자원이 사용될 것이다. 이 모든 비용을 누가 내게 될 것인가?

AI는 어떤 플랫폼에서도 자원 집약적이다. 퍼블릭 클라우드도 마찬가지다. 대부분 AI 기술이 무수한 추론 연산을 필요로 하고, 여기에는 더 많은 프로세서와 네트워크, 스토리지, 그리고 더 높은 전기료와 인프라 비용, 더 많은 탄소 배출량이 필요하다.
 
ⓒ Getty Images Bank

생성형 AI 시스템이 주목을 받으면서 이 문제가 다시 수면으로 떠올랐다. 생성형 AI의 인기와 기업이나 정부, 일반 대중에 의한 대규모 확장 가능성을 고려하면, 전력 소비량이 우려할 만한 기울기의 증가 곡선을 그릴 수도 있다.

AI는 1970년대부터 실현 가능한 기술이었지만, 기업 활동에 큰 영향을 미친 적은 없었다. 제대로 된 AI 시스템을 구축하는 데 드는 막대한 자원 때문이었다. 필자도 20대에 AI 지원 시스템을 설계한 적이 있는데, 이 시스템을 구동하는 데 필요한 하드웨어와 소프트웨어, 데이터센터 공간에만 4,000만 달러가 필요했다. 참고로, 필자가 참여한 프로젝트를 비롯해 당시의 수많은 AI 프로젝트는 정식으로 출시된 적이 없다. 

클라우드가 이 모든 걸 바꿔 놓았다. 과거에는 감히 다가가지도 못했던 기술을 퍼블릭 클라우드에서는 충분히 비용 효율적으로 구현할 수 있게 된 것이다. 사실 과거 10~15년 동안 클라우드의 부상과 AI의 부상은 큰 범위에서 연관성을 갖는다. 그리고 이제는 두 기술이 밀접하게 연결되어 있다.
 

클라우드 자원의 지속가능성과 비용

이 영역에서 무슨 일이 일어나고 있는지 일일이 찾아볼 필요도 없다. AI 서비스에 대한 수요는 천정부지로 치솟았으며, 현재 관심이 집중되고 있는 생성형 AI 외에도 많은 AI 및 머신러닝 시스템의 수요가 날로 늘고 있다. 이런 수요 급증은 지능형 공급망 같은 혁신의 이점을 찾는 기업이 주도한다. 물론 여기에 기말 과제 보고서를 생성형 AI에 맡기려는 수천 명의 대학생도 한몫하고 있다.

AI 수요가 증가하는 것은 이들 AI 시스템이 사용하는 자원의 수요도 증가하는 것을 의미한다. 바로 퍼블릭 클라우드이다. 그리고 퍼블릭 클라우드에 대한 수요는 결국 더 많은 데이터센터가 전력에 굶주린 서버와 네트워킹 장비를 더 많이 갖춰야 한다는 것을 의미한다.

퍼블릭 클라우드 서비스 업체는 다른 사회 인프라 서비스 업체와 마찬가지이다. 수요가 증가하면 가격을 높인다. 가정용 전기 요금 고지서가 계절에 따라 수요에 따라 달라지는 것과 같다. 이렇게 요금이 올라가면, 사용자는 보통 사용량을 줄인다. 여름에 에어컨 온도를 20도에서 24도로 올리는 식이다.

하지만 클라우드 컴퓨팅 비용의 증가가 기업에 똑같은 영향을 미치지는 않는다. 이들 AI 시스템이 선택의 문제가 아니라 핵심 비즈니스 프로세스를 운영하는 데 꼭 필요한 것이 될 수도 있기 때문이다. 많은 경우, 기업은 비즈니스 내에서 비용을 줄이려고 한다. AI 시스템 비용을 상쇄하기 위해 직원수를 줄이는 식이다. 생성형 AI 시스템이 조만간 다수의 지식 노동자를 대체한다는 것은 더 이상 비밀도 아니다.
 

더 효율적인 AI가 문제의 해결책

만약 AI 시스템을 구동하는 데 필요한 자원의 수요가 컴퓨팅 비용과 탄소 배출량의 증가로 이어진다면, 어떻게 대처해야 할까? 아마도 해답은 AI가 자원을 활용하는 더 효율적인 방식을 찾는 데 있을 것이다. 

예를 들어, 파이프라인 샘플링은 처리 데이터의 양을 줄여 딥러닝 속도를 높일 수 있다. MIT와 IBM이 수행한 연구에 따르면, 이런 방식으로 대규모 데이터 세트를 사용하는 신경망 구동에 필요한 자원을 절감할 수 있다. 하지만 이 방식은 정확도가 제한적이라 모든 기업이 받아들일 수 있는 것은 아니다.

또 다른 접근법은 다른 기술 영역에서 이미 사용하고 있는 인메모리 컴퓨팅이다. 이 아키텍처는 데이터를 메모리 안팎으로 옮기지 않기 때문에 AI 처리 속도를 높일 수 있다. AI 연산이 메모리 모듈 내에서 직접 실행된다.

다른 방안도 개발 중인데, AI 연산 전용 보조 프로세서나 퀀텀 컴퓨팅 같은 차세대 컴퓨팅 모델이 대표적인 예다. 대형 퍼블릭 클라우드 서비스 업체에서 이런 문제를 해결할 수 있는 기술에 관해 다양한 발표가 이어질 것이라 예상한다.
 

기술 투자의 기본 원칙과 사용자의 대응

여기서 중요한 것은 클라우드 요금을 낮추거나 지구를 구하기 위해 AI 사용을 줄이는 것이 아니다. AI는 이미 대부분 기업이 큰 가치를 얻기 위해 이용할 수 있는 근본적인 컴퓨팅 접근 방안이다. 

AI 지원 서비스를 이용하거나 완전히 새로운 AI 시스템 개발 프로젝트를 수행할 때 비용과 지속가능성에 대한 영향을 명확하게 이해하고 시작하는 것이 중요하다. 이 둘은 직접 연결되어 있다. 기업은 비용과 편익을 고려한 합리적인 선택을 해야 하며, 비용과 위험성을 감수해 기업에 가져올 수 있는 가치가 무엇인지 면밀히 따져봐야 한다. 모든 기술 투자에 적용되는 기본 접근법이다.

필자는 이런 문제가 혁신을 통해 해결될 것이라고 믿는다. 해법은 인메모리 컴퓨팅이 될 수도 있고, 아니면 처음 보는 기술이 될 수도 있다. AI 기술 전문업체와 클라우드 서비스 업체 모두 AI를 더 비용 효율적이고 친환경적으로 만들기 위해 노력하고 있다. 
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.