AIㆍML

KT, ‘엔비디아 AI’로 스마트 스피커 및 고객 콜센터 훈련

편집부 | ITWorld 2022.09.22
KT가 엔비디아 AI로 스마트 스피커와 고객 콜센터를 훈련했다고 엔비디아는 밝혔다. 
 
ⓒ 엔비디아

매일 800만 명의 사용자와 대화하는 KT의 AI 기반 스피커 기가지니는 TV를 제어하고, 실시간 교통 정보를 제공하고 기타 집안에서의 다양한 업무를 수행한다. 대형의 텍스트 데이터 세트를 기반으로 인간 언어를 인식, 이해, 예측 및 생성할 수 있는 머신러닝 알고리즘인 대형언어 모델(LLM) 덕분에 매우 복잡한 한국어 대화 기술을 숙달했다. 

KT의 모델은 엔비디아 DGX 슈퍼(Super)POD 데이터센터 인프라 플랫폼과 네모메가트론(NeMo Megatron) 프레임워크를 사용해 수십억 개의 매개변수를 가진 LLM을 훈련하고 배포한다. 

한국어는 세계에서 가장 어려운 언어 목록에 꾸준히 포함돼 왔다. 한국어에는 네 가지 유형의 복합동사가 존재하며, 한국어 단어는 종종 두 개 이상의 어근으로 구성된다. 

2,200만 명이 넘는 가입자를 보유한 KT는 자체 LLM을 개발해 스마트 스피커의 단어에 대한 이해도를 높였다. 또한 2,000억 개 이상의 매개변수를 가진, 적용 분야 별 최적화된 다양한 버전의 LLM들을 사업에 적용하고 있다. 더불어 기가지니는 아마존 알렉사(Alexa)와의 통합을 통해 사용자와 영어로 대화할 수 있다. 

KT의 LLM 개발팀 류휘정 팀장은 “트랜스포머 기반 모델을 통해 기가지니 스마트 스피커와 고객 서비스 플랫폼 AI 컨택센터(AICC)의 품질이 크게 향상됐다”라고 말했다. 

AICC는 AI 음성 에이전트 및 기타 고객 서비스 관련 애플리케이션을 제공하는 올인원 클라우드 기반 플랫폼이다. AICC는 전화를 받고 요청된 정보를 제공하거나 고객을 상담원과 빠르게 연결해 보다 자세한 문의에 대한 답변을 제공할 수 있다. KT에 따르면 인간의 개입이 없이 AICC는 매일 전국적으로 10만 건 이상의 전화를 관리하고 있다. 

LLM을 개발하는 것은 심도 있는 기술 전문 지식과 전체 스택 기술 투자가 필요한 값비싸고, 시간 소모적인 과정일 수 있다. 엔비디아 AI 플랫폼은 KT를 위해 이 과정을 간소화하고 가속화했다. 

류 팀장은 “엔비디아 DGX 슈퍼POD의 강력한 성능과 네모 메가트론의 최적화된 알고리즘 및 3D 병렬 처리 기술을 통해 LLM 모델을 보다 효과적으로 훈련했다”며, “네모 메가트론은 지속적으로 새로운 기능을 채택하고 있으며, 이는 모델 정확도를 개선하는 데 있어 가장 큰 장점이라고 생각한다”고 말했다. 

KT는 네모 메가트론의 하이퍼파라미터 최적화 도구를 사용해 다른 프레임워크보다 LLM을 두배 더 빠르게 훈련했다. 이러한 도구를 통해 사용자는 LLM 훈련 및 추론을 위한 최상의 구성을 자동으로 찾아 개발 및 배포 과정을 쉽고 빠르게 할 수 있다. 

KT는 엔비디아트리톤 추론서버(Triton Inference Server)를 사용해 최적화된 실시간 추론 서비스를 제공하고, 엔비디아 베이스 커맨드매니저(Base Command Manager)를 통해 AI 클러스터에서 수백 개의 노드를 쉽게 모니터링하고 관리할 계획이다. 

KT는 오는 11월 개발자를 대상으로 20여 종의 자연어 이해와 자연어 생성 API를 출시할 예정이다. 애플리케이션 프로그래밍 인터페이스는 문서 요약 및 분류, 감정 인식 및 잠재적으로 부적절한 내용의 필터링을 포함한 작업에 사용할 수 있다. 
editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.