AIㆍML / 클라우드

알리바바 클라우드, AI 어시스턴트 ‘팅우’와 LLM ‘통이치엔원’ 결합

편집부 | ITWorld 2023.06.02
알리바바 클라우드가 대규모 언어 모델(LLM) ‘통이치엔원(Tongyi Qianwen)’을 AI 미팅 어시스턴트 ‘팅우(Tingwu)’와 결합했다고 6월 2일 발표했다.

통이치엔원은 알리바바 클라우드가 최근 공개한 대규모 언어 모델이며, 이를 팅우에 결합해 멀티미디어 콘텐츠를 더 높은 정확성과 효율성으로 이해하고 분석하는 것이 가능해졌다고 업체 측은 설명했다. 가령 비디오 또는 오디오 파일에서 내용이 요약된 텍스트를 생성하거나 각 화자의 주요 요점을 정리해 준다. 또 멀티미디어 파일들의 타임라인을 생성하거나 섹션별 요약본을 개발한다.
 

알리바바 클라우드는 이 대규모 언어 모델을 기반으로 한 팅우를 ‘통이 팅우(Tongyi Tingwu)’라 명명하고 현재 베타 테스트 중이다. 통이 팅우는 알리바바의 디지털 협업 업무 공간이자 애플리케이션 개발 플랫폼인 ‘딩톡(DingTalk)’에도 적용돼 업무 간 필요한 AI 서비스를 제공할 예정이다. 통이팅우는 업무 효율성을 개선하는 것 외 다양한 멀티미디어 플랫폼에서 온라인 교육, 트레이닝, 인터뷰, 라이브 스트리밍, 팟캐스트, 숏폼 비디오 등에 활용되며 더욱 빠르고 쉬운 지식의 공유를 돕는다.

알리바바 클라우드 인텔리전스의 징런 저우 CTO는 “우리는 매일 점점 더 많은 양의 비디오와 오디오 콘텐츠를 다양한 방식으로 소비하는 시대에 살고 있다. 이에 발맞춰 대규모 언어 모델을 적용한 통이 팅우는 멀티미디어 콘텐츠의 빠르고 심도 있는 이해와 쉬운 공유를 가능하게 돕는다”라며, “향후 통이치엔원을 점차 더 많은 제품과 서비스에 결합해 사용자들이 업무, 학습, 놀이 등에서 강력한 AI 기술 혁신의 혜택을 누릴 수 있도록 할 예정”이라고 말했다.

팅우는 알리바바그룹의 글로벌 연구 기관 다모 아카데미에서 자체 개발한 음성인식 모델 ‘파라포머(Paraformer)’와 화자 구분 모델 ‘캠++(CAM++)’ 등 자사의 오디오 및 비디오 모델들과 새로 공개한 대규모 언어 모델 통이치엔원을 활용해 더 정확하게 오디오·비디오를 텍스트로 변환하며 다양한 AI 기반을 제공한다. 

통이 팅우의 AI 기반 신규 기능들은 올해 말 제공 예정이다. 추가될 기능으로 오디오·비디오파일 내 사용자 질문에 대한 답변을 텍스트로 자동 개발하고 영상 내 파워포인트 슬라이드들을 바탕으로 요약본을 생성하는 것이 있다. 또한 크롬 플러그인과 팅우를 활용해 멀티미디어 콘텐츠에 대한 영어와 중국어 간 실시간 번역 서비스도 제공한다. 6월 1일(현지 시각)부터 팅우 웹사이트에 접속하면 알리바바 클라우드 계정을 통해 업그레이드된 AI 기반의 팅우 서비스를 체험할 수 있다. 또한, 시범으로 무료 텍스트 변환 서비스를 이용할 수 있다.

한편 알리바바 클라우드는 지난 4월 11일 통이치엔원을 공개했으며, 추후 알리바바의 다양한 비즈니스에 결합해 사용자 경험을 개선할 예정이라고 밝힌 바 있다. 개발자뿐만 아니라 고객들도 이 거대 언어 모델을 활용해 저렴하게 맞춤형 AI 기능을 개발할 수 있다.

더불어, 알리바바 클라우드는 석유화학, 전기, 운송, 호텔, 엔터프라이즈, 통신, 금융 등 다양한 분야의 파트너들과 함께 산업별로 맞춤화된 대규모 언어 모델을 공동 개발하는 것을 목표로 하는 '통이치엔원 파트너십 프로그램(Tongyi Qianwen Partnership Program)'을 진행하고 있다.
editor@itworld.co.kr
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.