AIㆍML

엔비디아, ‘챗 위드 RTX’로 윈도우 PC서 맞춤형 챗봇 제공

편집부 | ITWorld 2024.02.14
엔비디아가 사용자만의 콘텐츠로 챗봇을 개인화할 수 있는 ‘챗 위드 RTX(Chat With RXT)’를 윈도우 PC에서 제공한다고 밝혔다.
 

챗 위드 RTX는 사용자가 자신만의 콘텐츠로 챗봇을 개인화할 수 있는 기술 데모다. 최소 8GB의 비디오 랜덤 액세스 메모리 또는 VRAM을 갖춘 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상으로 가속되며, 현재 무료로 다운로드할 수 있다.

챗 위드 RTX는 RAG(Retrieval-Augmented Generation), 엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, 엔비디아 RTX 가속화 등을 사용해 로컬 지포스 기반 윈도우 PC에 생성형 AI 기능을 제공한다. 사용자는 PC의 로컬 파일을 데이터셋으로 미스트랄(Mistral)이나 라마 2(Llama 2)와 같은 오픈소스 LLM에 빠르고 쉽게 연결해 상황에 맞는 빠른 답변을 얻을 수 있다고 업체 측은 설명했다.

사용자는 메모나 저장해둔 콘텐츠를 검색하는 대신 간단한 검색어를 입력해 챗봇을 이용할 수 있다. 예를 들어 “라스베이거스에 있을 때 내 친구가 추천한 레스토랑이 어디야?”라고 질문하면, 챗 위드 RTX가 사용자가 지정한 로컬 파일을 스캔해 상황에 맞는 답변을 제공한다.

챗 위드 RXT는 .txt, .pdf, .doc/.docx, .xml 등 다양한 파일 형식을 지원한다. 애플리케이션에서 해당 형식의 파일을 포함한 폴더를 가리키면 해당 파일들이 바로 라이브러리에 로드된다.

사용자는 유튜브 동영상 혹은 재생 목록 정보도 챗봇에 통합할 수 있다. 챗 위드 RTX에 동영상 URL을 추가하면 된다. 예를 들어, 좋아하는 인플루언서 동영상의 콘텐츠를 기반으로 여행 추천을 요청하거나, 우수한 교육 자료를 기반으로 빠른 튜토리얼과 사용법을 안내를 받을 수 있다.

챗 위드 RTX는 윈도우 RTX PC와 워크스테이션에서 로컬로 실행되므로 결과가 빠르게 제공되고 사용자 데이터는 디바이스에 그대로 유지된다. 또한 클라우드 기반 LLM 서비스 대신 챗 위드 RTX를 사용하면 민감 데이터를 제3자와 공유하거나 인터넷에 연결하지 않고도 처리할 수 있다고 업체 측은 강조했다. 

챗 위드 RTX는 최소 8GB의 VRAM이 탑재된 지포스 RTX 30 시리즈 이상의 GPU와 윈도우 10, 11 그리고 최신 엔비디아 GPU 드라이버에서 사용할 수 있다. 엔비디아 측은 챗 위드 RTX가 RTX GPU로 LLM을 가속화할 수 있는 잠재력을 보여준다고 설명했다.

해당 애플리케이션은 깃허브(GitHub)에서 이용할 수 있는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 기반으로 제작됐다. 개발자는 이 레퍼런스 프로젝트를 통해 텐서RT-LLM으로 가속화된 RTX용 RAG 기반 애플리케이션을 직접 개발하고 배포할 수 있다.
editor@itworld.co.kr
 Tags 엔비디아

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.