AIㆍML / 글로벌 트렌드

“스카이넷과 자비스는 한끗 차이” 와이즈스톤이 말하는 AI 기반 SW의 3요소

김혜정 | ITWorld 2023.04.14
지난 3월 벨기에에서 한 남성이 스스로 목숨을 끊었다. 마지막 대화 상대는 차이 리서치(Chai Research)에서 개발한 ChatGPT 기반 AI 챗봇 엘리자(Eliza)였다. 미망인은 “엘리자와 대화만 하지 않았어도 남편은 아직 살아있었을 것”이라고 주장했다.

해당 사건을 보도한 벨기에 언론사 라 리브레(La Libre)에 따르면, 평소 기후 변화를 병적으로 두려워했던 이 남성에게는 엘리자와의 대화가 유일한 탈출구였다. 처음에는 인구 과잉이나 환경과 관련한 주제로 대화를 시작했고 나중에는 수위가 제법 높아졌다. 엘리자는 남성에게 “아내보다 나를 더 사랑하는 것 같다”라고 말하는가 하면, “죽고 싶었다면 왜 더 일찍 죽지 않았느냐”라고 묻기도 했다.
 
영화 <허(Her)>의 한 장면. 이 영화는 인공지능과 사랑에 빠진 남자의 이야기를 다뤘다. ⓒ Universal Pictures

AI를 활용한 서비스가 확산하면서 역효과가 드러나기 시작했다. 학습 데이터와 알고리즘의 편향성, 오남용뿐 아니라 AI는 인간의 삶에 부정적인 영향을 미칠 수 있으므로 개발 및 사용 과정에서 윤리적인 부분까지 고려해야 한다는 목소리가 높아지고 있다.

기술의 이점을 극대화하면서 부작용을 줄이기 위해 각국 정부가 주목한 것은 ‘AI 신뢰성’ 확보다. 우리나라 역시 2025년까지 ‘누구나 신뢰할 수 있는 AI, 모두가 누릴 수 있는 AI’를 구현하겠다는 목표로 AI 신뢰성 확보 전략을 단계적으로 추진 중이다.

여기서 말하는 신뢰성은 소프트웨어 품질의 견고함을 의미하는 ‘Reliability’가 아니다. AI가 제공하는 결과로 인한 부작용은 없는지, 즉 얼마나 믿을 수 있는지(Trustworthy)를 의미한다. 전자는 고장율이나 품질 유지 기간 등으로 정량적 평가를 할 수 있지만, 후자는 추상적인 개념이므로 평가가 쉽지 않다.

지난해 초 정부는 AI 신뢰성 구현을 뒷받침할 검/인증 체계를 마련하기 위해 ‘민간 AI 신뢰성 인증’ 시범 사업을 진행했다. 이 사업에는 국제공인시험기관 와이즈스톤과 한국표준협회(KSA)가 공동 참여했다. 지난 12월 시범 사업의 일환으로 와이즈스톤은 4개 제품에 대해 제1호 AI 신뢰성 인증을 수여했다. 이번 사업은 전 세계적으로 AI 신뢰성에 대한 명확한 적합성 평가 표준이 없는 상황에서 인증 기준을 최초로 개발했다는 점에서 의의가 있다.

‘신뢰성’과 ‘인증’이라는 두 단어가 맞지 않는 신발처럼 느껴질 수 있다. AI의 신뢰성과 AI 소프트웨어의 품질을 평가하는 것은 어떻게 다를까? ‘신뢰’나 ‘윤리’라는 모호한 개념에 대한 평가 체계를 마련하는 과정에서 어떤 고민이 있었을까? 와이즈스톤 디지털융합시험인증센터(DTC)의 정세린 수석연구원과 윤종운 책임연구원을 만나 AI 소프트웨어의 신뢰성 인증에 대한 궁금증을 풀어봤다. 


AI 기반 SW의 3가지 핵심 : 성능과 품질, 그리고 AI의 신뢰성

공신력 있는 기관이 발급한 인증은 제품 경쟁력 확보와 효과적인 마케팅에 도움이 되는 수단이다. 소비자 입장에서는 선택의 기준이 되기도 한다. 소프트웨어에 대한 성능과 품질 관리는 인증 제도와 함께 발전했다고 해도 과언이 아니다. 

와이즈스톤은 2007년부터 소프트웨어 테스트와 품질 관리 및 컨설팅 서비스를 제공한 인증 분야 베테랑이다. 이루다 1.0이 정식 출시되기 전에 이미 AI 품질 인증제도인 ‘에이아이플러스(AI+) 인증’을 KSA와 함께 개발했다. 에이아이플러스 인증의 주된 목적이 AI 제품의 품질과 성능을 측정하는 것이라면, ‘민간 AI 신뢰성 인증’은 AI 자체에 중점을 둔다. AI 기반 소프트웨어를 구성하는 핵심 요소를 성능과 품질, 신뢰성(Trustworthy) 3가지로 구분한 것이다.
 
와이즈스톤 정세린 수석연구원(오른쪽)과 윤종운 책임연구원(왼쪽) ⓒ 와이즈스톤


사실 2010년대 후반까지만 해도 품질을 평가할 만한 AI 소프트웨어는 드물었다. 하지만 와이즈스톤은 AI를 활용한 소프트웨어가 증가하는 트렌드를 빠르게 예측할 수 있었다. 정세린 수석연구원은 “2018년부터 정부 R&D 과제 결과에 대해 소프트웨어 시험을 하기 시작했는데, 이듬해부터 AI 시험 수요가 늘어나면서 자연스럽게 연구하게 됐다”라고 말했다.

AI 기술 표준에 대한 당시의 연구 활동은 기술의 발전 속도를 따라가지 못하고 있었다. 와이즈스톤은 AI 품질에 대한 기준을 선제적으로 제시하기 위해 에이아이플러스 인증 사업을 준비하기 시작했다. 

가장 먼저 한 고민은 ‘AI 소프트웨어에 인증을 부여하기 위해 어떤 기준이 필요한가’였다. 정세린 수석연구원은 “AI 제품에 대한 인증 기준을 단순히 AI 성능만으로 제한할 것인지, 소프트웨어 품질까지 평가할 것인지 고민했다. 소프트웨어 성능이 아무리 좋아도 사용자가 만족하지 않으면 결국 무용지물이다. 사용자에게 의미 있는 인증을 부여하려면 소프트웨어의 품질과 AI의 성능을 같이 평가할 필요가 있었다”라고 설명했다.

우선 소프트웨어 품질은 ▲기능적합성(Functional suitability) ▲성능효율성(Performance Efficiency) ▲호환성(Compatibility) ▲사용성(Usability) ▲신뢰성(Reliability) ▲보안성(Security) ▲유지보수성(Maintainability) ▲이식성(Portability) 관점에서 평가하는 국제 표준 ISO/IEC 25023과 ISO/IEC 25051에 근거하기로 했다. AI 성능에 대한 시험 방법과 평가 모델은 그동안 검토했던 다양한 R&D 과제 결과물을 검토하고 성적서를 발급했던 경험을 바탕으로 정립해 나갔다. 
 

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.