2017.12.22

토픽 브리핑 | '인공지능 탑재 보안'에서 거품을 제거하면 무엇이 남을까

이대영 기자 | ITWorld
한국IDG 조사에 따르면, 국내 IT전문가 가운데 절반 이상이 AI를 중요하게 생각하고 있으며, 27%가 올해 안으로 AI를 도입할 계획이며, 28%는 내년 이후에 도입할 것이라고 답했다.

한국IDG 조사 | 2017년 국내 기업의 인공지능 준비 현황

이처럼 인공지능의 붐은 국내뿐만 아니라 전 세계적인 추세로 자리잡았다. IT 업계뿐만 아니라 일반 기업들도 인공지능과 머신러닝을 도입하고 있다. 하지만 이와 동시에 지난해부터 우려의 목소리가 커지고 있는 것 또한 사실이다.

토픽 브리핑 | 거대한 미래를 꿈꾸는 머신러닝
"자율주행, 머신러닝, 인공지능…" 이름에 낚이지 말아야 할 최신 기술
글로벌 칼럼 | 다시 실망의 기압골로 향하는 인공지능

인공지능 전문가들은 "어느 순간부터 갑자기 모든 애플리케이션과 클라우드 서비스가 머신러닝이나 인공지능으로 무장하고, 당장 마술이라도 부릴 수 있게 된 듯하다"며, "그러나 머신러닝과 인공지능을 둘러싼 마케팅 대부분은 사실과 다르고, 해당되지도 않는 용어를 갖다 붙인 실현할 수 없는 약속이다. 달리 말하자면 죄다 헛소리에 불과하다. 그런 말장난에 속아서는 안 된다"고 지적했다.

"말장난에 속지말자!" 인공지능 또는 머신러닝이 진짜인지 구분하는 법

일각에서는 AI로 간주하기 위해서는 스스로 학습하거나 자율적인 요소가 필요하다고 주장한다. 게임 기획자이자 교수인 이안 보고스트는 최근 디 애틀란틱(The Atlantic)에 "인공 지능이 무의미해졌다"란 기사를 실으며 이 논점을 심층적으로 분석한 바 있다.

AI를 구성하는 요건에 대해 보고스트는 "기계는 자율 의지 및 의외성은 물론이고 지각이 가능할 때, 또는 최소한 전문성을 갖고 작동하기에 충분할 만큼의 자기 인식이 있을 때 AI라고 할 수 있다. 인공 지능이라고 주장하는 시스템을 보면 대부분의 경우 지각, 자기 인식, 자율 의지가 없고 심지어 의외성도 없다. 단순한 소프트웨어일 뿐"이라고 말했다.

보고스트는 AI가 기업의 마케팅 도구로 전락했다고 지적했다. 사람들의 관심을 끌고 첨단 기업인 것처럼 포장해주는 유행어라는 것이다. 마케터들이 설명하는 머신러닝은 대부분 단순한 논리에 불과하다. 프로그래머는 말 그대로 태초부터 소프트웨어 논리를 사용해서 프로그램과 로봇에게 할 일을 지시해왔다. 정교한 논리는 그 논리가 처리하도록 설계된 매개변수를 기반으로 소프트웨어 또는 로봇에 여러 가지 경로를 제공할 수 있다.

오늘날의 하드웨어는 매우 정교한 논리를 실행할 수 있으므로 애플리케이션과 기기는 언뜻 지능을 갖추고 스스로의 행동을 조정할 수 있는 것처럼 보이기도 한다. 그러나 그 대부분은 실제로 학습하지 못한다. 즉, 개발자가 미리 예상하지 못한 상황에 직면할 경우, 진정한 머신 러닝 시스템이 하듯 패턴 분석 기반 시행착오를 통해 스스로 그 상황에 대처해 행동을 조정할 수 없다.

실제 머신러닝이 구현되어 있다 해도 머신러닝 시스템은 그 시스템의 논리가 "아는 것"으로 설정해 둔 매개변수에 구속된다. 진정한 AI와 달리 프로그램된 세계를 벗어나 새로운 사실을 발견할 수 없고 단순히 프로그램된 세계를 스스로 이해하고 상호 작용하는 방법을 학습할 뿐이다.

심층 고찰 : 정말로 인공지능이란 무엇인가

가트너는 기술 성장에 따라 성장과 쇠락을 측정하는 하이프 사이클(Hype Cycle)이라는 도구로 제품의 과대 마케팅도 추적하는데, 가트너는 이처럼 과장된 인공지능을 "AI 워싱(AI Washing)"이라고 부른다. 환경친화적인 제품을 과장하는 행태를 지적하는 "그린워싱(Green Washing)"이나 클라우드 지원 기능을 과장한 "클라우드 워싱(Cloud Washing)"과 같은 맥락이다. 가트너는 1,000곳 이상의 업체가 자사 제품에 AI를 채택했다고 주장하지만, 이들 중 다수가 너무 비판 없이 AI 딱지를 붙이고 있다고 지적했다.

"인공지능 탑재 제품 주의보" 무분별한 AI 워싱 극성

현재 보안업계에서 발표하는 수많은 인공지능 탑재 보안 제품들이 이 범주에 속할 수 있다. 올해 초, RSA 컨퍼런스에서 RSA CTO 줄피카 라즈만은 "업체들이 말하는 머신러닝은 본질적으로 악의적인 컴퓨터의 동작을 찾아내는 알고리즘을 구축하는 것에 불과하다"며, "머신러닝은 분명 많은 발전을 이루었고, 악성코드를 사용하지 않은 공격과 같은 특정 공격을 발견하는 데 매우 유용할 수 있다. 인공지능 기술을 비추는 집중 조명에는 마케팅 활동과 과대포장 역시 포함되어 있다"고 주장했다.

과대광고와 회의론에 빠진 머신러닝 기반 보안 : RSA 컨퍼런스
오라클, 사이버보안 머신러닝 공개...오라클 매니지먼트 클라우드 성능 차별화

현재 출시되는 보안 제품 가운데 상당수가 이런 비판을 벗어나지 못하는 것이 사실이다. 특히 일부 보안 솔루션은 머신러닝 솔루션과 거리가 멀다. 머신러닝에 기반한다는 솔루션 가운데 고객 환경에서 필요한 학습을 하지 못한 솔루션이 대부분이다. 개발업체 클라우드에서 악성코드 샘플을 훈련시킨 모델이 탑재되어 있다. 이를 바이러스 백신 시그니처처럼 고객이 다운로드받는 형태다. 고객 보안에 선행적으로 도움을 주지 않는다. 기본적으로 과거에 바탕을 둔 후행적인 접근법이다.

게다가 실제 사용하기 전에 알고리즘의 학습에 사용되는 트레이닝 데이터 샘플이 미흡할 경우, 또는 구현이 잘못된 경우 나쁜 결과가 나올 수 있다.

머신러닝의 품질은 입력하는 정보의 품질이 결정한다. 쓰레기가 들어가면 쓰레기가 나오는 것이다. 머신러닝 알고리즘 설계가 미흡할 경우, 그 결과를 유용하게 활용할 수 없다. 실험실의 트레이닝 데이터 세트에서 알고리즘이 작동하는 것은 중요하지 않다. 복잡한 네트워크에서 대규모로 작동하는 머신러닝 기반 사이버 보안 솔루션을 구현하는 것이 가장 큰 도전과제다.

하지만 보안에서의 머신러닝은 오랫동안 연구가 이뤄졌으며, 이 기술이 사이버보안 분야에 큰 이점을 가져다준다는 것 또한 부인할 수 없다. 보안 분야의 머신러닝은 지난 10여 년 동안 폭넓게 사용되어 왔다. 예를 들어, 이메일 스팸 필터, 피싱 공격 발견, 악성코드, 온라인 사기, 안티바이러스 등을 탐지하는 데 사용된다.

인공지능 + 인간 = 강력한 사이버 보안
보안에서 본 머신러닝, 머신러닝에서 본 보안, "그 가능성을 엿보다" - IDG Tech Report
AI와 보안이 만났을 때, "실시간으로 해킹을 차단한다"
머신러닝과 가시성 확보를 통한 지능형 위협 대응 전략 - IDG Video Talk Show

가장 명백한 사용 사례는 엔드포인트와 네트워크의 악성 행위, 부정 행위 탐지 또는 SIEM의 패턴 분석이다. 이런 사용 사례가 계속 증가하고 확산될 것이다. 예를 들어, 서비스 방해 방어, 귀책 사유(책임 소재) 규명, 사용자 행동 수정 분야에 적용할 수 있다"고 설명했다. 보안 분야의 머신러닝 사용 사례를 분류해 정리한다면 다음과 같다.

- 악성 행위 탐지와 공격 저지
- 모바일 엔드포인트 분석
- 사람의 분석 능력 및 결과 보강
- 보안 반복 작업 자동화
- 제로데이 취약점 제거


앞서 설명한대로 머신러닝은 '만병통치약'이 아니다. 최소한 테스트와 개념 증명 단계인 지금은 그렇다. 머신러닝 기반의 보안 기술에는 여러 단점과 과제들이 존재한다. 머신러닝 시스템도 오탐지를 할 수 있다(알고리즘이 데이터를 토대로 범주를 추론하는 비지도 학습 시스템). 또한 일부 분석가들은 보안 분야의 머신러닝이 '블랙 박스(내부를 파악하기 힘든)' 솔루션이라고 주장한다. CISO들은 머신러닝 기술의 '내부'를 전적으로 확신하지 못한다. 따라서 개발업체, 그리고 머신의 어깨에 신뢰와 책임을 전가할 수밖에 없다.

보안을 위한 머신러닝 사용 사례 5가지
기대치 높아진 머신러닝 기반 클라우드 보안, 한계도 분명

머신러닝과 보안의 교차점에는 거품이 심하게 형성됐다. '인공지능으로 모든 것을 해결할 수 있다'는 무비판적인 열광이나, '머신러닝은 쓰레기다'라는 허무주의적 체념은 결코 생산적이지 못하다. 엔드게임(Endgame)의 데이터 과학 부문 기술 이사인 하이럼 앤더슨은 "쓸데없는 것을 버리려다 중요한 것까지 버려서는 안 된다. 사용자들은 제대로 질문하도록 교육하고, 마케팅 담당자들은 그 질문에 답하도록 교육해야 한다"고 말했다.

"머신 vs. 머신" AI가 주도하는 사이버 전쟁의 시대가 열린다
머신러닝과 사이버 공격이 만나면…"정교함과 자동화가 만나 위력적일 것"

사이버공격의 속도는 시간이 지날수록 빨라지며 위협 정보의 양은 시간이 지날수록 늘어난다. 특히 최근에는 인공지능이 사이버 공격에 도입될 가능성이 제기됐기 때문이다. editor@itworld.co.kr 


2017.12.22

토픽 브리핑 | '인공지능 탑재 보안'에서 거품을 제거하면 무엇이 남을까

이대영 기자 | ITWorld
한국IDG 조사에 따르면, 국내 IT전문가 가운데 절반 이상이 AI를 중요하게 생각하고 있으며, 27%가 올해 안으로 AI를 도입할 계획이며, 28%는 내년 이후에 도입할 것이라고 답했다.

한국IDG 조사 | 2017년 국내 기업의 인공지능 준비 현황

이처럼 인공지능의 붐은 국내뿐만 아니라 전 세계적인 추세로 자리잡았다. IT 업계뿐만 아니라 일반 기업들도 인공지능과 머신러닝을 도입하고 있다. 하지만 이와 동시에 지난해부터 우려의 목소리가 커지고 있는 것 또한 사실이다.

토픽 브리핑 | 거대한 미래를 꿈꾸는 머신러닝
"자율주행, 머신러닝, 인공지능…" 이름에 낚이지 말아야 할 최신 기술
글로벌 칼럼 | 다시 실망의 기압골로 향하는 인공지능

인공지능 전문가들은 "어느 순간부터 갑자기 모든 애플리케이션과 클라우드 서비스가 머신러닝이나 인공지능으로 무장하고, 당장 마술이라도 부릴 수 있게 된 듯하다"며, "그러나 머신러닝과 인공지능을 둘러싼 마케팅 대부분은 사실과 다르고, 해당되지도 않는 용어를 갖다 붙인 실현할 수 없는 약속이다. 달리 말하자면 죄다 헛소리에 불과하다. 그런 말장난에 속아서는 안 된다"고 지적했다.

"말장난에 속지말자!" 인공지능 또는 머신러닝이 진짜인지 구분하는 법

일각에서는 AI로 간주하기 위해서는 스스로 학습하거나 자율적인 요소가 필요하다고 주장한다. 게임 기획자이자 교수인 이안 보고스트는 최근 디 애틀란틱(The Atlantic)에 "인공 지능이 무의미해졌다"란 기사를 실으며 이 논점을 심층적으로 분석한 바 있다.

AI를 구성하는 요건에 대해 보고스트는 "기계는 자율 의지 및 의외성은 물론이고 지각이 가능할 때, 또는 최소한 전문성을 갖고 작동하기에 충분할 만큼의 자기 인식이 있을 때 AI라고 할 수 있다. 인공 지능이라고 주장하는 시스템을 보면 대부분의 경우 지각, 자기 인식, 자율 의지가 없고 심지어 의외성도 없다. 단순한 소프트웨어일 뿐"이라고 말했다.

보고스트는 AI가 기업의 마케팅 도구로 전락했다고 지적했다. 사람들의 관심을 끌고 첨단 기업인 것처럼 포장해주는 유행어라는 것이다. 마케터들이 설명하는 머신러닝은 대부분 단순한 논리에 불과하다. 프로그래머는 말 그대로 태초부터 소프트웨어 논리를 사용해서 프로그램과 로봇에게 할 일을 지시해왔다. 정교한 논리는 그 논리가 처리하도록 설계된 매개변수를 기반으로 소프트웨어 또는 로봇에 여러 가지 경로를 제공할 수 있다.

오늘날의 하드웨어는 매우 정교한 논리를 실행할 수 있으므로 애플리케이션과 기기는 언뜻 지능을 갖추고 스스로의 행동을 조정할 수 있는 것처럼 보이기도 한다. 그러나 그 대부분은 실제로 학습하지 못한다. 즉, 개발자가 미리 예상하지 못한 상황에 직면할 경우, 진정한 머신 러닝 시스템이 하듯 패턴 분석 기반 시행착오를 통해 스스로 그 상황에 대처해 행동을 조정할 수 없다.

실제 머신러닝이 구현되어 있다 해도 머신러닝 시스템은 그 시스템의 논리가 "아는 것"으로 설정해 둔 매개변수에 구속된다. 진정한 AI와 달리 프로그램된 세계를 벗어나 새로운 사실을 발견할 수 없고 단순히 프로그램된 세계를 스스로 이해하고 상호 작용하는 방법을 학습할 뿐이다.

심층 고찰 : 정말로 인공지능이란 무엇인가

가트너는 기술 성장에 따라 성장과 쇠락을 측정하는 하이프 사이클(Hype Cycle)이라는 도구로 제품의 과대 마케팅도 추적하는데, 가트너는 이처럼 과장된 인공지능을 "AI 워싱(AI Washing)"이라고 부른다. 환경친화적인 제품을 과장하는 행태를 지적하는 "그린워싱(Green Washing)"이나 클라우드 지원 기능을 과장한 "클라우드 워싱(Cloud Washing)"과 같은 맥락이다. 가트너는 1,000곳 이상의 업체가 자사 제품에 AI를 채택했다고 주장하지만, 이들 중 다수가 너무 비판 없이 AI 딱지를 붙이고 있다고 지적했다.

"인공지능 탑재 제품 주의보" 무분별한 AI 워싱 극성

현재 보안업계에서 발표하는 수많은 인공지능 탑재 보안 제품들이 이 범주에 속할 수 있다. 올해 초, RSA 컨퍼런스에서 RSA CTO 줄피카 라즈만은 "업체들이 말하는 머신러닝은 본질적으로 악의적인 컴퓨터의 동작을 찾아내는 알고리즘을 구축하는 것에 불과하다"며, "머신러닝은 분명 많은 발전을 이루었고, 악성코드를 사용하지 않은 공격과 같은 특정 공격을 발견하는 데 매우 유용할 수 있다. 인공지능 기술을 비추는 집중 조명에는 마케팅 활동과 과대포장 역시 포함되어 있다"고 주장했다.

과대광고와 회의론에 빠진 머신러닝 기반 보안 : RSA 컨퍼런스
오라클, 사이버보안 머신러닝 공개...오라클 매니지먼트 클라우드 성능 차별화

현재 출시되는 보안 제품 가운데 상당수가 이런 비판을 벗어나지 못하는 것이 사실이다. 특히 일부 보안 솔루션은 머신러닝 솔루션과 거리가 멀다. 머신러닝에 기반한다는 솔루션 가운데 고객 환경에서 필요한 학습을 하지 못한 솔루션이 대부분이다. 개발업체 클라우드에서 악성코드 샘플을 훈련시킨 모델이 탑재되어 있다. 이를 바이러스 백신 시그니처처럼 고객이 다운로드받는 형태다. 고객 보안에 선행적으로 도움을 주지 않는다. 기본적으로 과거에 바탕을 둔 후행적인 접근법이다.

게다가 실제 사용하기 전에 알고리즘의 학습에 사용되는 트레이닝 데이터 샘플이 미흡할 경우, 또는 구현이 잘못된 경우 나쁜 결과가 나올 수 있다.

머신러닝의 품질은 입력하는 정보의 품질이 결정한다. 쓰레기가 들어가면 쓰레기가 나오는 것이다. 머신러닝 알고리즘 설계가 미흡할 경우, 그 결과를 유용하게 활용할 수 없다. 실험실의 트레이닝 데이터 세트에서 알고리즘이 작동하는 것은 중요하지 않다. 복잡한 네트워크에서 대규모로 작동하는 머신러닝 기반 사이버 보안 솔루션을 구현하는 것이 가장 큰 도전과제다.

하지만 보안에서의 머신러닝은 오랫동안 연구가 이뤄졌으며, 이 기술이 사이버보안 분야에 큰 이점을 가져다준다는 것 또한 부인할 수 없다. 보안 분야의 머신러닝은 지난 10여 년 동안 폭넓게 사용되어 왔다. 예를 들어, 이메일 스팸 필터, 피싱 공격 발견, 악성코드, 온라인 사기, 안티바이러스 등을 탐지하는 데 사용된다.

인공지능 + 인간 = 강력한 사이버 보안
보안에서 본 머신러닝, 머신러닝에서 본 보안, "그 가능성을 엿보다" - IDG Tech Report
AI와 보안이 만났을 때, "실시간으로 해킹을 차단한다"
머신러닝과 가시성 확보를 통한 지능형 위협 대응 전략 - IDG Video Talk Show

가장 명백한 사용 사례는 엔드포인트와 네트워크의 악성 행위, 부정 행위 탐지 또는 SIEM의 패턴 분석이다. 이런 사용 사례가 계속 증가하고 확산될 것이다. 예를 들어, 서비스 방해 방어, 귀책 사유(책임 소재) 규명, 사용자 행동 수정 분야에 적용할 수 있다"고 설명했다. 보안 분야의 머신러닝 사용 사례를 분류해 정리한다면 다음과 같다.

- 악성 행위 탐지와 공격 저지
- 모바일 엔드포인트 분석
- 사람의 분석 능력 및 결과 보강
- 보안 반복 작업 자동화
- 제로데이 취약점 제거


앞서 설명한대로 머신러닝은 '만병통치약'이 아니다. 최소한 테스트와 개념 증명 단계인 지금은 그렇다. 머신러닝 기반의 보안 기술에는 여러 단점과 과제들이 존재한다. 머신러닝 시스템도 오탐지를 할 수 있다(알고리즘이 데이터를 토대로 범주를 추론하는 비지도 학습 시스템). 또한 일부 분석가들은 보안 분야의 머신러닝이 '블랙 박스(내부를 파악하기 힘든)' 솔루션이라고 주장한다. CISO들은 머신러닝 기술의 '내부'를 전적으로 확신하지 못한다. 따라서 개발업체, 그리고 머신의 어깨에 신뢰와 책임을 전가할 수밖에 없다.

보안을 위한 머신러닝 사용 사례 5가지
기대치 높아진 머신러닝 기반 클라우드 보안, 한계도 분명

머신러닝과 보안의 교차점에는 거품이 심하게 형성됐다. '인공지능으로 모든 것을 해결할 수 있다'는 무비판적인 열광이나, '머신러닝은 쓰레기다'라는 허무주의적 체념은 결코 생산적이지 못하다. 엔드게임(Endgame)의 데이터 과학 부문 기술 이사인 하이럼 앤더슨은 "쓸데없는 것을 버리려다 중요한 것까지 버려서는 안 된다. 사용자들은 제대로 질문하도록 교육하고, 마케팅 담당자들은 그 질문에 답하도록 교육해야 한다"고 말했다.

"머신 vs. 머신" AI가 주도하는 사이버 전쟁의 시대가 열린다
머신러닝과 사이버 공격이 만나면…"정교함과 자동화가 만나 위력적일 것"

사이버공격의 속도는 시간이 지날수록 빨라지며 위협 정보의 양은 시간이 지날수록 늘어난다. 특히 최근에는 인공지능이 사이버 공격에 도입될 가능성이 제기됐기 때문이다. editor@itworld.co.kr 


X