소프트웨어 개발을 쉽게 만드는 머신러닝 5종

Serdar Yegulalp | InfoWorld 2019.07.26
머신러닝을 사용하는 개발자와 대화해 보면 어느 순간 AI 지원 애플리케이션과 툴을 만드는 데 필요한 것들, 예를 들면 텐서플로우(TensorFlow)나 파이토치(PyTorch), 사이킷런(Scikit-learn) 등으로 화제가 옮겨가곤 한다.
 
ⓒ Getty Images Bank

그러나 머신러닝이 소프트웨어 개발에 영향을 주는 또 다른 방식이 있다. 즉 프로그래밍을 더 쉽게 하고 생산성을 높이기 위해 머신러닝 기술을 사용하는 새로운 개발툴이다. 머신러닝을 개발 프로세스 내에 접목하려는 프로젝트 5개를 소개한다. 3개는 상용, 2개는 실험적 프로젝트다.

카이트
카이트(Kite)는 코드 완성 툴로, 대부분 주요 코드 편집기에서 사용할 수 있다. 머신러닝 기술을 이용해 타이핑할 때 코드를 자동으로 추가해준다.

카이트가 사용하는 머신러닝 모델은 깃허브에서 공개적으로 사용할 수 있는 코드를 이용해 만들었다. 주석 문법 트리를 추론해 모델의 기초로 활용한다. 카이트에 따르면 이런 과정을 통해 단순히 텍스트가 아니라 문맥과 코드의 의도를 파악한 후 자동 제안, 자동 완성 기능을 지원한다. 카이트는 현재 파이썬 개발자만 사용할 수 있다. 고 언어를 지원하는 작업이 진행 중이다. 그동안 윈도우와 맥OS 사용자만 사용할 수 있었지만 이제는 리눅스도 지원한다.

한편 카이트는 지난 2017년 오픈소스 커뮤니티 사이에서 논란이 된 바 있다. 사용자 데이터를 자사 서버로 전송하는 것과 아톰(Atom)용 자동완성 파이썬(autocomplete-python) 패키지의 관련 기능 수정에 대한 것이었다. 업체는 이후 이 두 가지 문제를 해결하기 위해 노력해 왔다. 카이트는 더는 사용자 코드를 클라우드 서버로 전송하지 않으며, 모든 작업을 로컬에서 처리한다고 주장한다. 자동완성 파이썬 패키지가 카이트의 재정지원을 받는다는 것을 명시적으로 밝히기도 했다.

코도타
코도타(Codota)는 얼핏 보면 카이트와 비슷하다. 자바와 코틀린 코드로 학습한 머신러닝 모델을 이용해 사용자가 입력할 때 이들 언어에 대한 자동완성을 제안한다. 카이트처럼 코도타는 모델에 필요한 데이터로 코드의 문법 트리를 이용하며 텍스트는 거의 활용하지 않는다. 반면, 한바탕 논란 끝에 수정된 카이트와 달리 코도타는 자동완성을 구성하고 예측 결과를 제공하는 데 여전히 클라우드 기반 서비스를 활용한다. 단, 서비스 문서에 따르면 코도타는 사용자가 작성 중인 코드를 코도타 서버에 전송하지 않는다. 대신 현재 편집 중인 파일에서 '최소한의 문맥 정보'만 사용해, 현재의 제한된 범위 내에서 예측을 제공한다.

코도타는 윈도우와 맥OS, 리눅스 등에서 사용할 수 있다. 편집기 지원은 좀 제한적인데 인텔리제이(IntelliJ)와 안드로이드 스튜디오(Android Studio), 이클립스(루나 이후 버전) 등이다. 자바와 코틀린 언어에 초점을 맞춘 툴임을 고려하면 이해가 되는 대목이다. 업체는 다른 언어에 대한 지원을 추가할 예정이며 자바스크립트를 가장 먼저 추가할 것이라고 설명했다. 웹스톰(WebStorm), 젯브레인(JetBrains) 자바스크립트 IDE에 대해서는 이미 베타 버전으로 지원한다. 코도타 무료 버전은 공개된 코드에서 생성한 예측을 지원한다. 기업용 버전(가격은 별도 문의)은 학습에 프라이빗 코드 리포지토리를 사용할 수 있다.

딥코드
딥코드(DeepCode)는 자동으로 AI 기반의 코드 리뷰를 수행해 잠재적인 보안 취약점을 찾아낸다. 카이트, 코도타와 마찬가지로 일반적인 패턴을 찾기 위해 공개 리포지토리에서 사용할 수 있는 코드를 분석하는데, 보안 취약점을 찾기 위해 패턴을 사용한다는 점만 차이가 있다. 딥코드는 '오염 분석(taint analysis)'에 초점을 맞췄다. 사용자의 입력이 보안 측면에서 민감한 지점에 도달하기 전에 을 어떻게 취급할 것인지 결정한다. 검증 없이 사용자 입력에서 직접 전달되는 데이터는 오염된 것으로 간주해 경고를 띄운다.

딥코드가 치명적인 버그라고 분류하는 것은 웹 애플리케이션에서 발견한 일반적인 보안 문제를 포함한다. 크로스 사이트 스크립팅, SQL 인젝션 공격. 리모트 코드 실행, 패스 트래버설 공격이 대표적이다. 딥코드 분석은 깃허브와 비트버킷 리포지토리에서 사용할 수 있다. 오픈소스 프로젝트나 프라이빗 프로젝트에 대해서는 최대 30명 개발자까지 비용을 받지 않는다. 또한 깃허브 엔터프라이즈 같은 온프레미스 코드 호스팅에 대해서도 스캔할 수 있다(비용은 별도 문의).
 
마이크로소프트 프로즈
프로즈(PROSE)는 'PROgram Synthesis using Examples'의 약자다. 이 마이크로소프트 프로젝트는 샘플 입출력에서 코드를 생성하는 SDK다. 단, 프로즈는 그 자체가 예측적 코딩 툴은 아니다. 단지 예측적 코딩 틀을 만드는 데 사용할 수 있는 툴킷이다. 프로즈를 사용할 수 있는 애플리케이션으로는 예제를 이용한 텍스트 변환이 대표적이다. 마이크로소프트 엑셀의 '플래시 필(Flash Fill)' 기능을 떠올리면 편하다. 로그 분석 같은 텍스트 파일에서 데이터를 추출한 후 칼럼으로 텍스트를 구분하는 등 예측적 작업을 처리한다.

픽스투코드
픽스투코드(Pix2code)의 기능 설명을 처음 들으면 마치 공상과학 같다. 그래픽 UI의 화면을 집어넣으면 픽스투코드가 GUI를 만드는 코드를 생성하기 때문이다. 픽스투코드는 함께 제공되는 데이터셋으로 학습한 딥러닝 모델을 이용해 안드로이드 XML과 iOS 스토리보드, HTML/CSS 포맷으로 GUI를 생성한다. 픽스투코드는 아직은 실험적인 프로젝트다(교육 목적으로만 공유할 수 있다). 따라서 이 서비스를 이용한 모든 결과물은 향후 프로젝트 개선에 사용될 수 있다. ciokr@idg.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.