Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

머신러닝

“반복 속도가 AI의 성패를 결정한다” 산업/제조 현장 AI를 위한 MLOps 전략 - Tech Summary

AI가 전 산업군으로 확산하고 있지만, 산업/제조 현장의 AI는 진퇴양난의 어려움을 겪고 있다. 산업용 AI는 각 기업 고유의 환경에 특화된 목적으로 개발되기 때문에 데이터의 품질이나 규모가 미흡한 경우가 많고, 개발 및 구축 환경의 격차도 크기 때문에 커스텀 AI 구축이 불가피한 경우가 많다. 이를 위해서는 산업 현장의 다양한 데이터셋과 문제에 대응할 수 있도록 ML 라이프사이클 전 과정에서 유연성을 보장하고, 끊김없는 운영이 가능해야 한다. 또한, 머신러닝 모델의 개발과 배포, 운영 환경을 표준화해 머신러닝 라이프사이클의 반복 속도를 높여야 한다. 제조/산업 현장 AI의 당면 과제를 살펴보고, 성공적인 AI 구현 방안을 제시한다. 주요 내용 - 1만 개의 제조기업을 위한 1만 개의 머신러닝 모델 - 빠른 반복으로 더 좋은 결과를 얻는 OODA 루프 - OODA 루프 가속화를 위한 조건 : MLOps - 산업용 AI에 특화된 MLOps - 이상 탐지 사례로 확인하는 MLOps의 가능성 - 산업의 “진짜 문제”를 해결하는 AI를 도입하는 방법

머신러닝 라이프사이클 OODA루프 4일 전

'모델옵스'가 예방할 수 있는 ML 모델의 '패착' 5가지

기업 내 데이터 과학 팀이 비즈니스 목표를 설정했다고 가정해보자. 데이터 애널리틱스 및 머신러닝 모델을 활용해 비즈니스 가치를 창출할 수 있는 영역에 초점을 맞췄다. 데이터 세트 태깅, 사용할 머신러닝 기술, 머신러닝 모델 생성을 위한 프로세스까지 모든 준비가 끝났다. 확장 가능한 클라우드 인프라도 마음껏 쓸 수 있다. 이제 정말 머신러닝 모델을 만들어 현장에 적용하면 되는 걸까?    회사의 데이터 과학 팀이 비즈니스 목표를 설정했다고 가정해보자. 데이터 애널리틱스 및 머신러닝 모델을 활용해 비즈니스 가치를 창출할 수 있는 영역에 초점을 맞췄다. 데이터 세트 태깅, 사용할 머신러닝 기술, 머신러닝 모델 생성을 위한 프로세스까지 모든 준비가 끝났다. 확장 가능한 클라우드 인프라도 마음껏 쓸 수 있다. 이제 정말 머신러닝 모델을 만들어 현장에 적용하면 되는 걸까?  몇몇 전문가는 아니라고 말한다. 모든 혁신과 새로운 소프트웨어 배포는 위험 요소를 수반하므로 재차 검토해 예방할 수 있는 전략을 세워야 한다. 데이터 과학 프로세스를 개발할 때 처음부터 위험 관리 수칙을 수립하는 것이 중요하다. 오딧보드(AuditBoard)의 위험 및 기술 선임 고문 존 윌러는 “데이터 과학이든 다른 사업 요소이든 혁신과 위험 관리는 늘 함께 가야 한다”라고 말했다.  소프트웨어 개발은 단지 코드를 쓰고 출시한다고 끝이 아니다. 소프트웨어 개발자는 항상 잠재 위험 요소를 고려하고 그에 따른 모범 수칙을 따르려 한다. 그래서 나온 것이 소프트웨어 개발 주기(software development life cycle, SDLC), 원점 회귀(shift-left) 데브옵스 수칙, 관찰가능성 기준이다. 모두 잠재적 위험을 탐지하고 예방하기 위한 노력이다. 새 소프트웨어를 배포한 뒤에 개발팀이 계속 코드를 유지하고 수정할 수 있는 환경을 제공하는 것도 목표 중 하나다. 머신러닝 모델 관리에서 소프트웨어 개발 주기와 같은 역할을 개념이 바로 모델옵스(...

머신러닝 머신러닝모델 ML모델 5일 전

AWS, 머신러닝 기반 공급망 관리 서비스 출시

AWS가 리인벤트 2022(re:Invent 2022)에서 공급망 가시성을 위한 머신러닝 기반의 새로운 애플리케이션 AWS 서플라이 체인(AWS Supply Chain)을 출시했다.  아마존 웹 서비스(AWS)가 여러 ERP 시스템을 쓰는 대기업이 공급업체, 재고, 물류 및 기타 공급망 관련 구성 요소를 통합적으로 볼 수 있도록 설계된 머신러닝 기반 클라우드 애플리케이션을 출시하면서 공급망 관리 분야에 진출했다.     코로나19 팬데믹은 물론, 현재 진행 중인 러시아의 우크라이나 침공까지 전 세계가 공급망 문제를 겪으면서 공급망 관리(SCM)는 엔터프라이즈 애플리케이션 소프트웨어 부문에서 가장 빠르게 성장하는 시장으로 자리 잡았다. 가트너는  2022년 202억 4,000만 달러 규모가 될 것으로 전망했다. 지난 화요일 AWS 리인벤트에서 발표된 AWS 서플라이 체인은 빌트인 커넥터를 통해 기존 ERP 제품군 및 공급망 관리 시스템에 연결해 모든 데이터를 공급망 데이터 레이크로 통합할 수 있고, 이를 통해 실행 가능한 인사이트를 생성하는 것이 가장 큰 특징이다. 내장 커넥터는 아마존닷컴의 자체 공급망 데이터를 바탕으로 사전 학습한 머신러닝 모델을 활용해 ERP 및 공급망 관리 시스템에서 데이터를 추출하고 집계한다.  AWS 서플라이 체인 담당 부사장 디에고 판토자-나바하스는 “오늘날 대부분 기업이 공급망 관리를 위해 서로 다른 시스템을 사용하고 있어 잠재적인 공급망 중단을 식별하는 데 지연이 발생할 수 있다”라고 지적했다.  AWS 관리 콘솔(AWS Management Console)을 통해 액세스할 수 있는 AWS 서플라이 체인은 맥락 정보가 포함된 실시간 지도에 통합 데이터를 시각적으로 표시한다. 판토자-나바하스는 “재고 관리자, 수요 계획자, 공급망 책임자가 잠재적인 중단을 완화하기 위해 재고 부족 또는 지연 등의 맥락 정보와 함께 지도 기반 인터페이스를 사용할 수 있다. 실제 중...

클라우드 AWS 공급망 관리 5일 전

"업무 자동화, 직원 무시하면 위험 요소로 작용할 것"

액센츄어(Accenture)의 전 세계 자동화 부문 책임자 겸 오토메이션 어드밴티지(The Automation Advantage)의 공동 저자 라젠드라 프라사스에 따르면 직장에서의 자동화는 새로운 게 아니다. 지난 수십 년 동안 기업들은 RPA에 몰려들어 일상적인 비즈니스 작업을 자동화했다. 이를 통해 운영을 간소화하고, 오류를 줄이며, 비용을 절감했다.  이제 기업들은 지능형 자동화로 눈을 돌려 핵심 비즈니스 프로세스를 자동화해 수익을 높이고, 효율적으로 운영하며, 탁월한 고객 환경을 제공하려고 하고 있다. 지능형 자동화는 머신러닝, 인공지능, 인지 기술(예: NLP 등)을 사용하여 더 복잡한 프로세스를 처리하고, 더 나은 비즈니스 의사결정을 안내하며, 새로운 기회를 제공하는 스마트한 버전의 RPA라고 프라사스는 말했다.    뉴스위크의 소셜 미디어 부문 책임자 마크 뮤어는 소셜 미디어 관리를 자동화했다며 “이전에는 소셜 미디어 게시물을 모두 수동으로 관리했다. 이를테면 ‘수동으로’ 소셜 페이지에 새로운 이야기를 공유하고, 재활용할 콘텐츠를 파악하며, 다양한 전략을 테스트했다. 자동화된 접근 방식으로 전환한 결과 이러한 프로세스에 훨씬 더 적은 시간을 할애한다”라고 설명했다.  이어 뮤어는 “에코박스(Echobox)의 자동화를 사용하여 어떤 콘텐츠를 소셜 미디어에 공유할지 결정하고, 아울러 게시 방법과 시기를 최적화해 최대한 많은 사용자가 볼 수 있도록 한다. 이를 통해 독자에게 집중하고, 독자를 참여시키는 새로운 방법을 찾는 데 더 많은 시간을 투자하고 있다”라고 전했다. 자동화에 적합한 비즈니스 프로세스 IT 서비스 제공업체 엠파시스(Mphasis)의 글로벌 딜리버리 책임자 라비 베산트라지는 자동화에 적합한 비즈니스 프로세스의 특징을 다음과 같이 소개했다.    • 명확한 단계가 있으며 정형 데이터, 디지털 또는 비디지털 데이터를 처리하는 프로세스  • 수동 인력으...

IT 전략 커리어 IT 스킬 2022.11.22

데이터 과학 생산성 Up! ‘모델옵스’의 5가지 기능 살펴보기

‘2022 모델옵스 현황(State of Modelops 2022)’ 보고서에 따르면 대기업의 51%가 초기 단계의 인공지능 파일럿 또는 실험을 했지만 아직 프로덕션 환경에는 투입하지 않은 것으로 나타났다. 38%만이 AI 투자수익률(ROI)을 이야기할 수 있다고 말했으며, 43%는 적시에 문제를 찾고 해결하는 데 비효율적이라고 답했다.  이는 프로덕션 환경에서 ML 모델을 개발, 제공, 관리하는 ‘생산성’을 향상시킬 방법의 필요성을 강조한다.    ML옵스 또는 모델옵스? 둘 다 필요할 수 있다 알터릭스(Alteryx)부터 AWS 세이지메이커(AWS SageMaker), 다타이쿠(Dataiku), 데이터로봇(DataRobot), 구글 버텍스 AI(Google Vertex AI), 나임(KNIME), 마이크로소프트 애저 머신러닝(Microsoft Azure Machine Learning), SAS까지 오늘날 모델 개발을 위해 선택할 수 있는 애널리틱스 도구가 많다. 데이터 과학팀이 애널리틱스 도구를 통합하고, 실험하며, ML 모델을 배포할 수 있도록 지원하는 ML옵스 플랫폼도 있다.  레디AI(ReadyAI)의 총괄 관리자 겸 딜로이트 컨설팅(Deloitte Consulting)의 전무 로힛 탄돈은 대규모 AI 구축 및 배포에서 ML옵스의 역할을 다음과 같이 설명했다. “기업이 AI 개발 용량을 수십에서 수백 또는 수천 개의 ML 모델로 확장하려고 할 때, 데브옵스가 소프트웨어 개발에 가져온 것과 동일한 엔지니어링 및 운영 원칙의 이점을 누릴 수 있다. ML옵스는 수동적이고 비효율적인 워크플로우를 자동화하고 모델 구성 및 관리의 모든 단계를 간소화하는 데 유용하다.” 많은 ML옵스 플랫폼이 프로덕션 환경에서 배포 및 모니터링 모델을 지원하지만 주요 기능은 개발, 테스트, 프로세스 개선 과정에서 (데이터 과학자에게) 서비스를 제공하는 것이다.  모델옵스(Modelops) 플랫폼 및 프랙티스는 프로덕션 환경...

데이터 과학 데이터 과학자 데브옵스 2022.10.26

자동 초소형머신러닝 스타트업 ‘클리카’, 14억 원 규모 프리시드 투자유치

자동 초소형머신러닝(Auto TinyML) 스타트업인 클리카가 김기사랩, 디캠프, 도담벤처스 및 센드버드 코리아 이상희 대표로부터 14억 원 규모의 프리시드 투자를 유치했다고 밝혔다. 클리카는 이번 투자유치 및 올해 8월 중기부 팁스 선정으로 총 19억 원의 투자 자금을 확보했다.   클리카는 2021년도 3월 창업한 스타트업으로, 자동으로 컴퓨터비전 AI 모델을 95%까지 압축하고 하드웨어와 호환되는 모델 포맷으로 자동 변환하는 원천기술을 개발했다. 현재 클리카는 국내 대기업 2곳과 모델 경량화 PoC를 진행 중이며, 연내 쉽고 간편하게 사용할 수 있는 기업설치형(On-Prem) 자동 초소형머신러닝 솔루션을 선보일 예정이다. 특히, 클리카의 양자화 인식 재훈련(Quantization Aware Retraining) 원천기술은 32bit의 모델을 8bit, 4bit 이하로 압축하는 동시에, 손실된 성능을 재훈련을 통해 복구할 수 있도록 하는 경량화 기술로, 인공지능 몸집을 극적으로 축소시키며 성능을 최대치로 유지시키는 기술이다. 기업에서는 클리카의 경량화 솔루션을 통해 초소형화된 AI 모델을 보다 저렴한 소형 디바이스에 구현할 수 있어, 최대 80%까지 인프라 구축비용 및 클라우드 사용료를 절감할 수 있게 된다고 업체 측은 설명했다. 클리카 CTO 벤아사프는 자율주행 전문업체인 이스라엘 모빌아이에서 빅데이터, 빅모델, 제한적인 소형하드웨어 환경에서 가장 최적화된 인공지능 개발 인프라를 셋업한 전문가로, 모빌아이에 재직중 히브리대학교의 병렬컴퓨팅 연구소의 수석개발자로도 근무했다. 이미 글로벌에서 전문성을 인정받아 글로벌 석학 및 기업들과 함께 하버드대학교 초소형머신러닝 스케일업을 위한 MLOps 강좌 제작에도 참여했다. 클리카 김나율 대표는 “이번 투자유치를 바탕으로 상용화에 박차를 가하고, 빠르게 글로벌 시장으로 확장하는데 총력을 기울일 것”이라고 밝혔다. 이번 투자라운드를 리드한 김기사랩의 관계자는 “클리카는 MLOps 분야 중 초소형머신...

클리카 초소형 머신러닝 2022.09.15

“인간 중심의 AI 혁신, 알아야 할 ABC는…” 美 특허청 CIO

미 특허청(USPTO; US Patent and Trademark Office)은 데이터 애널리틱스와 AI/ML을 활용해 운영 효율성과 성과를 높이고, 시스템 및 프로세스 품질을 개선하고 있다.   AI/ML 알고리즘이 중요하긴 하지만 USPTO의 원칙은 이러한 기술을 개발 및 사용하여 이니셔티브를 개선하고 확장하는 데 있어 ‘인간 우선’ 접근법을 취하는 것이다. AI와 ML 도구는 인간 전문가에게 힘을 실어주고, 작업의 독창성을 높이는 데 도움을 주지만 현시점에서는 인간의 미묘한 뉘앙스나 추론 능력에 필적할 순 없다고 이 기관의 CIO 제이미 홀컴은 밝혔다.    그에 따르면 USPTO는 이 기술을 보완하기 위해 수동적, 능동적으로 수집되는 숙련된 인력 수천 명의 입력을 활용하여 해당 기술이 예상한 결과를 제공하도록 AI 기반 모델을 학습시키고 다듬는다. 한편 이 기관은 설립 이후 1,100만 개 이상의 특허를 부여했으며, 엔지니어, 변호자, 애널리스트, 컴퓨터 전문가 등을 포함하여 1만 2,000명 이상의 직원을 두고 있다.  일선에 있는 특허 심사관의 지속적인 피드백은 AI/ML 모델을 개선해 신제품 개발을 촉진하고, 특허 검색과 분류라는 2가지 핵심 분야를 지원하는 데 사용된다. 홀컴은 방대한 양의 데이터와 가능한 ‘선행 기술’ 출처를 고려할 때 포괄적인 특허 검색을 수행하는 일은 어려울 수 있다고 말했다. 이러한 과제를 해결하기 위해 기술팀은 심사관이 애플리케이션을 면밀히 조사할 때 가장 관련성 높은 소스를 찾을 수 있도록 새로운 특허 검색 도구에 AI 구성 요소를 추가하고 있다.  이는 USPTO가 매년 평균적으로 접수 받는 60만 건 이상의 (특허) 신청서에 약 20페이지 분량의 텍스트 및 그림 또는 이를 설명하는 약 1만 단어가 포함돼 있기 때문에 매우 중요하다. 아울러 해당 기관의 IT는 25만 개 이상의 가능한 범주에서 발명과 관련된 분류 기호를 식별하고 일치시키는 분류 도구도 개발 및 배...

AI 머신러닝 ML 2022.09.14

글로벌 칼럼 | AI/ML 학습용 데이터, 어느 정도가 충분한 것일까

인공지능(AI)의 한계이자 미래는 결국 사람이다. 사람 같은 로봇의 등장을 기대하든 우려하든 상관없이 결국 이 문제가 사람에 달렸다는 사실은 변한 적이 없다. AI 그리고 데이터 과학에서 가장 이상적인 해법은 사람과 기계의 장점을 합치는 것이다. 한동안 AI 업계의 지지자들은 이 방정식의 기계 쪽에 집중하는 경향을 보였다. 하지만 스프링 헬스(Spring Health)의 데이터 과학자 엘레나 다이아크코바에 따르면, 데이터와 그 이면에 있는 기계는 사람이 유용하다고 '이해하는 만큼만' 쓸모가 있다. 이 주제를 더 진전시켜 보자.     불완전한 데이터와 합리적인 의사결정 다이아크코바가 앰플리파이 파트너(Amplify Partners)의 제너럴 파트너인 사라 카탄자로가 주고받은 대화를 보자. 카탄자로는 "데이터 전문가들을 보면, 처음엔 허술하지만 점점 정확하게 고쳐지는 보고서와 분석의 가치를 종종 놓치고 한다. 상당수 결정에는 매우 정확한 인사이트가 필요하지 않다. 약간은 허술한 데이터를 부끄러워할 필요가 없다"라고 말했다. 의사결정을 위해 정확한 데이터가 필요한 것이 아니라는 점을 상기시킨 그의 지적은 일리가 있다. 2016년 우버에 인수된 머신러닝 전문 기업 지오메트릭 인텔리전스(Geometric Intelligence)의 설립자 게리 마커스는 AI와 머신러닝, 딥러닝을 평가하는 핵심 요소는 패턴 인식 툴이 대략의 결과가 필요한 순간에 제대로 잘 작동하는지 여부라고 말했다. 비용이 적게 들고 완벽한 결과를 내는 것은 성공을 판단하는 핵심 요소가 아니라는 것이다. 이런 지적에도, 더 강력한 AI 애플리케이션을 만들기 위해 우리는 점점 더 많은 데이터를 확보하는 데 매진하고 있다. 충분한 데이터를 제공하면 머신러닝 모델이 '대략의 결과'보다 더 좋은 성과를 낼 것이라고 기대하는 것이다. 그러나 안타깝게도, 현실은 이렇게 단순하지 않다. 많은 애플리케이션에서 더 많은 데이터가 도움이 될 수는 있겠지만 실제로는 더 많은 데이터가 필요치 않다....

학습 인공지능 머신러닝 2022.09.13

딥러닝 프레임워크 ‘3파전’··· '텐서플로우 vs 파이토치 vs JAX' 비교

오늘날 딥러닝 연구 및 개발을 주도하는 3가지 프레임워크가 있다. 각각 사용 편의성, 기능 및 성숙도, 엄청난 확장성으로 유명하다. 어떤 프레임워크를 사용해야 할까?  시리, 알렉사, 실시간 번역 앱, 로봇, 자율주행차 등에 들어가는 ‘딥러닝’은 크고 작은 방식으로 삶을 매일 변화시키고 있다. 대부분의 딥러닝 애플리케이션은 텐서플로우, 파이토치, JAX 중 하나를 이용해 작성된다. 그렇다면 개발자 입장에서 기술을 만들 때 어떤 딥러닝 프레임워크를 선택해야 할까?      ‘텐서플로우’의 장점 1970년대와 1980년대에는 ‘IBM 제품을 샀다고 해고된 사람은 아무도 없다(Nobody ever got fired forbuying an IBM)’라는 말은 진리로 통했다. 이제 이 표현을 ‘딥러닝에 텐서플로우를 사용했다고 해고된 사람은 아무도 없다’라고 바꿔 말할 수 있겠다. 하지만 IBM이 1990년대에 들어서면서 도태한것 처럼 공개된 지 7년이 지난 텐서플로우는 지금에도 여전히 경쟁력이 있을까? 확실히 그렇다. 텐서플로우는 그동안 가만히 있지 않았다. 텐서플로우 1.x는 파이썬과 매우 다른 방식으로 정적 그래프를 작성하는 게 전부였지만, 텐서플로우 2.x는 ‘즉시 실행’ 모드를 사용한 모델 빌드가 가능해지면서 좀 더 파이토치 같은 느낌이 났다. 아울러 하이 레벨(high level)에서 텐서플로우는 더 쉬운 개발을 위해 케라스(Keras)를 제공하고, 로우 레벨에서는 속도를 위해 컴파일러를 최적화하는 XLA(Accelerated Linear Algebra)를 제공한다. XLA는 GPU 성능을 향상시키며, 대규모 모델 학습에 뛰어난 성능을 제공하는 구글의 TPU(Tensor Processing Units)를 활용하는 방법이기도 하다. 성숙한 플랫폼에서 잘 정의되고 반복 가능한 방식으로 모델을 제공해야 한다면 ‘텐서플로우 서빙(TensorFlow Serving)’을 이용하면 좋다. 웹, 스마트폰 등 저전력 컴퓨팅 또는 ...

딥러닝 머신러닝 인공지능 2022.09.01

"머신러닝+자율기능" 데브옵스 시대, 새로운 네트워킹의 조건

디지털 트랜스포메이션을 통해 기업은 경쟁 우위 확대, 새로운 수익사업 개발, 고객 경험 개선 등을 실현하고 있다. 그러나 이 모든 것을 위해 데브옵스 엔지니어는 할 일이 많다. 업무의 중요도와 요건에 따라 이를 지원하는 클라우드 서비스 업체의 리소스를 활용하고 쿠버네티스, 마이크로서비스, 기타 클라우드 네이티브 컴퓨팅 툴을 사용해 이른바 '애자일', 즉 더 빠른 속도로 애플리케이션을 구축, 테스트, 배포해야 하는 상황이다.   엔지니어와 애플리케이션 스택이 애자일을 지향하는 만큼 네트워크도 애자일에 적합해야 하는데, 바로 멀티클라우드 환경을 위한 풀스택 자율 네트워킹이다. 이를 통해 기업은 단기간에 투자 가치를 회수할 수 있고 데브옵스 엔지니어는 생산성과 사업 성장을 극대화할 수 있는 수단을 확보할 수 있다.   레거시 네트워킹 툴의 한계 애플리케이션과 서비스의 제공 속도를 높이면 비즈니스 측면에서 많은 장점이 있지만 동시에 감수해야 할 위험과 해결해야 할 과제도 함께 늘어난다. 사용자가 성능 문제를 겪고 결과적으로 생산성이 저하된다면 혁신적인 애플리케이션도 아무 소용이 없다. 따라서 보유한 애플리케이션이 안전한 경험을 제공하는지, 기업과 직원, 고객을 위험에 드러내는지, 모든 규정 준수 요건을 충족하는지 확인해야 한다. IDC에 따르면 클라우드로 이동하는 애플리케이션이 많아지면서 올해 말이면 사상 처음으로 클라우드 투자가 비 클라우드 IT 인프라 투자를 앞지를 전망이다. 또한, 프로시모(Prosimo)의 최신 ‘멀티클라우드 인프라 상태 보고서’에 따르면 기업 91%가 복수의 클라우드를 사용할 계획이며 62%는 2년 이내에 사용할 계획이다. 클라우드 사용 규모가 커질수록 복잡성도 커지기 마련이다. 기업은 이 새로운 역동적 IT 환경을 온프레미스 데이터센터, 엣지 컴퓨팅, 클라우드 인프라에 걸쳐 일관성 있게 오케스트레이션 및 관리하는 데 애를 먹고 있다. 많은 기업이 전통적인 레거시 네트워킹 툴을 사용해 연결성 요건과 씨름해 왔지만, 효...

데브옵스 네트워킹 머신러닝 2022.08.12

"챗봇 지고 예측 분석 뜬다" 2022 국내 인공지능 도입 및 활용 현황 조사 - Market Pulse

오늘날 디지털 트랜스포메이션을 추구하는 기업에 인공지능(AI)과 머신러닝(ML)은 필수로 여겨진다. 시장의 흐름을 읽을 수 있는 새로운 인사이트를 찾아내고 업무를 자동화하는 것은 물론 공급망을 최적화하고 마케팅 성과를 극대화하려면 이 두 기술을 얼마나 잘 사용하느냐가 중요하다. 그렇다면 현재 우리 기업은 AI/ML 기술을 얼마나 어떻게 도입해 어떤 업무에 활용하고 있을까? 조사 결과 최근 2~3년 사이 국내에서 AI/ML 기술이 빠르게 확산한 것으로 나타났다. AI/ML 기술별, 기업규모별 도입, 활용 트렌드의 차이도 명확했다. 구체적인 솔루션 선택에 도움이 되도록 기업이 실제 도입해 사용하는 업체와 제품, 서비스 등도 확인했다. 주요 내용 - 국내 기업 10곳 중 4곳은 AI/ML 이미 활용 중 - 가장 선호하는 AI/ML 기술은 머신러닝/딥러닝 플랫폼과 가상 에이전트 - 머신러닝/딥러닝 ‘대세’, 챗봇 ‘내림세’, 자연어 처리 ‘오름세’ - 주로 IT 업무와 고객 서비스에 적용 - 도입 방식은 상용 솔루션 구매가 압도적 - 해외 클라우드 업체와 국내 IT 서비스 업체가 두각 - AI/ML 도입 시 가장 큰 어려움은 인력과 데이터 - 기업 10곳 중 8곳 “기대했던 효과 얻었다” - 중견기업은 AI/ML의 '무덤' 혹은 '기회의 땅' - 국내 AI/ML 시장의 본격 성장은 지금부터

인공지능 머신러닝 AI 2022.08.03

검색 현대화에 투자할 이유 "하이브리드 업무환경부터 비정형 콘텐츠까지"

필자의 소프트웨어 개발 기술 대부분은 소비자 대면 검색 애플리케이션을 설계, 구축, 지원하는 과정에서 습득했다. 그동안 사용한 검색 기술은 다양하지만 모두 비슷한 개발 패턴이 있었다. 인프라 설정, 데이터 불러오기, 검색 인덱스 구성, 검색 경험 개발 등이다. 데이터 불러오기, 검색 알고리즘 구성, 앱 개발 작업은 시작에 불과했다. 적합성 조율은 추단법에 대한 견해와 요구사항이 다양한 이해관계자 사이의 줄다리기였다. 새로운 규칙을 도입할 때마다 콘텐츠의 태그 설정, 품질 강화, 인덱싱 방식을 재고해야 할 때가 많았다. 성장과 새로운 사용자 페르소나를 뒷받침하기 위해 인프라 확장, 새로운 데이터 소스 추가, 검색 인터페이스 재구성 등의 추가 작업도 있었다.   1세대 검색 기술 이후로 많은 변화와 개선이 있었다. 오늘날 현대화된 검색 플랫폼은 인프라 구축 콘텐츠 소스와의 통합, 적합성 개선 등의 작업을 수월하게 해 준다. 검색 플랫폼 현대화는 비즈니스 차원에서 고객 및 직원 지원을 개선하기 위해서라도 반드시 필요하다. 그러나 필자가 볼 때, 많은 개발 및 데이터 과학 팀에서 진행하는 데이터 활동의 대부분이 정형화된 데이터 소스에 대한 데이터 시각화, 머신러닝, 데이터옵스에 집중되어 있는 실정이다. 비즈니스 문서, 웹사이트, XML 저장소, 기타 원문 데이터 필드와 같은 비정형 데이터의 검색은 추가 기술과 역량이 있어야 잘 할 수 있기 때문에 뒷전으로 밀려날 때가 많다.  이번 기사를 위해 IT, 디지털 경험, 데이터 팀이 검색 기술 현대화를 고려해야 할 이유에 대해 3인의 전문가에게 자문을 구했다.   경험, 개발 도구, 시스템 관리의 간소화 코베오(Coveo)의 제품 및 마케팅 담당 SVP 마크 플로이샌드는 기존에 구현된 검색 기술이 안고 있는 문제 중에서 오늘날 보다 쉽게 해결할 수 있는 것 하나를 소개했다. 플로이샌드는 “그동안 기업 검색 기술은 개별 부서 목표만 염두에 둔 채 부서 내에 구입 또는 구축되어 고립된 경우가...

검색기술 검색애플리케이션 듀얼페르소나 2022.07.13

글로벌 칼럼 | ‘금붕어 기억력 넘어서기’··· 맥락적 AI를 준비할 때다

머신러닝과 패턴인식 기술이 이미 비즈니스 프로세스를 혁신하고 있다. 입력받은 데이터를 자동으로 분석하고, 인사이트를 추출한다. 하지만 SER 그룹의 CEO 존 베이츠 박사는 아직 갈 길이 멀다며, 더 지능적인 프로세스 자동화가 보다 광범위한 엔터프라이즈 환경에 적용되는 단계에 도달해야만 인공지능의 잠재가치가 극대화될 수 있다고 강조했다.    오늘날 인공지능을 기반으로 한다고 주장하는 콘텐츠 관리 시스템이나 서비스의 기억력은 ‘금붕어 수준’에 그친다. 이미지나 패턴은 잘 인식하지만, 그 외의 활용성은 매우 제한적이다. 어떤 문서가 스캔되고, 그 데이터가 대상 시스템에 입력될 때(회계 시스템에 영수증 데이터가 입력될 때) 인공지능의 입장에서 모든 데이터는 매번 처음 만나는 사람과 같다. 즉, 맥락을 이어가지 못하는 것이다. 이 말은 문서 콘텐츠가 다른 문서에 있는, 혹은 다른 문서에서 추출된 내용과 지능적으로 연결되지 못한다는 뜻이다. 이를테면 특정 고객의 주문 내역 데이터가 CRM 시스템에 있는 고객 기록과 연동되지 않는다. 그래서 유용한 고객 인사이트를 추출할 기회를 놓치게 된다.  물론 현재 사용되는 있는 기초적인 수준의 프로세스 자동화만 해도 고객 서비스를  고도화하고 시간과 비용을 절약하고 있다는 데는 의심의 여지가 없다.  그럼에도 기업이 앞으로 디지털 트랜스포메이션을 진전시키고 확실한 경쟁우위를 확보하려면  좀 더 발전한 AI가 필요하다. 다음 단계는 광범위한 기업 생태계에 콘텐츠 관리 시스템을 지능적으로 통합하는 것이다. 모든 문서, 데이터, 시스템 및 기능 부서가 지능적으로 연결된다면 더 효과적인 의사결정을 내릴 수 있으며 복잡한 사내 프로세스가 간소화된다.  단순 이미지 및 패턴 인식을 넘어 지능형 주문이나 영수증 자동화 같은 단일 AI 프로세스를 이제 다른 기업 시스템과 통합할 때가 됐다. 이제 지능형 학습 소프트웨어와 고도의 콘텐츠 관리 시스템을 결합해 ‘맥락적 A...

콘텍스추얼 AI 데이터확장성 데이터 사일로 2022.07.11

이해하기 쉬운 머신러닝 모델을 위한 분류 체계 개발 : MIT 연구팀

MIT 연구팀이 머신러닝 모델을 사용자와 의사결정권자에게 더 잘 설명할 수 있는 방법으로 개발자가 특성(Feature)을 설계하기 쉽게 해주는 분류 체계를 개발했다. 연구팀은 주로 머신러닝 모델의 특성에 대한 해석 가능성(Interpretability)에 중점을 두었다.    이번 분류체계 개발 보고서의 대표 저자인 전기공학 및 컴퓨터 과학 박사 과정의 알렉산드라 지텍은 “최상의 방법으로 머신러닝 모델을 설명한다고 해도 상당한 혼란이 있다는 것을 알게 됐다”라고 개발 동기를 밝혔다. 이런 혼란은 보통 머신러닝 모델 자체보다는 특성에 있다. 머신러닝 모델을 좀 더 이해할 수 있도록 해주는 설명 방법론은 흔히 얼마나 많은 특성이 해당 모델 내에서 사용되어 예측에 기여하는지를 설명한다. 예를 들어, 환자의 심장병 위험성을 예측하는 모델의 경우, 의사는 환자의 심박 데이터가 예측에 얼마나 영향을 미치는지를 알고 싶어 한다. 하지만 이런 특성은 보통 모델 내에 너무 복잡하거나 혼란스럽게 코딩되어 있어서 사용자는 자신이 이해할 수 없는 블랙박스를 사용하게 된다. 분류 체계를 개발하기 위해 MIT 연구팀은 머신러닝 모델의 영향을 받는 사용자를 AI 전문가부터 일반 사용자까지 5가지 유형으로 나누고, 이들이 특성을 이해할 수 있도록 속성을 정의했다. 또한 모델 개발자가 각 특성을 비전문가도 이해하기 쉬운 형식으로 전환할 수 있는 지침도 제공한다. 연구팀은 나중에 설명 가능성에 대해 걱정하는 것보다 개발 과정의 시작 단계부터 해석 가능한 기능을 사용하는 것이 더 낫다고 조언한다. 머신러닝 모델에서 특성이란 입력 변수를 말하며, 보통은 기록 데이터에서 가져온다. 데이터 과학자는 주로 머신러닝 모델에 맞는 특성을 선택하고, 수작업으로 추가 처리를 진행한다. 이 과정에서 데이터 과학자가 중점을 두는 것은 모델의 정확성을 개선하는 방식으로 특성을 개발하는 것이지 사용자나 의사결정권자가 그런 특성을 이해할 수 있도록 만드는 것은 아니다.  연구팀은...

머신러닝 모델링 특성 2022.07.07

“쉽고 빠른 풀스택 접근법” MS 애저 애널리틱스 서비스 7선

비즈니스 데이터를 이해할 수 없다면 사실상 눈을 가린 채로 비행하는 것이나 마찬가지다. 데이터에 숨겨진 인사이트는 비즈니스 운영을 최적화하고 고객 경험을 미세 조정하며, 새로운 제품 또는 새로운 비즈니스를 개발하는 데 필수적이다.  데이터 분석은 이런 인사이트를 발견하기 위한 수단이고, 이를 제대로 하려면 데이터 수집 및 준비, 데이터 보강 및 태깅, 보고서 작성 및 공유, 데이터 및 인사이트 관리 및 보호를 위한 도구가 필요하다. 또한 기업이 점점 더 많은 양의 데이터와 씨름하면서 클라우드는 분석 작업에 안성맞춤인 장소로 빠르게 변하고 있다.     많은 기업이 마이크로소프트 애저(Microsoft Azure)를 데이터 분석을 위한 중앙 허브로 이용하고 있다. 데이터 분석의 범위를 광범위하게 정의하는 애저는 12가지 이상의 서비스를 제공한다. 또한 AI 기반 분석 및 새로운 데이터마트 옵션을 지원하는 파워 BI(Power BI)나 마이크로소프트 퍼뷰(Microsoft Purview) 등의 거버넌스 지향 접근법도 추가됐다. 마이크로소프트 애널리틱스(Microsoft Analytics)의 CTO 아미르 네츠는 “단편적인 접근법이 아니라, 함께 작동하도록 설계된 애저에서 전체 애널리틱스 서비스 스택을 제공하는 것을 목표로 하고 있다”라고 강조했다.  다양한 서비스 간에 중복되는 부분이 있긴 하지만, 네츠는 애저의 애널리틱스 서비스가 애널리틱스 아키텍처 프레임워크 생성 시 기업이 구축하는 계층에 폭넓게 적용된다고 밝혔다. 네츠는 “데이터 레이크 생성, 데이터 저장, 데이터 레이크에서의 데이터 처리, 데이터 엔지니어링, 데이터 웨어하우스 구축, 머신러닝 알고리즘 및 데이터 과학 실행, 비즈니스 사용자에게 데이터 제공 등의 기능이 있다”라고 설명했다.  최근 발표된 ‘마이크로소프트 인텔리전트 데이터 플랫폼(Microsoft Intelligent Data Platform)’은 이런 사실을 잘 보여준다. 여기서는 마이크...

마이크로소프트 애저 클라우드 2022.07.05

AI 및 ML 시스템을 붕괴시키는 ‘적대적 머신러닝’의 이해

AI 및 머신러닝(Machine Learning, ML) 프로젝트를 시작하는 기업이 늘면서 AI/ML의 안전을 확보하는 일이 무엇보다 중요해졌다. IBM과 모닝 컨설트(Morning Consult)가 5월 발표한 보고서에 따르면, 전 세계 7,500곳 이상의 기업 중에서 35%가 이미 AI를 사용 중이다. 전년 대비 13% 증가한 수치다. AI를 탐색하고 있는 기업은 42%였다. 20%의 기업은 데이터 보안에서 어려움을 겪고 있었고, 이로 인해 AI 도입이 늦춰지고 있다고 답했다.   가트너가 2021년 2월 실시한 설문조사에서도 보안이 AI 도입 시 가장 큰 걸림돌이었다. 보안은 AI 솔루션을 기존 인프라에 통합하는 데 따르는 복잡성과 함께 1위를 차지했다.  마이크로소프트가 같은 해 3월 발표한 논문에 따르면, 기업의 90%는 적대적 머신러닝(Adversarial Machine Learning)에서 기업 시스템을 보호할 준비가 되어 있지 않다. 논문에서 다룬 28곳의 대/소규모 기업 가운데 25곳에서 ML 시스템 보안에 필요한 툴을 배치하지 않았다.  AI/ML 시스템 보안은 상당히 어려운 작업이다. 몇몇 어려움은 AI 고유의 특성에 기인한다. 예를 들어 AI/ML 시스템은 데이터를 필요로 하는데, 민감 데이터나 독점적 정보는 공격자의 표적이 된다. AI/ML 보안의 또 다른 측면은 ‘적대적 머신러닝’처럼 낯설기만 하다. 적대적 머신러닝이란 무엇인가?  엄밀히 말해 적대적 머신러닝은 이름과는 달리 머신러닝이 아니다. ML 시스템을 공격하는 데 사용되는 일련의 기법이다. 토론토 메트로폴리탄 대학교(Toronto Metropolitan University) 교수이자 글로벌 리서치 연구소(Global Research Institute)의 상임 연구원 알렉세이 루브초이는 “적대적 머신러닝은 ML 모델의 취약점과 특수성을 이용한다”라고 말했다. 루브초이는 최근 금융 서비스 산업 내 적대적 머신러닝에 관한 논문을 발표했다...

인공지능 머신러닝 적대적머신러닝 2022.06.30

스노우플레이크, “파이썬 기능 강화로 데이터 과학자 공략”

클라우드 기반 데이터 웨어하우스 업체 스노우플레이크(Snowflake)가 데이터 과학자를 잡기 위한 노력에 한창이다. 14일 열린 연례 스노우플레이크 서밋 행사에서 발표된 소식을 보면 주로 파이썬이나 데이터 액세스와 관련된 기능이 주를 이뤘다. 데이터 과학자가 관심을 둘 만한 기능이다. 아직 비공개 프리뷰 단계나 개발 단계의 수준이지만, 이런 서비스를 보강되면 앞으로 테라데이터(Teradata), 구글 빅쿼리(BigQuery), 아마존 레드시프트(Redshift)같은 서비스와 경쟁이 본격화될 것으로 예상된다.    새로 업데이트된 서비스엔 먼저 스노우파크(Snowpark)가 있다. 지난해 출시된 스노우파크는 데이터 프레임의 기능을 제공하는 개발 도구로, 개발자가 선호하는 툴을 스노우플레이크의 가상 웨어하우스 컴퓨팅 엔진에 서버리스 방식으로 설치할 수 있게 도와준다. 앞으로 스노우파크에선 파이썬 기능도 쉽게 이용할 수 있다.  파이썬이 추가되면서 스노우플레이크는 머신러닝을 위한 애플리케이션 개발 속도를 높일 수 있다고 보고 있다. 스노우플레이크의 제품 담당 수석 부사장인 크리스티안 클라이너맨은 “파이썬은 스노우플레이크 고객이 가장 많이 요청한 기능”이라고 강조했다.  업계 애널리스트는 데이터 과학자가 파이썬을 가장 선호하고 있다는 점에서 파이썬 관련 기능이 많아지고 있는 것은 자연스러운 현상이라고 보고 있다. 컨스텔레이션 리서치(Constellation Research)의 수석 애널리스트 덕 헨쉔은 “스노우플레이크는 늦은 감이 있다”라며 “테라데이터, 구글 빅쿼리, 버티카(Vertica)와 같은 경쟁 서비스에선 이미 파이썬을 지원한다”라고 지적했다. 스트림릿(Streamlit)이라는 도구도 스노우파크에서 통합 지원한다. 스트림릿은 오픈소스 앱 프레임워크로, 파이썬을 이용해 데이터를 시각화하고 변경하고 공유할 때 사용된다. 보통 머신러닝 개발자나 데이터 과학자 및 엔지니어들이 이용하는 기술이며 지난 3월 스노우플레이크가...

스노우플레이크 머신러닝 데이터과학 2022.06.17

IDG 설문조사

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.