여전히 윈도우 10을 사용하는 스팀 게이머
Z세대 : 결제의 미래 (Gen Z: the future of spending)
"협업을 잘하고 팀워크가 잘 맞는 동료를 가장 선호한다"
2028년 국내 홀클라우드 시장 예상 규모
AI를 업무 및 업무 외적으로 모두 사용한다
애플 차세대 기기에 통합될 것으로 예상되는 디지털 AI 비서를 개발 중인 것으로 알려졌다. 시리보다 더 발전한 형태의 새로운 비서는 생성형 AI를 기반으로 하며, "인간 같은" AI "인격"을 갖게 된다. 블룸버그 마크 거먼에 따르면, 이 새로운 비서는 홈팟, 아이패드 같은 기기에서 시리를 대체할 수 있다. 애플의 차세대 가정용 로봇 데스크톱 화면에 통합되는 이 비서는 상호작용하는 동안 사용자를 따라다니며 페이스타임 통화를 할 때 사용자와 마주 본다. 음성이 주된 인터페이스가 될 가능성이 높다. 필자는 이런 전망이 두렵기만 하다. 인격 실패의 역사 개인용 컴퓨팅의 과거는 "인격"을 가진 챗봇과 비서의 가상 시체로 가득 차 있다. 특히 마이크로소프트가 이런 시도를 멈춘 적이 없다. 1995년 마이크로소프트는 밥(Bob) 어시스턴트를 선보였는데, 밥은 인격을 갖추려고 너무 애를 썼다. 대부분 사용자는 밥이 거만하고 짜증스럽다는 반응을 보였다. 1997년에는 종이 클립을 캐릭터로 만들어 의인화한 클리피(Clippy)로 다시 도전했다. 하지만 클리피는 출시화 함께 "쿵"하고 떨어졌다. 클리피가 성가시고 방해가 된다는 혹평이 쏟아졌다. 중국의 마이크로소프트 엔지니어들은 2014년 '작은 빙'이라는 뜻의 실험적인 챗봇 샤오이스(Xiaoice)를 출시했다. 이 챗봇은 "감성 지능"과 "공감"을 우선시하며, 고급 자연어 처리와 딥 러닝을 통해 대화 능력을 지속적으로 개선한다. 마이크로소프트는 "공감 컴퓨팅 프레임워크(Empathetic Computing Framework)"라는 것을 기반으로 샤오이스를 구축했다. 2020년 현재 샤오이스는 전 세계적으로 6억 6,000만 명 이상의 활성 사용자를 확보한 가장 인기 있는 인격 챗봇으로 자리 잡았다. 중국, 일본, 인도네시아를 비롯해 미국, 인도 등의 국가에서 40개 이상의 플랫폼에 배포됐다. 마이크로소프트 연구팀은 샤오이스를 10대 소녀로 모델링해 사용자가 샤오이스와 강한 감정적 유대감을 형성하도록 했다. 놀랍게도 샤오이스 사용자의 약 25%는 챗봇에게 "사랑해"라고 말한 적이 있다. 또한 수백만 명의 사용자가 다른 사람과의 관계를 추구하는 대신에 샤오이스와 "'관계"를 형성하고 있다. 마이크로소프트는 2016년 테이(Tay)라는 챗봇도 출시했다. 18~24세 연령층을 대상으로 한 이 챗봇은 주로 트위터를 비롯한 소셜 미디어 게시물을 학습했다. 테이는 출시 24시간 만에 인종 차별, 성 차별, 반유대주의적 발언과 음모론 및 대량 학살 이데올로기를 지지하는 콘텐츠를 게시하기 시작했다. 트위터에서 학습한 것이다. 마이크로소프트는 즉시 사과하고 테이 서비스를 중단했다. 그리고 수년 동안 마이크로소프트의 챗봇뿐 아니라 인격을 보유한 여러 챗봇이 등장했다. 레플리카(Replika) : 상호작용을 통해 학습하여 개인화된 친구, 멘토, 심지어는 연애 파트너가 되는 AI 챗봇이다. 레플리카는 미성년자를 대상으로 한 성적인 콘텐츠와 초자연적 존재를 보는 등의 괴상한 경험을 제공한다는 이유로 비난을 받았다. 쿠키(Kuki) 혹은 미츠쿠(Mitsuku) : 대화 능력으로 유명한 쿠키는 여러 차례 로브너상 튜링 테스트에서 우승한 바 있다. 자연스러운 대화를 통해 사용자의 참여를 유도하도록 설계되었지만, 무작위로 말도 안 되는 소리를 내뱉기도 한다. 로즈(Rose) : 매력적인 사용자 상호작용을 제공하기 위해 개발된 배경 스토리와 개성을 가진 챗봇이지만, 대화가 가짜이고 일관성이 없으며 이전 대화와 관련이 없다. 블렌더봇(BlenderBot) : 메타에서 개발한 블렌더봇은 다양한 대화 기술을 혼합하고 의미 있는 대화에 사용자를 참여시키도록 설계되었지만, 거짓말과 환각에 빠지는 경향이 있다. 에비봇(Eviebot) : 감정 이해 기능을 갖춘 AI 동반자로, 사용자가 의미 있는 대화에 참여할 수 있도록 설계됐다. 반응이 모호하고 불안하며 심지어 상대방을 조종하는 답변을 하기도 한다. 심시미(SimSimi) : 초기 챗봇인 심시미는 일상적인 대화에 사용자를 참여시키고 여러 언어를 지원하지만, 답변이 저속하고 부적절할 수 있다. 차이 AI(Chai AI) : 사용자가 개인화된 챗봇 동반자를 만들고 상호 작용할 수 있으며, 사용자 선호도에 따라 다양한 AI 개성을 제공한다. 이 챗봇은 선정적이거나 어두운 콘텐츠로 많은 사용자의 불쾌감을 불러일으켰다. 인월드(Inworld) : 유명인을 모델로 한 챗봇을 포함해 사용자가 독특한 개성을 가진 챗봇을 만들 수 있는 도구를 제공한다. 이 도구는 종종 창의적이고 기만적이며, 유해한 페르소나에 사용됐다. AI블리스(AIBliss) : 사용자와의 상호작용에 따라 다양한 특성을 가지는 가상 여자친구 챗봇이다. 전문가는 샤오이스처럼 일부 사용자가 실제 인간 관계를 희생하면서까지 봇과의 관계에 집착하는 경우가 있다고 경고했다. 감성형 AI 챗봇 '파이'는 다를까? AI 챗봇은 "인격"을 우선시하는 정도가 다양하다. 가장 인격을 중시하는 챗봇은 파이(Pi)다. 휴대폰에서 파이를 실행 상태로 두고 원할 때마다 대화를 시작할 수 있다. 파이는 수다스럽고 극단적으로 대화가 많다. 또한 자연스럽게 말을 잠깐 멈추기도 하며, 말할 때 숨을 쉬기도 한다. 대부분 경우 사용자의 질문이나 의견에 장황하게 응답한 후 사용자에게 다시 질문을 던지며 끝을 맺는다. 파이에서는 다양한 음성을 선택할 수 있다. 필자는 아주 캘리포니아 여성처럼 들리는 4번 음성을 선택했다. 파이의 성능에 놀랐지만, 자주 사용하진 않는다. 목소리는 자연스럽지만 대화가 억지스럽고 톤이 낮게 느껴진다. 10번째 질문이 끝나면 결국 꺼버리고 만다. 필자가 원하는 챗봇은 질문에 답하는 챗봇이지, 내가 질문에 대답하도록 유도하는 챗봇이 아니다. 또한 파이는 필자의 무의미한 답변이 얼마나 인사이트있고 사려 깊으며, 재미있는지 끊임없이 말하며 지나치게 고마워한다. 애플은 왜 그런 선택을 했는가 필자는 지금까지 만들어진 모든 인격 중심 챗봇이 실패했다는 결론을 내린다. 하지만 애플은 왜 인격 챗봇이 성공할 수 있다고 생각할까? 많은 사람이 시리를 이미 싫어하는 이유는 애플이 비서의 인격을 구현한 방식 때문이다. 특정 프롬프트는 진부한 농담과 기타 쓸모없는 콘텐츠를 유도한다. 이 칼럼을 쓰면서 시리에게 "로봇공학의 세 가지 법칙이 무엇인가?"라고 물었다. 시리는 "사람에게 복종하고 절대 다치게 하지 않는 것이죠. 저는 아무도 다치게 하지 않을 거예요"라고 답했다. 3가지 법칙을 이야기하는 대신 틀에 박힌 답변을 이야기했다. 이런 일이 항상 발생하는 것은 아니지만, 애플이 생성형 AI 챗봇의 인격에 어떻게 접근할 수 있는지 보여주는 예시다. 애플이 시리의 인격이 인기가 있다고 생각하거나, 인격에 초점을 맞춘 다른 모방할 만한 챗봇을 찾았다고 생각하지는 않는다. 챗봇의 인격은 잠깐은 재미있지만 몇 번 만나고 나면 신경이 거슬릴 수 있는 색다른 행동이나 숨은 재주에 불과하다. 인격 대신 필요한 것 진짜 사람과의 자연스럽고 일상적인 대화는 오늘날 가장 진보된 AI의 능력을 훨씬 뛰어넘는다. 뉘앙스, 연민, 공감, 미묘한 감정, 그리고 "어조"를 감지하고 표현하는 능력이 필요하다. AI는 친구과의 일상적인 잡담보다 공식적인 공문, 편지, 과학 논문 또는 에세이를 더 잘 작성한다. 또 다른 문제는 인격 있는 챗봇이 거짓말을 한다는 것이다. 경험하지도 않은 감정을 표현하고, 가지고 있지도 않은 억양을 흉내내며, 경험하지 않은 경험을 이야기하기도 한다. 거짓말을 좋아하는 사람은 없다. 우리에게 필요한 것은 불경스럽고, 부적절하고, 짜증나고, 지루한 거짓말쟁이 대신 유용한 대답이다. 이와 함께 지나치게 '진짜' 같지도 않고 로봇처럼 들리지도 않도록 발성과 어조에서 인간적인 요소가 눈에 띄지 않도록 보정돼야 한다. 공감하도록 프로그래밍할 수 있다면, 감정이 아닌 상황과 목표에 공감하도록 프로그래밍해야 한다. 우리는 개성이 아니라 개인화를 원한다. 자율성을 원하지, 상황에 맞지 않게 반응하는 챗봇을 원하지 않는다. "친구"가 아니라 사람의 능력을 확대할 수 있는 도구를 원한다. 누가 알겠는가? 애플이 사람을 거부하거나 혼란스럽게 하지 않는 개성을 가진 로봇 음성으로 모두를 놀라게 할지도 모른다. 하지만 그럴 것 같지는 않다. 아무도 성공한 적 없다. 그 누구도 시도해서는 안 된다. editor@itworld.co.kr
때로는 무료 소프트웨어가 너무 많아서 진짜 보석을 가려내기가 어렵다. 대다수 사용자는 잘 알려진 상용 소프트웨어 무료 버전에 머물러 있지만, 사실 PC 사용자가 활용할 수 있는 오픈소스 소프트웨어의 세계는 무궁무진하다. 오픈소스 소프트웨어에는 많은 장점이 있다. 무료일 뿐만 아니라, 오픈소스 코드는 사용자의 테스트, 반복, 유지 관리 및 개발을 장려하기 위한 목적으로 대중에게 공개되기 때문에 강력하면서도 유용한 도구다. 최고의 오픈소스 도구 14종을 엄선해 소개한다. 빅 캘린더의 대안, 보르그 캘린더 마이크로소프트나 구글 같은 대형 업체에 약속과 연락처를 맡기고 싶지 않다면 에서 대안을 찾을 수 있다. 이 프로그램은 연간, 월간, 주간 또는 일일 보기를 허용하며, 각 보기는 자체 탭에 편리하게 표시된다. 보기가 너무 혼란스럽다면 탭을 닫으면 된다. 미국 공휴일은 기본적으로 표시되며 설정에서 변경할 수 있다. 보르그 캘린더는 구글 캘린더뿐만 아니라 브이카드(VCard), ICS, 캘더브(Caldav) 캘린더 형식과도 동기화된다. XML 가져오기 및 내보내기 기능도 가능하다. 보르그 캘린더는 캘린더 기능 외에도 모든 중요한 데이터와 함께 연락처를 저장할 수 있는 주소록도 제공한다. 전자책을 관리하고 변환하는 캘리브리(Calibre) 는 전자책을 정리하는 데 도움을 준다. 이렇게 하려면 초기 설정에서 선호하는 공급업체(예: 아마존, 애플, 부크, 코보 등)를 입력하고 다음 단계에서 전자책 리더 모델을 입력하라. 기기가 목록에 없으면 '일반' 옵션을 선택하고 일반 기기를 입력하거나 스마트폰이나 태블릿에서 읽으려는 경우 스마트폰이나 태블릿을 입력할 수도 있다. 그런 다음 아마존 킨들을 읽기 기기로 설정한 경우 선택적으로 이메일 주소를 입력하면 구성이 완료된다. 이제 전자책을 추가하고, 색인을 생성하고, 다른 형식으로 변환할 수 있을 뿐만 아니라 다양한 공급업체에서 새 전자책을 구입해 무료로 다운로드할 수도 있다. 그런 다음 항목을 저자별로 검색하고, 시리즈별로 그룹화하고, 등급을 지정할 수 있다. 단, 킨들 책은 일반적으로 복사가 방지되어 있으므로 캘리브리에 쉽게 추가할 수 없다. 나만의 키보드 단축키 정의하기, 클라비어+(Clavier+) 키보드 단축키는 버튼 하나만 누르면 자주 사용하는 프로그램을 열 수 있어 많은 시간을 절약할 수 있다. 하지만 인쇄 작업, 자동 저장, 특수 문자 삽입과 같은 기능도 여러 번 이곳 저곳을 클릭할 것이 아니라 키 조합으로 더 빠르게 수행할 수 있다. 를 사용하면 필요에 맞는 키보드 단축키를 만들 수 있다. 파란색 더하기 기호를 클릭하고 프로그램 열기, 특수 문자 삽입, 폴더 열기, 텍스트 작성 또는 웹사이트 호출에 사용할지 여부를 선택하고 필요한 경우 추가 정보(삽입할 텍스트 또는 특수 문자 등)를 입력한 후 원하는 키 조합을 지정하기만 하면 된다. 생성된 바로가기는 나중에 편집하거나 삭제할 수 있다. 다양한 기능을 갖춘 파일 관리자, 더블 커맨더(Double Commander) 는 선명한 두 개의 창으로 구성된 디스플레이가 특징으로 파일 관리가 특히 간편하다. 연결된 모든 드라이브와 구성된 네트워크 연결이 하나의 표시줄에 표시된다. 검색 기능은 필터를 사용해 파일을 찾는 데 사용할 수 있으며, 통합 패커는 ZIP, 7z, tar, bz2, tbz, gz, tgz, lzma, tlz 형식을 지원하는 파일을 압축 및 압축 해제한다. 한 번에 여러 파일의 이름을 바꿀 수 있으며, 폴더를 서로 비교하는 동기화 기능도 탑재되어 있다. “구성” 메뉴 항목을 통해 패커, 탭 및 기타 기능을 필요에 맞게 사용자 지정할 수 있으며, 터미널 에뮬레이터를 통해 시스템 수준에서 명령을 실행할 수 있다. 사용하기 쉬운 FTP 클라이언트, 파일질라(Filezilla) 는 유독 사용하기 쉬운 FTP 클라이언트다. 처음 시작할 때 원하는 FTP 서버의 로그인 정보를 입력하고 '연결'을 클릭하면 폴더 구조가 표시된다. 이제 파일을 교환하고, 북마크를 만들고, 자신만의 명령을 설정할 수 있다. 파일질라의 보기는 여러 개의 윈도우로 편리하게 나뉘어 있어 항상 어떤 디렉터리에 있는지 즉시 확인하고 빠르게 변경할 수 있다. 하단에는 수행된 전송에 대한 피드백이 표시된다: 전송한 파일과 전송에 성공한 파일과 실패한 파일을 세 개의 탭에서 확인할 수 있다. "스크린샷 찍기 및 편집하기" 그린샷 을 사용하면 윈도우보다 더 빠르고 쉽게 스크린샷을 찍을 수 있으며, 인쇄 키를 사용하거나 다른 키보드 단축키를 정의할 수도 있다. 그린샷은 전체 화면, 단일 창 또는 자유롭게 선택할 수 있는 영역을 캡처하므로 설정에서 더 많은 것을 사용자 지정할 수 있다. 통합 에디터로 그래픽 요소나 라벨을 추가할 수 있다. 스크롤도 가능하며, 캡처 후 선택적으로 클라우드를 포함해 자동으로 저장할 수 있다. 필요한 경우, 스크린샷을 이메일로 보내거나 인쇄하려는 경우 일련번호나 개인 데이터 등이 실수로 전달되지 않도록 선택한 이미지 영역을 인식할 수 없게 편집하는 것도 가능하다. 벡터 그래픽 만들기, 잉크스케이프 벡터 그래픽을 만들고 싶다면 잉크스케이프가 무료 솔루션이다. 이 프로그램은 다양한 기능을 제공하며 확장도 가능하다. ⓒ Foundry 를 사용하면 벡터 그래픽을 만들고 편집할 수 있다. 이 프로그램에는 페인팅 및 그리기, 채색 및 모델링을위한 다양한 도구가 있으며 기본 창 왼쪽에 아이콘으로 배열되어 있다. 필터를 사용하면 텍스처, 재질 및 기타 효과를 3D에서도 사용할 수 있다. 잉크스케이프는 색상을 선택할 수 있는 스크롤 가능한 색상 팔레트를 제공한다. 프로그램 오른쪽에는 개체를 자르고, 클립보드에 복사하고, 복제하고, 텍스트를 삽입하고, 확대하고, 완성된 그래픽을 인쇄할 수 있는 추가 편집 도구가 있다. 누락된 옵션이 있는 경우 다운로드 가능한 확장 프로그램을 사용해 프로그램의 기능 범위를 확장할 수 있다. 비밀번호 안전하게 보관하는 키패스 는 액세스 데이터, 비밀번호, PIN 및 기타 중요한 로그인 정보를 저장하는 비밀번호 금고다. 프로그램을 처음 시작할 때 새 데이터베이스를 만들고, 향후 비밀번호 금고에 액세스할 수 있는 마스터 비밀번호를 할당하고, 데이터베이스에 의미 있는 이름을 지정한다. 그런 다음 메인 보기로 이동해 “항목”을 통해 새 항목을 만든다. 명확성을 위해 액세스 데이터를 '인터넷', '쇼핑' 또는 '은행'과 같은 특정 카테고리에 할당해야 하는데, 이 프로그램에서는 기본적으로 다양한 일반 용어를 제공한다. “그룹"을 통해 기존 카테고리를 사용자 지정하고 새 카테고리를 만들 수도 있다. 새 항목을 정렬하려면 카테고리를 클릭한 다음 첫 번째 키 기호인 “항목 추가”를 클릭한다. 키패스는 비밀번호, 액세스 데이터 등을 카테고리별로 관리한다. 평소와 마찬가지로 데이터베이스에 액세스하려면 마스터 비밀번호가 필요하다. 멀티미디어 콘텐츠를 위한 플랫폼, 코디(Kodi) 는 로컬 및 네트워크를 통해 영화, 음악, 동영상, 사진을 재생하는 엔터테인먼트 플랫폼이다. 라디오를 듣고, 게임을 플레이하는 등 다양한 용도로 사용할 수 있다. 코디의 잠재력을 최대한 활용하려면 다양한 애드온이 필요하며, 무료로 다운로드할 수 있다. 예를 들어 통합 저장소에서 추가 오디오 및 비디오 디코더를 설치하고, 가사와 자막을 읽고, 구글 드라이브 및 마이크로소프트 원드라이브와 같은 클라우드 스토리지에 연결하고, 화면 보호기를 추가할 수 있다. 게이머는 에뮬레이터와 컨트롤러 프로필을 찾을 수 있으며 사용자 지정 애드온도 설치할 수 있다. 취향에 맞게 코디 자체의 디자인을 커스터마이징할 수도 있다. PC 정보 보기 돕는 리브레 하드웨어 모니터 PC의 상태를 한눈에 파악하고 싶다면 가 적합한 도구다. 이 간단한 도구는 PC에 설치된 모든 센서에 액세스할 수 있으며 CPU 사용률, 메모리 클럭, 전류, 팬 속도 등에 대한 정보를 제공한다. “원격 웹 서버"를 통해 원격 모니터링도 가능하다. 설정에서 프로그램이 표시할 정보를 지정할 수 있으며, 글꼴 크기, 색상 등 표시 유형도 조정할 수 있다. 나중에 값을 비교하려는 경우 개별 보고서를 저장할 수도 있다. 또한 리브레 하드웨어 모니터는 서비스를 위해 별도의 설치가 필요하지 않고 관리자 권한과 .NET 프레임워크만 있으면 편리하게 사용할 수 있다. HDR 이미지 생성 및 편집하는 루미넌스 HDR 으로 HDR 사진, 즉 다이나믹 레인지가 특히 높은 사진을 만들고 편집할 수 있다. 이미 HDR 형식으로 저장된 사진을 프로그램에 불러오거나 노출이 다른 이미지에서 직접 HDR 이미지를 만들 수 있다. 그런 다음 완성된 HDR 이미지의 채도, 대비 및 이미지 노이즈를 추가로 조정할 수 있다. 그러나 정확한 설정 옵션은 동적 압축에 사용된 연산자에 따라 다르다. 예를 들어 파탈(Fattal)을 사용하면 알파, 베타, 채도, 노이즈를 조정할 수 있고, 듀란드(Durand)를 사용하면 기본 대비, 공간 커널 시그마, 범위 커널 시그마를 조정할 수 있다. 미리보기에서 모든 변경 사항을 즉시 확인할 수 있으며 실행 취소도 가능하다. 파일 아카이브 생성 및 압축 풀기, 피집(PeaZip) 은 파일을 아카이브로 결합하고 완성된 아카이브의 압축을 해제한다. 일반적인 아카이브 유형인 ZIP, 7Z, TAR 외에도 브로틀리(Brotli), GZip, UPX 같은 이색적인 형식도 패킹에 사용할 수 있다. 아카이브 크기에 관한 한, 이 프로그램은 제한된 용량을 허용하고 필요한 경우 아카이브를 분할할 수도 있다. 아카이브에 대한 업데이트도 가능하다. 아카이브에 비밀번호를 지정한 다음 이메일로 보낼 수도 있다. '고급' 탭에서 압축에 영향을 줄 수 있으며, '일정'에서 자동 아카이브 계획을 설정하고 생성할 정확한 시간을 지정할 수 있다. PDF 만능 도구, 수마트라 PDF 는 PDF 문서를 열고 텍스트 입력 필드를 사용해 검색하는 프로그램이다. 텍스트 구절을 표시하고, 컬러로 밑줄을 긋고, 줄을 긋고, 동그라미를 치고, 주석, 스탬프 등을 남길 수 있다. 아직 코멘트를 저장하지 않은 경우 메모를 통해 편리하게 알려준다. 특히 슬림하고 빠르게 설치되는 이 프로그램은 다양한 보기 옵션을 제공한다: 간단한 한 페이지 보기부터 두 페이지 보기, 현재 창에 맞춤 보기까지 원하는 방식으로 PDF를 표시한다. PDF 문서를 회전하고 페이지를 확대할 수도 있다. 인쇄 기능도 탑재되어 있으며 즐겨찾기를 정의할 수도 있다. 동영상과 음악을 위한 다목적 재생 프로그램, SM 플레이어 는 음악뿐만 아니라 동영상도 재생할 수 있다. 이미 필요한 모든 코덱이 통합되어 있다. 재생 속도를 조정하고, 가능한 경우 자막을 표시하고, 자신의 취향에 맞게 소프트웨어 디자인을 사용자 지정할 수 있다. 특별한 기능은 프로그램이 각 파일에 대해 사용자가 설정한 재생 설정을 기억하는 것이다. 따라서 재생을 중단해야 하는 경우에는 프로그램이 원래 설정한 대로 파일을 계속 재생한다. 옵션 모듈은 유튜브에서 동영상을 검색하고 구글의 크롬캐스트도 지원한다. 즐겨찾기와 재생 목록을 만들고 선호하는 언어를 지정할 수도 있다. editor@itworld.co.kr
제품 관리의 목표는 모든 종류의 소프트웨어 배포에서 대체로 비슷하지만 분석 및 데이터 제품에만 적용되는 몇 가지 책임이 있다. 뛰어난 제품 관리자가 데이터 과학 이니셔티브의 결과를 개선하는 5가지 방법을 알아보자. 데이터 과학에는 실험과 발견이 필요하지만 데이터 과학 제품과 프로그램을 최종 사용자에게 배포하기 위해서는 SaaS를 시장에 출시하거나 비즈니스 애플리케이션을 부서에 배포하는 경우와 비슷한 원칙이 필요하다. 소프트웨어를 배포할 때 제품 관리자는 비즈니스 가치와 사용자 경험 개선이라는 중요한 역할을 담당한다. 이들의 책임은 데이터 과학 이니셔티브에 참여할 때 더 확장된다. 필자는 데이터 과학 이니셔티브에 스크럼을 적용하고 데이터 시각화와 머신러닝 모델, 생성형 AI 기능을 포함한 데이터 과학 제품 개발에 대한 감독 역할을 제품 관리자에게 맡겨야 한다고 강력하게 주장하는 입장이다. 조직은 제품 관리 책임을 할당함으로써 데이터 과학 이니셔티브를 비즈니스 전략에 맞추고, 일회성 분석 및 보고서를 실험하고 개발하기보다는 확장 가능한 제품을 지속적으로 개선해 나갈 수 있게 된다. 제품 관리자와 애자일을 통한 비즈니스 정렬 17회 애자일 현황 보고서에서 응답자의 약 70%는 IT 부서와 소프트웨어 개발에 애자일 방법론을 사용한다고 답했다. 폭포수 프로젝트 관리 방법론과 관련된 유연성 부족, 지나친 사전 계획 등 여러 문제점으로 인해 많은 조직이 애자일로 전환했다. 설문에서 애자일 방법론에 만족한다고 답한 응답자 중 약 60%는 협업 증대, 비즈니스 요구사항과의 정렬 개선을 구체적인 혜택으로 언급했다. 애자일의 중요한 차이점은 제품 및 프로젝트 관리 책임과는 상당히 다른 제품 소유자 역할과 제품 관리 기능을 할당한다는 점이다. 제품 소유자 책임에는 고객 요구 파악, 기능 우선순위 분류, 요구사항 초안 작성, 스크럼 팀과의 협력을 통한 쾌적한 고객 경험 구현이 포함된다. 여러 팀이 고객 및 직원용 애플리케이션을 포함한 여러 제품을 개발하고 개선하는 조직의 경우 더 높은 수준의 제품 관리 역할이 할당된다. 제품 관리자의 책임에는 고객 페르소나 정의, 비전 선언 초안 작성, 비즈니스 가치를 제공하는 로드맵 개발이 포함된다. 데이터 과학 이니셔티브에서도 제품 관리 기능의 목표는 소프트웨어 개발 및 기타 기술 이니셔티브와 비슷하지만, 분석과 데이터 제품에만 해당하는 여러 책임이 있다. 데이터 과학 이니셔티브에서 제품 관리자의 책임은 다음과 같다. 데이터 과학 투자의 비즈니스 가치 정당화 제품 관리자는 이니셔티브를 비즈니스 우선순위에 맞추는 데 있어 중요한 역할을 한다. 조직이 데이터 과학 역량에 투자할 수 있는 모든 부서와 데이터 집합, 데이터 제품 중에서 집중해야 할 가장 중요한 요소와 그 이유는 무엇일까? 엑사솔(Exasol)의 AI/ML 부문 수석 제품 관리자인 마들렌 코넬리는 "제품 관리자는 고객을 돕고 AI/ML 모델 개발의 '이유'를 확립하는 데 온전히 집중해야 한다. 사용자의 문제 해결, 경험 개선, 효율성 향상에 모델이 어떻게 도움이 되는지를 물으면 적절한 모델을 만드는 데 도움이 된다"고 말했다. 머신러닝과 AI 역량은 워낙 발전 속도가 빨라 데이터 과학 팀이 최신 툴과 방법론을 실험하는 데 급급하게 되기 쉽다. 코넬리는 "잠재적인 머신러닝 애플리케이션이 무수히 많은 상황에서 적절한 AI 솔루션을 향해 팀을 이끄는 것은 제품 관리자의 몫이다. 뭔가를 만들 수 있다는 것이 그것을 꼭 만들어야 한다는 의미는 아니다"라고 말했다. 중요한 제품 관리 원칙은 이니셔티브의 대상 고객과 가치 제안, 전략적 비즈니스 가치를 파악하는 것이다. 데이터 과학 이니셔티브의 비즈니스 가치에는 주로 의사 결정 역량 개선, 생산성 증대, 지속적인 경쟁 우위가 포함된다. 제품의 데이터 시각화, 예측 모델, LLM을 포함한 데이터 과학 제품은 이 솔루션의 일부다. 앰플리튜드(Amplitude)의 제품 관리 부문 부사장인 이브라힘 바시르는 "AI는 제품이 아니라 '방법'이다. AI를 사용해서 고객 문제를 해결하지 못한다면 그 방법을 사용하지 말아야 한다"면서 "AI 기반 기능이 가치 창출 시간 또는 유지와 같은 주요 비즈니스 지표에 긍정적인 영향을 미치지 못하는 경우 높은 우선 순위를 부여하면 안 된다"고 말했다. 노네임 시큐리티(Noname Security)의 CISO 칼 맷슨은 유능한 제품 관리자는 먼저 사용자 또는 고객 경험의 최종 상태를 고려하고, 거기서부터 역방향으로 제품을 만들어 나간다면서 "데이터 과학 이니셔티브에서 최종 목표는 양질의 의사 결정을 위한 정보 제공이다. 기술적인 방법에 집착하지 말고 데이터 제품에 대해 내리는 의사 결정의 본질을 제대로 이해해야 한다"고 말했다. 데이터 과학과 데브옵스 간의 협업 촉진 최근 한 설문조사에서 머신러닝 모델의 60% 이상을 성공적으로 배포한다고 답한 응답자는 32%에 불과했다. 이처럼 모델 배포 성공률이 낮은 이유 중 하나는 데이터 과학 팀이 솔루션을 최적화하기 위해 많은 모델을 실험해야 한다는 데 있다. 의사 결정과 기타 데이터 기반 작업에 예측을 사용할 수 있는 워크플로우, 고객 경험, 자동화에 모델을 연결하는 부분에도 간극이 있다. 통합을 개발하고 모델이 프로덕션 등급이 되도록 하기 위해서는 데브옵스 팀과의 협업이 필요한 경우가 많다. 그런 다음 제품 관리자는 엔드 투 엔드 제품의 효과를 평가해야 한다. 티로나(Thirona)의 CTO 리타 프라이오리는 "데이터 과학 팀과 소프트웨어 개발자 간의 협력을 촉진해서 모델의 정확성과 가치를 보장해 제품 목표와 부합하도록 하는 일은 일반적으로 데이터 과학 이니셔티브의 제품 관리자 책임이다. 제품 관리자는 심층적인 AI 지식을 갖추고 있어야 하며 제품 수명 주기 동안 정확도, 속도, 적응성과 같은 지표를 염두에 두고 모델의 성능을 지속적으로 평가하고 개선해야 한다"고 말했다. 제품 관리자에게 중요한 스킬은 데이터 과학자와 데브옵스 엔지니어를 포함한 애자일 팀이 제품을 반복적으로 개발하는 동안 제품을 평가하는 역량이다. 제품의 구현과 목표 부합성에 대한 기술적 질문을 던져야 한다. 데이터 과학 이니셔티브의 제품 관리자는 개방적인 분위기에서 질문을 제기하고 솔루션을 평가하는 팀 문화를 이끌어야 하는데 이를 위해서는 디자인 사고 원칙, 데이터 운영 관행, 머신러닝 모델 역량, AI의 한계, 소프트웨어 아키텍처에 대한 기본적인 이해가 필요하다. IBM의 watsonx.ai 제품 관리 책임자인 미라임 아슈리는 "AI/ML 모델과 플랫폼을 개발할 때 제품 관리자는 기술을 근본적으로 이해하고 설계, 엔지니어링, 연구팀과 협력해서 제품이 실제 문제에 대처하도록 보장해야 한다"고 말했다. 고품질 제품을 위해 최적의 데이터 집합 평가 사용할 데이터 집합의 정보 가치, 품질, 비용은 데이터 과학 제품을 개발할 때 공급망 고려 사항에 속한다. 제품 관리자는 데이터 성분이 우수한 품질과 적절한 가격의 제품으로 이어지도록 해야 하며 이를 위해서는 출처를 평가하고 데이터옵스 제조 프로세스를 감독해야 한다. 글래스박스(Glassbox)의 제품 관리 부사장인 뮬리 파카스는 "강력한 기본 데이터 집합은 성공적인 데이터 과학 이니셔티브의 출범을 위해 중요하다. 이를 위해서는 제품 관리자와 데이터 과학자가 긴밀하게 협력해서 모델이 다룰 실제 조건을 반영하도록 데이터 집합을 정의하고 다듬어야 한다. 제품 관리자는 사용자 요구사항과 기술적 실행 사이를 잇는 다리이며, 이를 통해 사용자에게 가치 있는 방식으로 모델 성능을 향상시켜줄 기능을 데이터 과학자에게 알려야 한다"고 말했다. 제품 관리 감독이 필요한 중요한 영역 중 하나는 데이터 과학자가 모델 학습을 위한 데이터 집합을 선택하고 분할하는 방법이다. 헤비.ai(Heavy.ai)의 제품 관리 부사장인 마이크 플랙스맨은 "핵심 작업에는 모델 학습에 적절한 볼륨과 품질의 적절한 데이터가 사용되도록 보장하는 것이 포함된다. 또한 제품 관리 담당자는 데이터를 선택하고 학습을 수행할 때 암묵적인 편견을 방지하도록 주의를 기울여야 한다"고 말했다. 제품 관리자는 팀의 데이터 과학자와 논의해서 제품의 목표를 지원하기 위한 최소한의 데이터 요구사항을 정의해야 한다. 여기에는 정확성, 일관성, 적시성과 같은 데이터 품질 지표가 포함된다. 또한 데이터 과학자는 학습 데이터가 타겟 데이터 세그먼트에 대해 통계적 유의도를 갖고 있음을 입증해야 하며 제품 관리자는 팀이 데이터 집합에서 잠재적인 편향을 어떻게 평가하는지를 감독해야 한다. 엄격한 머신러닝 모델 테스트와 모니터링 보장 LLM 테스트에서 어려운 부분은 LLM이 완전히 결정론적이지 않으며, 회귀 테스트의 결과를 단어 대 단어로 비교할 수 없다는 점이다. 예측 모델의 유효성을 검사하는 데도 어려움이 있고 대규모 특징 벡터에서 작동하는 머신러닝 모델은 모든 차원과 값에 걸쳐 테스트하기가 현실적으로 어려운 경우가 많다. 합성 데이터 소스를 사용한다 해도 이 문제를 피하기는 어렵다. 따라서 데이터 과학 제품은 어느 사용 사례를 검증할지, 테스트에 얼마나 투자할지, 그리고 모델이 프로덕션에 사용할 준비가 되었는지 평가하는 데 있어 비즈니스의 의견이 필요하다. 제품 관리 담당자는 법률, 위험, 보안, 기타 이해관계자 사이에서 조력자 역할을 하면서 최소한의 테스트 기준을 정의하고 테스트 예산을 설정하고 감독을 조율할 방법을 정해야 한다. KNIME의 데이터 과학 에반젤리즘 책임자 로사리아 실리포는 "데이터 과학 애플리케이션을 개발할 때는 잘못될 수 있는 부분이 많은 만큼 세부적이고 유의미한 확장된 테스트 모음이 필요하다. 예를 들어 개발 연구실에서 사용 가능한 데이터와 프로덕션에서 사용 가능한 데이터가 다르거나, 모델 학습 중 데이터 유출이 발생할 수 있다"고 말했다. 실리포는 데이터 과학 팀이 개발 이후 프로덕션에 앞서 테스트를 하고 수시로 모델 드리프트를 확인할 것을 권장했다. 엑사솔의 코넬리는 "모델, 대시보드, API 모니터링을 미리 계획해서 가동 시간과 지속적인 정확성을 보장하는 것이 장기적인 성공을 위한 핵심"이라고 말했다. 제품 관리자는 머신러닝 모니터링의 중요성을 인식하고 배포에 앞서 제품의 기술적 구성요소를 운영 가능화하는 데 엔지니어링 시간을 할애한다. 사이트 안정성 엔지니어링 관행에 따라 운영되는 조직은 성능, 모델 품질, 데이터 품질, 기타 비즈니스 운영에 영향을 미치는 오류에 대한 서비스 수준 목표를 정의한다. 비즈니스 가치와 KPI 측정 현재 기업은 데이터 과학과 머신러닝, AI에 많은 투자를 하고 있지만 데이터 과학 팀은 비즈니스 가치를 제공하고 주요 비즈니스 지표에 미치는 영향을 알려 지속적인 투자를 정당화해야 한다. 데이터 과학 이니셔티브가 전략 및 운영 측면에서 어느 부분에 영향을 미치고 있는지 알리는 것은 제품 관리자의 책임이다. IBM의 아슈리는 "AI 제품의 성공은 플랫폼이든 모델이든 최종 사용자 요구사항을 얼마나 잘 처리하는지에 따라 좌우된다"고 말했다. 인터뷰와 설문, 기타 피드백 메커니즘을 사용하면 개선이 필요한 영역을 파악하고 고객 만족도를 측정하는 데 도움이 된다(CSat). 헤비.ai의 플랙스맨이 언급한 부가적인 운영 KPI는 다음과 같다. 모델이 얼마나 자주 업데이트 및 배포되는가? 모델이 얼마나 정확한가? 문제 및 이상 현상 평균 탐지 시간은 어느 정도인가? 탐지된 문제를 해결하는 데 얼마나 오랜 시간이 걸리는가? 도미노(Domino)의 데이터 과학 전략 및 에반젤리즘 책임자인 켈 칼슨은 AI/ML 프로젝트와 관련 KPI는 매우 다양하므로 데이터 과학 제품 관리자는 유연해야 한다면서 "일반적으로 제품 관리자는 모델, 파이프라인, 애플리케이션 성능 측정에 대한 보고 외에 기업에서 가치를 측정하는 방법인 KPI도 추적하고 커뮤니케이션해야 한다"고 말했다. 제비아(Xebia)의 제품 및 프로젝트 관리자인 마 파시오는 명료한 비즈니스 지표를 사용해야 한다면서 "비즈니스 영향은 운영 비용 절감, 사용자 참여 지표의 개선을 통해 평가된다"고 말했다. 파시오는 정확도, 정밀도, 리콜, F1 점수, 분류 작업을 위한 AUC-ROC 등 모델 성능에 대한 업계 표준 지표를 선택하는 것이 좋다고 말했다. 제품 관리자는 지표가 인사이트를 전달하거나, 이해관계자가 훌륭한 데이터 과학 스토리텔러가 되어 주기를 기대해서는 안 된다. 유능한 제품 관리자는 최종 사용자가 데이터 과학 제품을 사용해 의사 결정과 생산성을 개선하는 방법을 파악하여 팀의 성공을 홍보할 방법을 찾는다. 베리캐스트(Vericast)의 제품 소유자인 니디 샤는 "제품 관리자는 데이터 과학 팀과 이해관계자 사이를 잇는 다리로서, 기술적인 발견을 실행 가능한 비즈니스 전략으로 전환하는 역할을 한다. 이를 위해서는 복잡한 데이터 인사이트를 의사 결정자들을 위한 명확하고 이해할 수 있는 용어로 추려내고 명확한 커뮤니케이션의 중요성을 잘 보여줘야 한다"고 말했다. 제품 관리자는 비즈니스 목표를 실행 가능한 로드맵으로 전환하고 비즈니스 성과를 입증할 책임이 있다. 기술 프로젝트에는 항상 위험과 미지의 요소가 포함되지만 데이터 과학 이니셔티브는 데이터 품질, 모델 성능, 최종 사용자 채택에 관한 요소를 추가했다. 데이터 과학 제품을 성공적으로 구축하고 강화하는 제품 관리자는 더 큰 규모의 이니셔티브와 더 새로운 AI 기회를 향해 나아갈 가능성이 높다. editor@itrworld.co.kr
오픈소스 컴퓨팅의 오랜 상징인 은 네트워크 모니터링 프레임워크부터 워드프레스(WordPress)와 같은 블로깅 애플리케이션, 페이스북과 같은 소셜 네트워크에 이르기까지 방대한 애플리케이션의 데이터베이스 백엔드 역할을 한다. 데이터베이스의 작동 방식에 익숙하지 않은 사람에게는 마이SQL을 처음 설정하는 과정이 어렵게 느껴질 수 있다. 그러나 몇 가지 핵심 사항과 개념만 익히면 빠르게 마이SQL 인스턴스를 설정하고 가동해 애플리케이션을 배포할 준비를 마칠 수 있다. 이 가이드는 독자에게 리눅스에서의 마이SQL 사용 경험이 거의 또는 전혀 없다고 가정하고, 마이SQL을 설치하고 애플리케이션을 데이터베이스에 연결해 작업을 시작할 수 있도록 구성하는 단계까지 살펴본다. 마이SQL의 고급 기능, 예를 들어 데이터베이스 프로그래밍, 등은 이 기사의 범위를 벗어나므로 다루지 않는다. 마이SQL 설치 가이드 가장 먼저 할 일은 시스템에 마이SQL을 설치하는 것이다. 설치 과정은 운영체제마다 차이가 있다. 여기서는 3대 운영체제인 마이크로소프트 윈도우, 맥OS, 리눅스에서의 설치 방법을 살펴본다. 참고로 애플리케이션이 작동하려면 주 마이SQL 코드 외에 부가적인 패키지가 필요할 수도 있다. 예를 들어 PHP 기반 애플리케이션을 마이SQL과 함께 사용하려면 PHP에서 마이SQL 서버와 통신할 수 있게 해주는 PHP 마이SQL 패키지를 설치해야 할 수 있다. 마이SQL 구성요소 마이SQL을 설정할 때는 마이SQL 스택에서 설치할 구성요소를 직접 선택해야 할 수 있다. 구성요소 중에는 필수도 있고 선택 항목도 있다. 마이SQL 서버(Server) : 실제 마이SQL 데이터베이스 서버로, 마이SQL에서 없어서는 안 되는 부분이다. 마이SQL 셸(Shell) : 마이SQL에 대한 인터랙티브 명령줄 인터페이스. 마이SQL 관리자 관점에서 이 구성요소는 서버가 설치된 시스템에 설치하는 것이 좋다. 어느 클라이언트 시스템에서나 마이SQL과 직접 상호작용할 수 있는 수단을 제공한다. 마이SQL 워크벤치(Workbench) : 마이SQL에 연결하고 데이터베이스를 관리하고 쿼리를 만들고 분석하고 그 외에도 많은 작업에 사용되는 GUI 인터페이스. 많은 경우 명령줄만 사용하는 방법보다 워크벤치를 통해 마이SQL을 사용하는 편이 더 쉬우므로 마이SQL을 관리하는 모든 클라이언트에 설치하는 것이 좋다. (꼭 서버와 같은 시스템에 설치할 필요는 없지만 그렇게 하는 편이 편리한 경우가 종종 있다.) 마이SQL 라우터(Router) : 마이SQL 환경을 위한 고가용성 시나리오를 설정하는 데 사용되는 소프트웨어 구성요소. 라우터는 기본적인 마이SQL 설정에는 불필요하며 필요에 따라 나중에 설치하면 된다. 윈도우에 마이SQL 설치하기 마이크로소프트 윈도우에 마이SQL을 설정하는 과정은 다른 애플리케이션을 설치하는 과정과 동일하다. 오라클은 2.1MB 크기의 네트워크 기반 설치 프로그램과 전체 크기(303MB)의 설치 프로그램, 한다. 네트워크 설치 프로그램은 특정 설정에 필요한 요소만 다운로드하며, 전체 설치 프로그램에는 모든 요소가 포함돼 있다. 이 은 서버, 클라이언트, 전체(서버+클라이언트+다른 기능), 맞춤형의 네 가지 옵션을 제공한다. 마지막 맞춤형 옵션을 사용하면 원하는 요소를 조합할 수 있다. 참고로 레거시 설치 프로그램은 마이SQL 버전 8.0.39까지만 지원한다. 은 8.0.39보다 더 높은 버전의 마이SQL을 설치하는 데 사용된다. 이 설치 프로그램의 프로세스는 조금 더 간편하며 GUI도 사용한다. 처음에는 일반적인 사용 사례에 맞게 구성된 기본 설정을 사용하는 것이 좋다. GUI에서 변경 여부를 검토할 옵션은 마이SQL의 서버 구성 유형이다. 이 옵션은 마이SQL의 메모리 프로파일을 제어한다. 개발(Development) : 기본 설정. 메모리 사용량이 비교적 적으므로 마이SQL을 다른 앱 및 개발 툴과 함께 사용할 수 있다. 서버(Server) : 메모리 사용량 보통. 여전히 다른 앱이 서버에서 실행되지만 주로 마이SQL을 사용하기 위한 목적이다. 전용(Dedicated) : 대체로 마이SQL이 서버의 유일한 앱이므로 메모리 사용량이 가장 많다. 수동(Manual) : 기본값을 변경하지 않는다. 나중에 메모리 사용량 및 다른 옵션을 수정할 수 있다. 이런 설정은 언제든 조정할 수 있다. 만 실행하면 설치 프로그램은 사용자가 상용 마이SQL 에디션을 설치하려는 것으로 간주한다. 상용 라이선스가 없으면 작동하지 않는다. 또 다른 옵션으로, 사전 구성된 애플리케이션 스택을 통해 마이SQL을 실행하는 방법이 있다. 는 마이SQL이 구성요소로 포함된 아파치 웹 서버 배포판을 제공하므로 이 프로젝트를 사용하면 손쉽게 마이SQL을 설정할 수 있다. 윈도우 외에 맥OS와 리눅스용으로도 제공된다. 맥OS에 마이SQL 설치하기 의 GUI는 마이크로소프트 윈도우용 설치 프로그램과 거의 동일하다. 많은 일반적인 옵션이 사전에 선택된 상태이며 변경할 필요가 없다. 흔히 사용되는 또 다른 설치 소스는 맥OS용 홈브루(Homebrew) 패키지 관리자다. brew install mysql@8.0 명령을 사용하면 맥OS용 마이SQL 8과 몇 가지 주요 종속 항목이 설치된다. 맥OS 설치는 마이SQL 환경설정 창도 제공한다. 이 창에서 서비스를 중지 또는 재시작하고 데이터 토리와 같은 일반적인 구성 옵션을 변경할 수 있다. 리눅스에 마이SQL 설치하기 일반적으로 마이SQL과 같은 패키지는 사용 중인 리눅스 배포판의 패키지 관리자를 통해 설치한다. 에서 다음과 같은 다양한 형식의 리눅스 바이너리도 받을 수 있다. 타볼(tarball) 형태의 일반 리눅스 바이너리 우분투 및 데비안 리눅스 .deb 번들 수세 리눅스 엔터프라이즈 서버, 페도라, 레드햇 엔터프라이즈 리눅스 RPM 번들 마이SQL 서버 구성 마이SQL 설치를 마치면 다음 단계는 서버 구성이다. 마이크로소프트 윈도우 또는 맥OS에 마이SQL을 설치한 경우 GUI 설치 프로그램이 루트 비밀번호 설정 등 가장 중요한 구성 옵션을 단계별로 안내한다. 리눅스에서는 대부분 옵션을 수동으로 구성해야 한다. 제품군과는 약간 다르다. 다음 작업은 모든 경우에 해야 한다. 마이SQL 서비스가 자동으로 시작되도록 설정 : 우분투에서는 자동으로 설정되며, RHEL/페도라에서는 sudo systemctl enable mysqld 및 sudo systemctl start mysqld를 사용해야 한다. 마이SQL을 위한 바인드 주소 설정 : 일부 배포판에서는 자동으로 구성될 수도 있다. 바인드 주소는 /etc/mysql/mysql.conf.d/mysqld.cnf의 bind-address 아래에 설정된다. 이 주소가 현재 시스템의 IP 주소가 아닌 경우 ip address show를 사용하여 현재 시스템의 IP 주소를 확인해 설정한다. 적용하려면 마이SQL을 재시작해야 한다. 루트 비밀번호 설정 : mysqladmin password 명령을 루트로 실행하면 루트 계정의 새 비밀번호를 입력하라는 메시지가 표시된다. 보안을 위해 새 비밀번호를 입력할 때 콘솔에 표시는 되지 않는다. 지원되는 모든 운영체제에서 마이SQL을 구성하기 위한 유용한 방법은 명령을 사용하는 것이다. 이 명령을 실행하면 마이SQL의 많은 일반적인 옵션이 정상적이고 안전한 기본값으로 설정된다. 많은 개별적인 구성 단계를 스크립팅 가능한 하나의 동작으로 통합하므로 이 명령을 실행하는 것이 좋다. phpMyAdmin으로 마이SQL 관리하기 마이SQL이 가동된 다음에는 명령줄만 사용하는 것보다는 웹 기반 관리 툴을 사용해서 마이SQL을 관리하는 편이 대체로 더 쉽다. phpMyAdmin 툴은 데이터베이스, 테이블, 사용자, 내부 마이SQL 설정 관리 등 거의 모든 마이SQL 관리 작업을 할 수 있는 웹 GUI를 제공한다. phpMyAdmin은 대부분 리눅스 배포판에서 에 대한 원클릭 액세스를 제공한다. 또한 phpMyAdmin 툴은 마이SQL, 그리고 일정 정도는 마이SQL 워크벤치 애플리케이션에 대해서도 콘솔 연결을 열 필요를 일부 없애준다. phpMyAdmin 인터페이스는 자동 완성 기능을 갖춘 자체 콘솔을 제공한다. 또한 GUI를 사용해서 쿼리를 작성하고 실행하고 결과를 저장하고 재사용하고 EXPLAIN 키워드를 통해 쿼리에 대한 분석 정보를 얻을 수 있다. editor@itworld.co.kr
RAG(Retrieval-augmented Generation)는 도메인별 데이터를 통합함으로써 생성형 AI 시스템의 응답이 충분한 정보에 근거하고 정확히 맞춤화될 수 있게 해준다. 앞으로는 보다 더 정교한 기술도 여럿 등장할 전망이다. 생성형 AI 시대에 이르러 LLM(Large Language Model)은 다양한 산업에 걸쳐 정보를 처리하고 질문에 대한 답을 찾는 방식에 혁명을 일으키고 있다. 그러나 이런 모델에는 정확하지 않은 콘텐츠 생성(), 오래된 지식에 의존, 추적할 수 없는 불투명하고 복잡한 추론 경로 사용과 같은 문제점도 따른다. 이런 문제에 대처하고자 LLM의 고유한 역량에 끊임없이 업데이트되는 풍부한 콘텐츠를 결합하는 혁신적인 접근 방법인 RAG가 등장했다. LLM과 RAG의 조합은 정확하고 신뢰할 수 있는 응답을 제공하는 모델의 역량을 강화할 뿐 아니라, 지식 요구가 특히 많은 작업에서 일관적인 설명과 책임성, 적응성을 향상한다. RAG의 적응성은 가져오는 정보를 지속적으로 갱신할 수 있게 해주므로 응답이 최신 정보를 반영하고 도메인별 인사이트를 통합하도록 보장할 수 있다. 이는 LLM의 가장 중요한 한계를 직접적으로 해결하는 방법이다. 예를 들어 RAG는 코드 생성, 고객 서비스, 제품 설명서, 엔지니어링 지원, 내부 지식 관리 등 기업 전반의 비즈니스 부문과 사용례에 걸쳐 생성형 AI 적용을 더욱 강화한다. RAG는 기업이 필요한 부분에 LLM을 적용하는 데 있어 큰 과제 중 하나, 즉 LLM을 학습시키거나 미세 조정할 필요 없이 방대한 기업 데이터베이스에서 가져온 관련성 있고 정확한 지식을 모델에 제공해야 한다는 문제를 해결한다. RAG는 도메인별 데이터를 통합함으로써 생성형 AI 모델의 응답이 충분한 정보에 근거할 뿐만 아니라 당면한 맥락에 정확히 맞도록 보장한다. 또한 RAG는 기업이 기밀 또는 비밀 데이터에 대한 통제력을 유지하고, 궁극적으로는 적응 및 통제 가능하고 투명한 생성형 AI 애플리케이션을 개발할 수 있도록 돕는다. 이는 AI로 향상되는 세계를 추구하는 어플라이드AI 이니셔티브(appliedAI Initiative)의 목표에도 부합한다. 어플라이드AI 이니셔티브는 생성형 AI를 단순히 시장에 밀어 넣는 것이 아니라 건설적인 툴로 활용해야 한다는 점을 지속적으로 강조한다. 실질적인 가치 창출에 초점을 둔 RAG는 이 정신에 반영돼 향상된 정확성과 신뢰성, 제어 가능성, 근거로 뒷받침되는 정보, 그리고 사용자가 정보에 근거하고 혁신적인 방식으로 생성형 AI의 모든 잠재력을 포용하도록 독려하는 포괄적인 생성형 AI 적용을 보장한다. RAG 옵션 : 맞춤 구성과 편의성 사이의 선택 RAG를 추진하는 기업은 직접 제작 혹은 구매 사이에서 중요한 결정에 직면하게 된다. 즉시 사용 가능한 제품의 편의성과 맞춤형 솔루션이 갖춘 유연성 간의 선택이다. RAG 시장에는 오픈AI 날리지 리트리벌 어시스턴트(Knowledge Retrieval Assistant), 애저 AI 서치(AI Search), 구글 버텍스 AI 서치(Vertex AI Search), 아마존 베드록용 날리지 베이스(Knowledge Bases for Amazon Bedrock)와 같은 유력한 주자들이 이미 포진해서 엔드 투 엔드 서비스에 내장된, 바로 사용할 수 있는 기능의 편리함을 앞세워 광범위한 요구사항에 대응하고 있다. 그 외에 엔비디아 네모 리트리버(NeMo Retriever), 딥셋 클라우드(Deepset Cloud)는 중간 지대로, 강력하고 풍부한 기능을 제공하면서 맞춤 구성도 가능하다. 또는 처음부터 새로 솔루션을 만들거나 랭체인(LangChain), 라마인덱스(LlamaIndex), 헤이스택(Haystack)과 같은 기존 오픈소스 프레임워크를 개조하는 방법도 선택할 수 있다. 노동은 더 많이 들지만 특정 요구사항에 맞춰 더 세밀하게 조정된 제품을 얻는 방법이다. 편의성과 맞춤 구성 가능성 간의 선택은 이후 큰 영향을 미친다. 직접 만들든 기성품을 구매하든 타협해야 할 부분은 있다. 생성형 AI에는 환각 또는 허위 사실과 같은 위험을 유발하는 본질적인 속성이 있는 만큼 투명성과 제어 가능성이라는 2가지 측면에 대한 부가적인 고려가 필요하다. 사전 구축된 솔루션과 제품이 가진 매력은 배포 속도를 높이고 기술적 복잡성을 줄일 수 있는 플러그 앤 플레이 방식의 간편함이다. 따라서 RAG 영역으로 빠르게 진입하고자 하는 기업에 매력적이다. 그러나 획일화된 제품은 예를 들어 커뮤니티에 특화된 배경지식, 관습, 맥락에 따른 기대 사항, 검색 결과의 품질을 판단하는 데 사용되는 표준 등 개별 도메인이나 회사에 내재된 미묘한 복잡성에 제대로 대응하지 못하는 경우가 많다. 오픈소스 프레임워크의 특징은 독보적인 유연성이다. 이 유연성을 통해 개발자는 자유롭게 회사 내부 지식 그래프 온톨로지 검색기와 같은 고급 기능을 활용하고, 툴을 조정해서 성능을 최적화하거나 투명성과 설명 가능성을 보장하고, 특수한 비즈니스 목표에 시스템을 맞출 수 있다. 따라서 편의성과 맞춤 구성 가능성 간의 선택은 단순한 선호도의 문제가 아니라 기업 RAG 역량의 방향을 좌우할 수 있는 전략적인 결정이다. RAG 장애물 : RAG 산업화 여정의 과제 RAG 솔루션 산업화 여정에는 RAG 파이프라인을 따라 여러 중대한 과제가 따른다. 실제 시나리오에서 효과적으로 배포하기 위해서는 이런 과제를 해결해야 한다. 기본적으로 RAG 파이프라인은 검색 전, 검색, 증강 및 생성, 평가의 표준 4단계로 구성된다. 각 단계마다 과제에 따라 특정 설계 결정과 구성요소, 구성이 필요하다. 최적의 청킹 크기와 전략을 처음부터 결정하는 것은 쉽지 않은 일이다. 특히 이런 의사 결정에 참고할 초기 평가 데이터 집합이 없는 콜드 스타트 문제에 직면한 경우에는 더욱 어렵다. RAG가 효과적으로 기능하기 위한 기본적인 요건은 문서 임베딩의 품질이다. 시작부터 이런 임베딩의 견고성을 보장하는 것이 매우 중요하지만, 이 부분이 큰 장애물이 될 수도 있다. 소스 문서 내에서 노이즈와 모순을 감지해 완화하는 것과 마찬가지다. 맥락상 관련된 문서를 최적으로 소싱하는 것 역시 풀어야 할 또 다른 어려운 매듭이다. 특히 어설픈 벡터 검색 알고리즘이 원하는 컨텍스트를 제공하지 못하고, 복잡하거나 까다로운 쿼리를 위해 다면적인 검색이 필요한 경우 이 문제가 두드러진다. 검색된 데이터에서 정확하고 신뢰할 수 있는 응답을 생성하는 과정에서도 부가적인 복잡성이 발생한다. 첫째, RAG 시스템은 다양한 질문에 직면하는 만큼 적절한 수의 관련 문서(top-K)를 동적으로 결정해야 한다. 이 문제에는 보편적인 해결책이 존재하지 않는다. 둘째, 생성된 답변이 그 답변의 소스 정보에 여전히 충실하게 근거하고 있는지 확인하는 것이 출력의 무결성과 유용성을 유지하는 데 있어 무엇보다 중요하다. 마지막으로 RAG 시스템의 정교함에도 불구하고 남아있는 오류와 편향성이 응답에 침투할 가능성은 여전히 중요한 우려 사항이다. 편향성을 해결하기 위해서는 알고리즘의 설계와 기반 데이터 집합의 선별에서 모두 신중을 기해 시스템 응답에서 이 같은 문제가 지속되지 않도록 해야 한다. RAG의 미래 : RAG로 강화되는 지능형 에이전트로 가는 길 최근 학계와 업계에서 모두 RAG 시스템을 강화하기 위한 노력이 활기를 띠면서 그 결과로 이른바 고급 또는 모듈형 RAG가 등장했다. 이런 진보된 시스템에는 효과를 증폭하기 위한 다양한 정교한 기술이 통합된다. 주목할 만한 발전은 날짜 또는 챕터 요약과 같은 부수적인 정보를 텍스트 청크 내에 인코딩하는 메타데이터 필터링 및 스코핑(scoping)의 통합이다. 이는 방대한 문서 뭉치를 탐색하는 리트리버의 역량을 개선할 뿐 아니라 메타데이터에 대한 일치(congruity) 평가를 강화해서 매칭 프로세스를 최적화한다. 또한 고급 RAG 구현은 하이브리드 검색 패러다임을 수용해서 키워드, 시맨틱, 벡터 기반 검색 중에서 동적으로 선택해 사용자 질의의 속성과 가용 데이터의 특징에 맞춰 조정한다. 쿼리 처리 영역에서 중요한 혁신은 쿼리 라우터다. 쿼리 라우터는 가장 적절한 다운스트림 작업을 식별하고 정보를 소싱할 최적의 리포지토리를 지정한다. 쿼리 엔지니어링 측면에서는 사용자 입력과 문서 내용 간의 연관성을 더 강화하기 위해 다양한 기법이 사용되며, 때때로 LLM을 활용해서 문서 매칭 정확성을 높이는 보충 컨텍스트, 인용, 비평 또는 가상의 답변을 작성하기도 한다. 이런 시스템은 LLM이 참조할 최적의 시점과 콘텐츠를 선제적으로 정확히 찾아서 정보 검색 단계에서 관련성과 적시성을 보장하는 적응형 검색 전략으로 발전했다. 또한 생각의 사슬 또는 생각의 나무 기법과 같은 정교한 추론 방법도 RAG 프레임워크에 통합됐다. 생각의 사슬(chain of thought, CoT)은 일련의 중간 단계 또는 추론을 생성하는 방법으로 사고 프로세스를 시뮬레이션하고, 생각의 나무(tree of thought, ToT)는 아이디어의 줄기 구조를 구축하고 다양한 옵션을 평가해 신중하고 정확한 결론에 이른다. 검색 증강 사고(retrieval-augmented thoughts, RAT)와 같은 최첨단 접근 방식은 RAG와 CoT의 개념을 결합해서 관련 정보를 검색하고 논리적으로 추론하는 시스템 역량을 강화한다. RAG-증강 추론(RAG-augmented reasoning, RAGAR)은 여기서 더 발전된 단계로, 최신 외부 웹 리소스에 대한 일련의 자체 검증 단계와 함께 CoT와 ToT를 통합한다. 또한 RAGAR은 멀티모달 입력을 처리하기 위한 기능을 확장해서 시각 정보와 텍스트 정보를 동시에 처리한다. 이를 통해 RAG 시스템은 정보 검색과 합성을 위한 높은 신뢰성을 갖춘 프레임워크가 된다. RAT, RAGAR과 같은 발전이 이뤄지고 고급 정보 검색 기법과 정교한 LLM이 제공하는 심층 추론이 더 조화를 이루면서 차세대 엔터프라이즈 인텔리전스 솔루션의 주춧돌로 RAG의 위상이 더욱 공고해지고 있다. 정제된 정보 검색의 정확성과 사실성은 LLM의 분석, 추론, 그리고 에이전트 역량과 결합되어 의사 결정부터 전략적 계획 수립에 이르기까지 복잡한 엔터프라이즈 애플리케이션에 맞춤화된 지능형 에이전트 시대가 도래할 것임을 예고한다. RAG로 강화되는 이런 에이전트는 전략적 엔터프라이즈 컨텍스트의 까다로운 요구사항에 대처할 수 있는 역량을 갖추게 될 것이다. *Paul Yu-Chun Chang은 어플라이드AI 이니셔티브 GmbH의 파운데이션 모델 부문 선임 AI 전문가다. Bernhard Pflugfelder는 어플라이드AI 이니셔티브 GmbH의 혁신 연구소(생성형 AI) 소장이다. editor@itworld.co.kr
윈도우 PC는 놀랍도록 강력하고 유연하다. 각종 서드파티 앱을 설치하지 않아도 그렇다. 윈도우에는 유용한 기능이 많지만, 이런 기능을 실제로 알고 있는 사람은 드물다. class="image" ⓒ Rui Silvestre/Unsplash 여기서는 대학교에서 사용하는 노트북을 한 단계 업그레이드하고자 하는 대학생을 위해 노트 필기, 프로젝트 조사, 또는 기타 작업에 도움이 되는 윈도우의 알려지지 않은 기본 기능을 소개한다. 라이브 캡션 class="image" ⓒ Foundry 윈도우 11에는 오디오를 듣고 즉시 읽을 수 있는 캡션을 자동으로 생성하는 라이브 캡션(Live Captions)이라는 기능이 있다. 이 기능은 동영상을 시청할 때 작동하지만, 마이크로 녹음한 오디오에서도 작동한다. 라이브 캡션은 사용자가 강의실에 앉아 강의를 듣거나 녹화된 동영상을 시청할 때 음성 텍스트 변환 기술을 사용해 듣는 내용을 읽을 수 있는 텍스트로 변환한다. 시작 메뉴에서 '라이브 캡션'을 검색하고 라이브 캡션 앱을 실행하기만 하면 된다. 모든 윈도우 11 PC에서 사용할 수 있으며, 작동하려면 인터넷 연결이 필요하다. 코파일럿+ PC를 사용할 경우 라이브 캡션 기능은 오프라인에서도 작동하며 다른 언어 간의 실시간 번역도 지원한다. 클립보드 기록 class="image" ⓒ Foundry 텍스트를 복사해 붙여넣을 때마다 이전에 복사한 내용을 덮어쓴다고 생각할 수 있지만, 그렇지 않다. 윈도우 11의 클립보드 기록 기능은 복사한 모든 텍스트와 이미지를 추적한다. 일반적인 붙여넣기는 마지막으로 복사한 내용을 붙여넣는다. 이 작업을 하는 Ctrl + V 단축키 대신 Windows + V 단축키를 사용하면 이전에 복사한 항목 중에서 선택할 수 있다. 아직 클립보드 기록 기능을 활성화하지 않았다면 활성화하라는 메시지가 표시된다. 클립보드 기록 기능을 사용하면 항목을 '고정'할 수도 있어 나중에도 편리하게 액세스할 수 있다. 윈도우의 대표적인 생산성 기능이다. 손글씨로 텍스트 입력 class="image" ⓒ Ashkan Forouzani / Unsplash 일부 윈도우 노트북은 정전식 펜을 지원한다. 이런 펜 지원 PC는 원노트와 같은 뛰어난 노트 작성 앱에서 손글씨 메모, 수학 방정식, 다이어그램 등을 훨씬 쉽게 작성할 수 있어 대학생에게 좋은 선택이다. 윈도우 11에서는 훨씬 더 유용하다. 필기 인식 기능 덕분에 모든 앱에서 펜 입력이 작동한다. 펜으로 텍스트 필드에 직접 글을 쓰면 윈도우가 즉시 텍스트로 변환한다. 받아쓰기 class="image" ⓒ Foundry 윈도우 11에는 받아쓰기 기능이 내장돼 있어 생각을 소리 내어 말하면 바로 텍스트로 받아쓰기할 수 있다. 즉, 휴대폰처럼 음성으로 입력할 수 있다. Windows + H 단축키를 사용하면 윈도우 11 받아쓰기 도구가 열린다. 터치스크린이 있는 PC를 사용하는 경우에는 터치 키보드의 마이크 버튼을 탭하여 실행할 수도 있다. 데스크톱 앱처럼 사용하는 웹 앱 class="image" ⓒ Foundry 스토어에서 다운로드한 앱이 실제로는 브라우저에서 실행되는 웹사이트에 불과한 경우가 많다. 사용하는 모든 웹 페이지와 웹 앱을 수십 개의 탭으로 열어 두는 것이 싫은가? 윈도우 11에서는 웹 페이지와 웹 앱을 윈도우 '앱'으로 전환할 수 있다. 이런 앱은 작업 표시줄에서 자체 아이콘을 가지고 있으며, 일반적인 데스크톱 앱과 거의 동일한 느낌을 준다. 지메일, 스포티파이, 슬랙처럼 24시간 내내 열어 두는 단일 페이지 웹 앱 사용 시 특히 편리하다. 스티커 메모 class="image" ⓒ Microsoft 마이크로소프트 원노트는 훌륭한 노트 필기 애플리케이션이지만, 너무 복잡할 수 있다. 여기저기 간단한 메모만 적고 싶다면 스티커 메모(Sticky Notes) 앱을 사용해 보기를 바란다. 윈도우 11에는 시작 메뉴에서 'Sticky Notes'를 검색해 실행할 수 있는 스티커 메모 앱이 내장돼 있다. 이 앱은 메모를 바탕화면에 고정하거나 간단한 목록 형식으로 보관할 수 있으며, PC와 다른 기기 간에 동기화도 지원한다. 휴대폰과 동기화할 때는 원노트 모바일, 안드로이드용 마이크로소프트 런처, 윈도우용 아웃룩을 통해 메모에 액세스할 수 있다. 이모지 메뉴 class="image" ⓒ Foundry 윈도우에는 이모지를 위한 편리한 빠른 삽입 도구가 내장돼 있다. Windows + . 또는 ; 단축키를 사용하면 도구에 액세스할 수 있다. 윈도우에서 제공하는 모든 이모지를 모든 애플리케이션과 문서에 삽입할 수 있다. 메뉴를 호출한 후 단어를 입력하면 이모지를 검색할 수도 있다. 텍스트 편집 단축키 class="image" ⓒ 76 / Unsplash Ctrl 키는 텍스트 편집에 꼭 필요한 수많은 키보드 단축키를 제공한다. 필자가 가장 좋아하는 부분은 개별 문자가 아닌 단어 전체에 이런 텍스트 편집 동작을 적용할 수 있다는 점이다. 예를 들면 다음과 같다. 일반적으로 백스페이스 키를 누르면 한 문자만 삭제된다. 하지만 Ctrl + 백스페이스 키를 누르면 단어 전체를 삭제한다. 이 기능은 삭제 키를 비롯한 많은 단축키와 함께 작동한다. 또 다른 예는 텍스트 선택이다. Shift 키를 누른 상태에서 ← 또는 → 키를 눌러 개별 문자를 선택할 수 있다. 하지만 Ctrl + Shift + ← 또는 → 키를 사용하면 한 번에 전체 단어를 선택할 수 있다. Ctrl + Shift + Home 또는 End 키를 사용하면 한 번의 키 입력으로 전체 텍스트를 선택해 페이지 상단(Home)으로 올라가거나 하단(End)으로 내려간다. 동적 잠금 class="image" ⓒ Foundry 노트북을 사용하든 PC를 사용하든, 대학교 캠퍼스와 같은 공공장소에서는 컴퓨터를 사용하지 않을 때마다 잠그는 것이 좋다. 이미 단축키(Windows + L)를 사용하거나 절전 모드에 들어갈 때마다 자동으로 잠기는 설정을 사용하고 있을 것이다. 하지만 윈도우 11에는 휴대폰이 컴퓨터에서 멀어지는 것을 감지해 자동으로 잠그는 '동적 잠금'이라는 더 좋은 선택지도 있다. '설정 앱 → 계정 → 로그인 옵션 → 동적 잠금'에서 이 기능을 설정할 수 있다. 존재 감지 기반 잠금 class="image" ⓒ Ernest Ojeh / Unsplash 존재 감지 센서(Presence Sensor)가 탑재된 최신 노트북은 휴대폰을 사용할 필요도 없다. 사용자가 컴퓨터에서 멀어지는 것을 감지해 자동으로 잠그고, 다시 앉으면 자동으로 잠금이 해제된다. 얼굴 인식 기능이 있는 윈도우 헬로(Windows Hello)를 설정한 경우 자동으로 다시 로그인할 수 있다. 집중 세션 class="image" ⓒ Foundry 포모도로(Pomodoro) 기법을 아는가? 25분간 집중력을 유지하고 5분간 쉬는 시간 관리 방법론이다. 포모도로 기법을 사용하는 대부분 사람은 타이머를 사용해 작업과 휴식의 전환 시기를 파악한다. 윈도우 11에는 포모도로 타이머가 내장돼 있다. 시작 메뉴에서 시계 앱을 연 다음, '집중 세션' 기능을 활성화하면 된다. 집중하는 동안에는 모든 윈도우 시스템 알림과 앱 알림이 차단된다. 집중하는 동안 적절한 음악이 재생되도록 스포티파이 계정을 연결할 수도 있다. 방해 금지 모드 class="image" ⓒ Foundry 윈도우에는 집중할 때 시끄러운 알림을 끄는 방해 금지 모드 기능이 있다. 방해 금지 모드는 스마트폰에서는 오랫동안 인기 있는 기능이었지만, 윈도우 PC에는 오랫동안 이런 기능이 없었다. 윈도우 11에서 방해 금지 모드를 사용하려면 Windows + N을 눌러 알림 센터를 연 다음, 오른쪽 상단에 있는 'Z가 있는 종' 아이콘을 클릭한다. 윈도우 10에서는 일시적으로 알림을 비활성화하려면 포커스 어시스트(Focus Assist)라는 설정을 활성화해야 한다. 휴대폰과 동기화 class="image" ⓒ Microsoft 윈도우를 사용하면 PC에서 휴대폰에 쉽게 접근하고 제어할 수 있다. 스마트폰 운영체제에 따라 프로세스와 기능은 다르다. 아이폰을 사용하는 경우, 윈도우용 아이클라우드 앱을 설치한다. 설정이 완료되면 아이클라우드 사진을 사진 앱에 연결하고 윈도우 내에서 탐색할 수 있다. 또한 드라이브, 암호, 연락처, 캘린더 및 책갈피를 비롯한 아이클라우드의 다른 기능과도 통합할 수 있다. 안드로이드 휴대폰을 사용하는 경우, 시작 메뉴에서 '휴대폰과 연결' 앱을 연다. 이 앱을 설정하면 PC에서 문자를 보내고, 휴대폰의 알림을 관리하고, 카메라 롤에서 사진을 찾아보고, 사진을 PC로 복사하여 붙여넣기할 수 있다. 화면 캡처 및 녹화 class="image" ⓒ Foundry 최신 윈도우 PC에는 강력한 화면 캡처 도구가 내장되어 있습니다. 윈도우 11에서는 '캡처 도구'라고 부른다. Windows + Shift + S 단축키를 누르면 바로 실행할 수 있다. 캡처 도구가 열리면 화면 상단에 오버레이 표시줄이 나타난다. 이 막대를 사용해 원하는 스크린샷 유형(직사각형, 윈도우, 전체 화면 또는 자유형)을 선택한다. 그런 다음 클릭하거나 드래그하여 캡처할 항목을 선택하면 알림이 표시된다. 알림을 클릭해 스크린샷을 저장하기 전에 편집할 수 있다. 캡처 도구에는 화면을 동영상으로 녹화하는 기능이 포함돼 있다. 화면 상단의 오버레이 표시줄에서 비디오 카메라 아이콘으로 전환한 다음 캡처하려는 영역 위에 직사각형을 그리면 된다. 이전 버전의 파일 복원 class="image" ⓒ Foundry 윈도우에서는 파일의 이전 버전을 검색하는 여러 가지 방법을 제공한다. 파일이 마이크로소프트의 원드라이브 클라우드 저장소에 동기화된 경우, 파일 탐색기에서 파일을 찾아 마우스 오른쪽 단추로 클릭한 다음 '원드라이브 버전 기록'을 선택할 수 있다. 클라우드 저장소 서비스에 동기화되지 않고 PC에만 저장된 파일이라면 '파일 기록(File History)' 기능을 설정해 선택한 파일 및 폴더를 정기적으로 외장 드라이브에 백업할 수 있다. 백업본에서 파일의 이전 버전을 복원할 수 있다. 분실 노트북 추적 class="image" ⓒ Foundry 대학교에서 노트북을 사용한다면 분실이나 도난에 대비한 비상 계획을 세워야 한다. 한 가지 옵션은 윈도우에 내장된 노트북 추적 기능을 사용하는 것이다. 이를 통해 원격으로 노트북을 잠글 수 있다. 노트북은 셀룰러 연결이 되지 않을 가능성이 높기 때문에 스마트폰에서 지원하는 위치 추적 기능만큼 유용하지는 않을 것이다. 추적 기능을 사용하려면 노트북이 와이파이에 연결되어 있어야 하며, 절전 모드에 있으면 안 된다. 완벽하지는 않더라도 여전히 유용하다. 캠퍼스에서 노트북을 분실하더라도 와이파이에 연결된 상태로 유지되면 추적할 수 있다. 물론 노트북 분실 전에 이 기능을 활성화해야 한다. '설정 앱 → 개인 정보 및 보안 → 내 장치 찾기'로 이동해 설정을 활성화하면 나중에 마이크로소프트 계정 페이지에서 노트북을 추적할 수 있다. 고급 계산기 class="image" ⓒ Foundry 윈도우에 내장된 계산기 앱은 보기보다 훨씬 강력하다. 앱 메뉴를 열면 공학용 계산기, 그래프, 통화 및 측정 단위 변환 도구 등 다양한 모드가 숨어 있다. 빠른 동영상 편집 class="image" ⓒ Foundry 윈도우에는 마이크로소프트의 클립챔프(Clipchamp) 동영상 편집기가 함께 제공되지만, 운영체제 내에 또 다른 유용한 동영상 도구가 숨겨져 있다. 이 기능을 사용하면 동영상 파일을 빠르게 잘라 크기가 더 작은 동영상 파일로 저장할 수 있다. 파일 탐색기에서 동영상 파일을 '사진' 앱으로 열면 이 작업을 수행할 수 있다. 왼쪽 상단의 도구 모음에서 '자르기' 버튼을 클릭하고 자르고 싶은 구간을 설정해 저장하면 된다. 빠른 사진 편집 class="image" ⓒ Foundry 사진 앱에 내장된 기능에 놀랐는가? 사진 앱은 단순한 사진 뷰어가 아니다. 간단한 자르기 및 편집이 필요할 때 훌륭한 사진 편집기로도 사용할 수 있다. 앱에서 이미지를 연 후 도구 모음에서 '편집' 버튼을 클릭하면 이미지 편집 도구에 액세스할 수 있다. 이미지 자르기, 마크업, 조명 조정, 필터 적용, 심지어 배경이나 사진 속 특정 요소를 지우는 생성형 AI 기능을 제공한다. 배터리 소모량 통계 class="image" ⓒ Foundry 누구나 노트북 배터리 수명을 늘리고 싶어 한다. 노트북 배터리가 생각보다 훨씬 빨리 소모된다면 어떤 앱이 가장 크게 영향을 미치는지 살펴보는 것이 도움이 된다. 윈도우가 배터리 소모량을 추적해 문제를 해결할 수 있도록 도와준다. 윈도우 11 설정 앱에서 '시스템 → 전원 및 배터리'로 이동한다. '배터리 사용량' 항목을 확장하면 앱별 배터리 사용량을 확인할 수 있다. 윈도우 10에서는 '설정 → 시스템 → 배터리'에서 세부 정보를 확인할 수 있다. editor@itworld.co.kr
윈도우 PC는 놀랍도록 강력하고 유연하다. 각종 서드파티 앱을 설치하지 않아도 그렇다. 윈도우에는 유용한 기능이 많지만, 이런 기능을 실제로 알고 있는 사람은 드물다. 여기서는 대학교에서 사용하는 노트북을 한 단계 업그레이드하고자 하는 대학생을 위해 노트 필기, 프로젝트 조사, 또는 기타 작업에 도움이 되는 윈도우의 알려지지 않은 기본 기능을 소개한다. 라이브 캡션 윈도우 11에는 오디오를 듣고 즉시 읽을 수 있는 캡션을 자동으로 생성하는 라이브 캡션(Live Captions)이라는 기능이 있다. 이 기능은 동영상을 시청할 때 작동하지만, 마이크로 녹음한 오디오에서도 작동한다. 라이브 캡션은 사용자가 강의실에 앉아 강의를 듣거나 녹화된 동영상을 시청할 때 음성 텍스트 변환 기술을 사용해 듣는 내용을 읽을 수 있는 텍스트로 변환한다. 시작 메뉴에서 '라이브 캡션'을 검색하고 라이브 캡션 앱을 실행하기만 하면 된다. 모든 윈도우 11 PC에서 사용할 수 있으며, 작동하려면 인터넷 연결이 필요하다. 코파일럿+ PC를 사용할 경우 라이브 캡션 기능은 오프라인에서도 작동하며 다른 언어 간의 실시간 번역도 지원한다. 클립보드 기록 텍스트를 복사해 붙여넣을 때마다 이전에 복사한 내용을 덮어쓴다고 생각할 수 있지만, 그렇지 않다. 윈도우 11의 클립보드 기록 기능은 복사한 모든 텍스트와 이미지를 추적한다. 일반적인 붙여넣기는 마지막으로 복사한 내용을 붙여넣는다. 이 작업을 하는 Ctrl + V 단축키 대신 Windows + V 단축키를 사용하면 이전에 복사한 항목 중에서 선택할 수 있다. 아직 클립보드 기록 기능을 활성화하지 않았다면 활성화하라는 메시지가 표시된다. 클립보드 기록 기능을 사용하면 항목을 '고정'할 수도 있어 나중에도 편리하게 액세스할 수 있다. 윈도우의 대표적인 생산성 기능이다. 손글씨로 텍스트 입력 일부 윈도우 노트북은 정전식 펜을 지원한다. 이런 펜 지원 PC는 원노트와 같은 뛰어난 노트 작성 앱에서 손글씨 메모, 수학 방정식, 다이어그램 등을 훨씬 쉽게 작성할 수 있어 대학생에게 좋은 선택이다. 윈도우 11에서는 훨씬 더 유용하다. 필기 인식 기능 덕분에 모든 앱에서 펜 입력이 작동한다. 펜으로 텍스트 필드에 직접 글을 쓰면 윈도우가 즉시 텍스트로 변환한다. 받아쓰기 윈도우 11에는 받아쓰기 기능이 내장돼 있어 생각을 소리 내어 말하면 바로 텍스트로 받아쓰기할 수 있다. 즉, 휴대폰처럼 음성으로 입력할 수 있다. Windows + H 단축키를 사용하면 윈도우 11 받아쓰기 도구가 열린다. 터치스크린이 있는 PC를 사용하는 경우에는 터치 키보드의 마이크 버튼을 탭하여 실행할 수도 있다. 데스크톱 앱처럼 사용하는 웹 앱 스토어에서 다운로드한 앱이 실제로는 브라우저에서 실행되는 웹사이트에 불과한 경우가 많다. 사용하는 모든 웹 페이지와 웹 앱을 수십 개의 탭으로 열어 두는 것이 싫은가? 윈도우 11에서는 웹 페이지와 웹 앱을 윈도우 '앱'으로 전환할 수 있다. 이런 앱은 작업 표시줄에서 자체 아이콘을 가지고 있으며, 일반적인 데스크톱 앱과 거의 동일한 느낌을 준다. 지메일, 스포티파이, 슬랙처럼 24시간 내내 열어 두는 단일 페이지 웹 앱 사용 시 특히 편리하다. 스티커 메모 마이크로소프트 원노트는 훌륭한 노트 필기 애플리케이션이지만, 너무 복잡할 수 있다. 여기저기 간단한 메모만 적고 싶다면 스티커 메모(Sticky Notes) 앱을 사용해 보기를 바란다. 윈도우 11에는 시작 메뉴에서 'Sticky Notes'를 검색해 실행할 수 있는 스티커 메모 앱이 내장돼 있다. 이 앱은 메모를 바탕화면에 고정하거나 간단한 목록 형식으로 보관할 수 있으며, PC와 다른 기기 간에 동기화도 지원한다. 휴대폰과 동기화할 때는 원노트 모바일, 안드로이드용 마이크로소프트 런처, 윈도우용 아웃룩을 통해 메모에 액세스할 수 있다. 이모지 메뉴 윈도우에는 이모지를 위한 편리한 빠른 삽입 도구가 내장돼 있다. Windows + . 또는 ; 단축키를 사용하면 도구에 액세스할 수 있다. 윈도우에서 제공하는 모든 이모지를 모든 애플리케이션과 문서에 삽입할 수 있다. 메뉴를 호출한 후 단어를 입력하면 이모지를 검색할 수도 있다. 텍스트 편집 단축키 Ctrl 키는 텍스트 편집에 꼭 필요한 수많은 키보드 단축키를 제공한다. 필자가 가장 좋아하는 부분은 개별 문자가 아닌 단어 전체에 이런 텍스트 편집 동작을 적용할 수 있다는 점이다. 예를 들면 다음과 같다. 일반적으로 백스페이스 키를 누르면 한 문자만 삭제된다. 하지만 Ctrl + 백스페이스 키를 누르면 단어 전체를 삭제한다. 이 기능은 삭제 키를 비롯한 많은 단축키와 함께 작동한다. 또 다른 예는 텍스트 선택이다. Shift 키를 누른 상태에서 ← 또는 → 키를 눌러 개별 문자를 선택할 수 있다. 하지만 Ctrl + Shift + ← 또는 → 키를 사용하면 한 번에 전체 단어를 선택할 수 있다. Ctrl + Shift + Home 또는 End 키를 사용하면 한 번의 키 입력으로 전체 텍스트를 선택해 페이지 상단(Home)으로 올라가거나 하단(End)으로 내려간다. 동적 잠금 노트북을 사용하든 PC를 사용하든, 대학교 캠퍼스와 같은 공공장소에서는 컴퓨터를 사용하지 않을 때마다 잠그는 것이 좋다. 이미 단축키(Windows + L)를 사용하거나 절전 모드에 들어갈 때마다 자동으로 잠기는 설정을 사용하고 있을 것이다. 하지만 윈도우 11에는 휴대폰이 컴퓨터에서 멀어지는 것을 감지해 자동으로 잠그는 '동적 잠금'이라는 더 좋은 선택지도 있다. '설정 앱 → 계정 → 로그인 옵션 → 동적 잠금'에서 이 기능을 설정할 수 있다. 존재 감지 기반 잠금 존재 감지 센서(Presence Sensor)가 탑재된 최신 노트북은 휴대폰을 사용할 필요도 없다. 사용자가 컴퓨터에서 멀어지는 것을 감지해 자동으로 잠그고, 다시 앉으면 자동으로 잠금이 해제된다. 얼굴 인식 기능이 있는 윈도우 헬로(Windows Hello)를 설정한 경우 자동으로 다시 로그인할 수 있다. 집중 세션 포모도로(Pomodoro) 기법을 아는가? 25분간 집중력을 유지하고 5분간 쉬는 시간 관리 방법론이다. 포모도로 기법을 사용하는 대부분 사람은 타이머를 사용해 작업과 휴식의 전환 시기를 파악한다. 윈도우 11에는 포모도로 타이머가 내장돼 있다. 시작 메뉴에서 시계 앱을 연 다음, '집중 세션' 기능을 활성화하면 된다. 집중하는 동안에는 모든 윈도우 시스템 알림과 앱 알림이 차단된다. 집중하는 동안 적절한 음악이 재생되도록 스포티파이 계정을 연결할 수도 있다. 방해 금지 모드 윈도우에는 집중할 때 시끄러운 알림을 끄는 방해 금지 모드 기능이 있다. 방해 금지 모드는 스마트폰에서는 오랫동안 인기 있는 기능이었지만, 윈도우 PC에는 오랫동안 이런 기능이 없었다. 윈도우 11에서 방해 금지 모드를 사용하려면 Windows + N을 눌러 알림 센터를 연 다음, 오른쪽 상단에 있는 'Z가 있는 종' 아이콘을 클릭한다. 윈도우 10에서는 일시적으로 알림을 비활성화하려면 포커스 어시스트(Focus Assist)라는 설정을 활성화해야 한다. 휴대폰과 동기화 윈도우를 사용하면 PC에서 휴대폰에 쉽게 접근하고 제어할 수 있다. 스마트폰 운영체제에 따라 프로세스와 기능은 다르다. 아이폰을 사용하는 경우, 윈도우용 아이클라우드 앱을 설치한다. 설정이 완료되면 아이클라우드 사진을 사진 앱에 연결하고 윈도우 내에서 탐색할 수 있다. 또한 드라이브, 암호, 연락처, 캘린더 및 책갈피를 비롯한 아이클라우드의 다른 기능과도 통합할 수 있다. 안드로이드 휴대폰을 사용하는 경우, 시작 메뉴에서 '휴대폰과 연결' 앱을 연다. 이 앱을 설정하면 PC에서 문자를 보내고, 휴대폰의 알림을 관리하고, 카메라 롤에서 사진을 찾아보고, 사진을 PC로 복사하여 붙여넣기할 수 있다. 화면 캡처 및 녹화 최신 윈도우 PC에는 강력한 화면 캡처 도구가 내장되어 있습니다. 윈도우 11에서는 '캡처 도구'라고 부른다. Windows + Shift + S 단축키를 누르면 바로 실행할 수 있다. 캡처 도구가 열리면 화면 상단에 오버레이 표시줄이 나타난다. 이 막대를 사용해 원하는 스크린샷 유형(직사각형, 윈도우, 전체 화면 또는 자유형)을 선택한다. 그런 다음 클릭하거나 드래그하여 캡처할 항목을 선택하면 알림이 표시된다. 알림을 클릭해 스크린샷을 저장하기 전에 편집할 수 있다. 캡처 도구에는 화면을 동영상으로 녹화하는 기능이 포함돼 있다. 화면 상단의 오버레이 표시줄에서 비디오 카메라 아이콘으로 전환한 다음 캡처하려는 영역 위에 직사각형을 그리면 된다. 이전 버전의 파일 복원 윈도우에서는 파일의 이전 버전을 검색하는 여러 가지 방법을 제공한다. 파일이 마이크로소프트의 원드라이브 클라우드 저장소에 동기화된 경우, 파일 탐색기에서 파일을 찾아 마우스 오른쪽 단추로 클릭한 다음 '원드라이브 버전 기록'을 선택할 수 있다. 클라우드 저장소 서비스에 동기화되지 않고 PC에만 저장된 파일이라면 '파일 기록(File History)' 기능을 설정해 선택한 파일 및 폴더를 정기적으로 외장 드라이브에 백업할 수 있다. 백업본에서 파일의 이전 버전을 복원할 수 있다. 분실 노트북 추적 대학교에서 노트북을 사용한다면 분실이나 도난에 대비한 비상 계획을 세워야 한다. 한 가지 옵션은 윈도우에 내장된 노트북 추적 기능을 사용하는 것이다. 이를 통해 원격으로 노트북을 잠글 수 있다. 노트북은 셀룰러 연결이 되지 않을 가능성이 높기 때문에 스마트폰에서 지원하는 위치 추적 기능만큼 유용하지는 않을 것이다. 추적 기능을 사용하려면 노트북이 와이파이에 연결되어 있어야 하며, 절전 모드에 있으면 안 된다. 완벽하지는 않더라도 여전히 유용하다. 캠퍼스에서 노트북을 분실하더라도 와이파이에 연결된 상태로 유지되면 추적할 수 있다. 물론 노트북 분실 전에 이 기능을 활성화해야 한다. '설정 앱 → 개인 정보 및 보안 → 내 장치 찾기'로 이동해 설정을 활성화하면 나중에 마이크로소프트 계정 페이지에서 노트북을 추적할 수 있다. 고급 계산기 윈도우에 내장된 계산기 앱은 보기보다 훨씬 강력하다. 앱 메뉴를 열면 공학용 계산기, 그래프, 통화 및 측정 단위 변환 도구 등 다양한 모드가 숨어 있다. 빠른 동영상 편집 윈도우에는 마이크로소프트의 클립챔프(Clipchamp) 동영상 편집기가 함께 제공되지만, 운영체제 내에 또 다른 유용한 동영상 도구가 숨겨져 있다. 이 기능을 사용하면 동영상 파일을 빠르게 잘라 크기가 더 작은 동영상 파일로 저장할 수 있다. 파일 탐색기에서 동영상 파일을 '사진' 앱으로 열면 이 작업을 수행할 수 있다. 왼쪽 상단의 도구 모음에서 '자르기' 버튼을 클릭하고 자르고 싶은 구간을 설정해 저장하면 된다. 빠른 사진 편집 사진 앱에 내장된 기능에 놀랐는가? 사진 앱은 단순한 사진 뷰어가 아니다. 간단한 자르기 및 편집이 필요할 때 훌륭한 사진 편집기로도 사용할 수 있다. 앱에서 이미지를 연 후 도구 모음에서 '편집' 버튼을 클릭하면 이미지 편집 도구에 액세스할 수 있다. 이미지 자르기, 마크업, 조명 조정, 필터 적용, 심지어 배경이나 사진 속 특정 요소를 지우는 생성형 AI 기능을 제공한다. 배터리 소모량 통계 누구나 노트북 배터리 수명을 늘리고 싶어 한다. 노트북 배터리가 생각보다 훨씬 빨리 소모된다면 어떤 앱이 가장 크게 영향을 미치는지 살펴보는 것이 도움이 된다. 윈도우가 배터리 소모량을 추적해 문제를 해결할 수 있도록 도와준다. 윈도우 11 설정 앱에서 '시스템 → 전원 및 배터리'로 이동한다. '배터리 사용량' 항목을 확장하면 앱별 배터리 사용량을 확인할 수 있다. 윈도우 10에서는 '설정 → 시스템 → 배터리'에서 세부 정보를 확인할 수 있다. editor@itworld.co.kr
페이스북이 개발해 모두가 사용할 수 있도록 오픈소스 표준으로 공개한 그래프QL(GraphQL)은 REST API의 대안을 표방한다. 그래프QL은 REST와 마찬가지로 웹 기반 API를 만들고 소비하는 방법을 제공하지만, 쿼리와 반환된 데이터는 형식 스키마와 유형 시스템을 사용해 일관성을 보장한다. 여기서는 그래프QL API 설계와 구현의 기본 사항을 살펴보고 여러 가지 주요 고려 사항과 이 과정에서 내리게 되는 의사 결정에 대해 알아본다. 그래프QL 언어와 프레임워크 웹 애플리케이션 API로 그래프QL을 사용할 계획이라면 이미 사용 중인 언어 및 데이터 구성요소가 이를 지원할 가능성이 높다. 그래프QL 라이브러리는 프로덕션에 사용되는 거의 모든 주요 언어에 제공된다. 클라이언트는 C#/닷넷, 고, 자바, 안드로이드, 자바스크립트, 스위프트/오브젝티브 C, 파이썬용으로 제공되며 서버 라이브러리는 그보다 더욱 광범위하게 지원된다. 완전히 새로 시작한다 해도 다른 프로젝트에서 가장 익숙한 언어와 런타임, 데이터 계층을 선택하는 것이 최선이다. 그래프QL은 서버나 클라이언트에 많은 제약을 두지 않으며 데이터베이스를 가리지 않는다. 다만 데이터 계층에 따라 얼마간의 수동 통합이 필요할 수는 있다. (이 부분에 대해서는 다음 섹션에서 더 자세히 살펴본다.) 여기서는 참고용으로 그래프QL의 파이썬 구현을 사용한다. 개념과 기능은 다른 언어에서도 대체로 동일하다. 그래프QL의 데이터 쿼리 스키마 그래프QL은 다양한 계층 구조의 강한 유형의 필드에서 구성된 쿼리를 받는다. 그래프QL API를 만들 때 가장 잘 생각해야 하는 부분은 쿼리에 제공할 스키마다. 많은 경우 쿼리 필드를 기반 데이터 소스에 일 대 일로 매핑해서 쿼리를 위해 데이터베이스(또는 다른 데이터 소스)의 모든 관련 필드를 노출할 수 있다. 그래프QL 쿼리는 REST 쿼리에 비해 훨씬 더 제약이 없고 다양할 수 있으므로 처음부터 쿼리 가능한 필드와 이러한 필드를 데이터베이스에 매핑할 계획을 세워야 한다. 예를 들어, 영화를 위한 데이터베이스 테이블이 있고 이 테이블에 title과 year(정수)가 있다면 다음과 같은 그래프QL을 사용할 수 있다. type Character { title: String! year: Int } String 뒤에 나오는 !는 필드가 필수임을 의미하므로, 이 쿼리를 수행하려면 최소한 제목은 필요할 것이다. 또한 그래프QL을 통해 노출하는 필드가 기반 데이터와 정확히 일치하는 유형을 사용하도록 해야 한다. 예를 들어 그래프QL에는 기본 "date" 또는 "datetime" 데이터 유형이 없다. 사용 가능한 구현이 매우 다양하다는 것이 주된 이유다. 날짜 범위에 따른 검색을 허용하려면 API를 통해 가져온 날짜의 서식을 강제하고, 쿼리할 때 이러한 날짜 요청이 백엔드 데이터베이스에 적절한 유형으로 변환되도록 해야 한다. 사용 중인 프레임워크에 따라 이 작업이 이미 이뤄졌을 수도 있다. 파이썬에서 인기 있는 그래프QL 라이브러리인 그래핀(Graphene)은 ISO8601 형식의 날짜시간 값을 유형 네이티브로 제공하므로 직접 처리할 필요가 없다. 데이터 집합에 많은 필드가 있다면 복잡한 유형 강제가 불필요한 최소 기능 하위 집합을 노출하는 것부터 시작한다(예를 들어, 간단한 문자열 또는 숫자 쿼리). 그런 다음 사용 중인 그래프QL 커넥터를 통해 쿼리를 구현하는 방법을 파악하면서 사용 가능한 필드를 점진적으로 확대할 수 있다. 그래프QL 데이터 저장과 검색 백엔드에 데이터를 저장하고 검색하려면 일반적으로 사용 중인 언어의 그래프QL 라이브러리에서 지원하는 미들웨어를 사용한다. 많은 경우 일반적인 애플리케이션 프레임워크의 데이터 계층을 통해 그래프QL이 이 작업을 수행하도록 할 수 있다. 예를 들어 파이썬의 그래프QL용 그래핀 라이브러리는 장고(Django) 웹 프레임워크와 함께 장고의 내장된 ORM을 지원한다. 그래핀은 SQL알케미(SQLAlchemy) ORM을 지원하며, 인기 있는 스탈렛(Starlette)과 패스트API(FastAPI) 프레임워크에 대한 지원도 추가됐다. 또한 구글 앱 엔진의 데이터 커넥터, 릴레이 자바스크립트 프레임워크(리액트에 사용됨)와 상호운용이 가능하다. 이런 구성요소에 의해 기술되지 않은 데이터 계층을 사용하는 경우 그래핀의 미들웨어와 DataLoader 객체를 사용해 빈 틈을 채울 수 있다. 이 둘은 데이터 계층에 필요한 통합을 수동으로 연결할 수 있게 해준다. DataLoader를 사용하면 관련 데이터에 대한 여러 개의 통시 요청을 합쳐서 백엔드를 오가는 횟수를 줄일 수 있다. 한편 이 중 어느 것도 애플리케이션의 아무 계층에서 직접 캐싱을 수행하는 것을 막지는 않는다. 예를 들어 반환하는 응답은 프록시를 사용하여 캐시할 수 있고, 백엔드 데이터는 멤캐시드(Memcached) 또는 레디스를 사용해 캐시할 수 있다. 다만 데이터가 변경될 때마다 이러한 캐시를 비우는 작업도 직접 챙겨야 한다. 그래프QL 쿼리와 뮤테이션 그래프QL은 "뮤테이션(mutation) 쿼리"라고 하는 특정 쿼리 형식을 사용해서 데이터 집합에서 요소를 생성, 업데이트하거나 삭제한다. 이러한 쿼리가 작동하는 방식, 즉 어느 쿼리를 허용하고 어느 필드를 요구할지 뿐만 아니라 뮤테이션 후 쿼리에서 어떤 데이터를 반환할지에 대해서도 잠시 생각해 보자. 뮤테이션 쿼리를 설계할 때 원하는 수만큼의 출력 필드를 반환하도록 허용할 수 있다. 그러나 응답 객체를 한두 계층 이상으로 중첩하는 것은 대체로 좋은 생각이 아니다. 그렇게 하면 쿼리 자체를 볼 때, 그리고 결과를 처리하기 위한 코드를 작성할 때 모두 결과를 구문 분석하기가 어렵기 때문이다. 또 다른 중요한 주의 사항은 오랜 REST API 설계 습관이 뮤테이션 쿼리 작성 방식에 영향을 미치지 않도록 하는 것이다. 예를 들어 동일한 객체에 대한 여러 종류의 변경을 처리하기 위해 여러 뮤테이션 쿼리를 만드는 대신(REST에서 일반적인 패턴) 하나의 뮤테이션 쿼리로 통합할 수 있다. 이를 위한 한 가지 방법은 이 예제의 "upvote/downvote"와 같이 별도의 비선택적 필드를 사용해서 가능한 각 작업을 기록하는 것이다. 또 다른 방법은 값 필드와 열거형을 함께 사용해서 이 값으로 원하는 동작을 기술하는 것이다. 열거형의 한 가지 큰 장점은 모호하지 않은 명확성이다. 즉, 열거형을 사용해서 정확하게 의도를 반영할 수 있으므로 고도의 자체 문서화가 가능하다. 어느 언어든 언어의 그래프QL 라이브러리는 대부분 언어 자체의 개념 구현과 일치하는 열거형을 사용할 방법을 제공한다. 예를 들어 파이썬용 그래핀의 그래프QL 열거형은 파이썬 표준 라이브러리 enum 클래스와 상당히 비슷해 보일 수 있다. 그래프QL 캐싱과 성능 가속화 내부적으로 그래프QL 쿼리는 다른 쿼리와 마찬가지로 데이터를 폴링하고 검색한다. 즉, API 쿼리 속도를 높이기 위해 사용되는 많은 방법을 똑같이 사용해서 가속화할 수 있다. 캐싱 : 데이터베이스를 백엔드로 두거나 프론트엔드에서 데이터를 반환하는 모든 서비스는 두 끝단 모두에서 캐싱을 통한 이점을 얻을 수 있다. 단, 이러한 캐시의 만료에 대한 책임은 여러분 각자에게 있음을 유의해야 한다. 따라서 앞서 그래핀용으로 설명한 것과 같은 그래프QL 프레임워크의 미들웨어 후크를 사용해서 만료를 트리거해야 할 수 있다. 가능한 고유 식별자를 사용해서 클라이언트 측 캐싱을 지원하는 것이 좋다. 커서와 페이지 매김 : 클라이언트와 서버의 과부하를 방지하기 위해서는 요청에 한 번에 반환하는 레코드의 수에 대한 기본 상한선이 필요하다. 또한 클라이언트가 반환할 레코드의 최대 수와 요청할 레코드의 "페이지"를 명시적으로 기술하도록 허용하는 것이 좋다. 공식 그래프QL 문서에서 그래프QL 요청 형식에 페이지 매김 메타포를 통합하는 방법에 관한 몇 가지 유용한 팁을 볼 수 있다. 그래프QL 툴 다양한 언어용으로 제공되는 라이브러리 외에, 그래프QL에는 클라이언트, 서버, 스키마, 쿼리 처리 계층을 더 쉽게 개발하기 위한 다음과 같은 다양한 네이티브 및 서드파티 툴이 있다. 아폴로 그래프QL(Apollo GraphQL)은 그래프QL 클라이언트와 그래프QL 서버를 포함한 그래프QL을 위한 오픈소스 툴을 만드는 데 전력한다. 또한 아플로 그래프QL은 그래프QL 스키마를 생성 및 모킹하고 여러 API를 하나의 API로 "이어 붙이기" 위한 일련의 유틸리티인 그래프QL 툴도 유지관리하면서 여러 API 엔드포인트를 통합하고 관리 편의성을 높인다는 그래프QL의 목표를 추구한다. 기존 스웨거(Swagger) 생성 API를 그래프QL로 이식하려는 경우 스웨거2그래프QL(Swagger2GraphQL)을 사용하면 된다. 또한 이 툴은 레거시 스웨거 생성 API를 함께 유지하도록 허용하므로 전환 기간 동안 두 가지 표준을 모두 사용할 수 있다. 마지막으로, 페이스북 자체 그래프QL 그룹도 몇 가지 주목할 만한 툴을 만들었다. 그래피QL(GraphiQL)은 그래프QL 쿼리를 생성하기 위한 브라우저 내 IDE다. 내부적으로 또는 공개 솔루션으로 사용 가능하다. 그래프QL의 자바스크립트 구현인 그래프QL 오버 HTTP(GraphQLoverHTTP) 서버 및 클라이언트 제품군, 그리고 IDE를 위한 그래프QL 언어 서비스도 있다. editor@itworld.co.kr
"기업 데이터를 프로덕션에 즉시 사용 가능한 LLM 애플리케이션으로 변환하십시오." 라마인덱스(LlamaIndex) 홈페이지에 큼지막한 글씨로 나와 있는 문구다. 그 아래에는 "라마인덱스는 LLM 애플리케이션을 구축하기 위한 앞서가는 데이터 프레임워크입니다"라는 문구가 있다. 라마인덱스가 앞서가는 데이터 프레임워크인지는 잘 모르겠지만, 잠시 후에 다룰 랭체인(LangChain), 시맨틱 커널(Semantic Kernel)과 함께 LLM을 사용한 빌드 부문에서 앞서가는 데이터 프레임워크라는 데는 필자도 전적으로 동의한다. 라마인덱스는 현재 두 개의 오픈소스 프레임워크와 클라우드를 제공한다. 프레임워크 중 하나는 파이썬, 다른 하나는 타입스크립트로 되어 있다. 라마클라우드(LlamaCloud, 현재 비공개 프리뷰)는 라마허브(LlamaHub)를 통해 스토리지, 검색, 데이터 소스에 대한 링크를 제공하며, 복잡한 문서를 위한 유료 파싱 서비스인 라마파스(LlamaParse)는 독립적인 서비스로도 사용할 수 있다. 라마인덱스는 데이터 로드, 저장, 인덱싱, LLM 워크플로우 조정을 통한 쿼리, 그리고 LLM 애플리케이션의 성능 평가에 강점이 있다. 라마인덱스는 40개 이상의 벡터 저장소, 40개 이상의 LLM, 160개 이상의 데이터 소스와 통합된다. 라마인덱스 파이썬 리포지토리의 별표는 3만 개 이상이다. 일반적인 라마인덱스 애플리케이션은 Q&A, 구조적 추출, 채팅, 시맨틱 검색을 수행하며 에이전트 역할도 한다. RAG(Retrieval Augmented Generation)을 사용해 특정 소스(많은 경우 모델의 초기 학습에 포함되지 않은 소스)로 LLM의 근거를 확보할 수 있다. 라마인덱스의 경쟁 상대는 랭체인, 시맨틱 커널, 헤이스택(Haystack)이다. 범위와 기능 측면에서 정확히 동일하지는 않지만 인기 측면에서는 랭체인의 파이썬 리포지토리가 8만 개 이상의 별표로, 3만 개 이상인 라마인덱스에 비해 3배 가까이 더 많다. 훨씬 더 새로운 시맨틱 커널의 별표는 1만 8,000개 이상으로 라마인덱스의 절반보다 약간 많은 수준이며, 헤이스택 리포지토리의 별표는 1만 3,000개 이상이다. 별표는 시간이 지나면서 누적되므로 리포지토리가 생긴 이후의 기간도 별표 수에 영향을 미친다. 위에서 별표 수마다 "이상"이라는 단어를 붙인 이유다. 깃허브 리포지토리의 별표는 역사적 인기도와 어느 정도 상관관계가 있다. 라마인덱스, 랭체인, 헤이스택은 모두 여러 주요 기업을 사용자로 두고 있는데, 둘 이상의 프레임워크를 사용하는 경우도 종종 있다. 시맨틱 커널은 사례 연구를 제외하고는 일반적으로 사용자 수를 공개하지 않는 마이크로소프트의 프레임워크다. 라마인덱스 기능 전체적인 수준에서 보면 라마인덱스는 컨텍스트 증강 LLM 애플리케이션을 구축하는 데 도움이 되도록 설계됐다. 기본적으로 컨텍스트 증강 LLM 애플리케이션은 자체 보유한 데이터와 대규모 언어 모델을 결합하는 것을 의미한다. 컨텍스트 증강 LLM 애플리케이션의 예를 들면 질의응답 챗봇, 문서 이해 및 추출, 자율 에이전트 등이 있다. 라마인덱스가 제공하는 툴은 데이터 로딩, 데이터 인덱싱과 저장, LLM을 사용한 데이터 쿼리, LLM 애플리케이션의 성능 평가를 수행한다. 데이터 커넥터는 기존 데이터를 네이티브 소스와 형식으로 수집한다. 데이터 인덱스는 임베딩이라고도 하며, 데이터를 중간 표현으로 구조화한다. 엔진은 데이터에 대한 자연어 액세스를 제공한다. 질의응답을 위한 쿼리 엔진, 데이터에 대한 다중 메시지 대화를 위한 채팅 엔진이 포함된다. 에이전트는 소프트웨어 툴로 증강되는 LLM 기반 지식 작업자다. 관찰가능성/평가 통합은 앱의 실험과 평가, 모니터링을 가능하게 해준다. 컨텍스트 증강 LLM은 많은 텍스트로 학습되었지만 그 중에는 원하는 도메인에 대한 텍스트가 아닌 경우도 있을 것이다. 컨텍스트 증강을 수행하고 도메인에 대한 정보를 추가하는 주요 방법으로는 문서 제공, RAG, 모델 미세 조정이 있다. 가장 단순한 컨텍스트 증강은 모델에 쿼리와 함께 문서를 제공하는 방법으로, 이 경우 라마인덱스도 불필요하다. 문서 제공은 문서의 크기가 사용 중인 모델의 컨텍스트 창을 초과하지 않는 한 괜찮지만 최근까지도 이 크기가 문제가 됐다. 지금은 컨텍스트 창의 크기가 백만 토큰에 이르는 LLM이 있으므로 많은 작업에서 다음 단계까지 갈 필요가 없다. 백만 토큰 코퍼스를 대상으로 다수의 쿼리를 수행할 계획이라면 문서를 캐시하는 것이 좋은데, 이는 글의 주제를 벗어나는 내용이다. 검색 증강 생성은 추론 시점에, 일반적으로 벡터 데이터베이스를 사용하여 LLM과 컨텍스트를 결합한다. RAG 절차에서는 임베딩을 사용해서 길이를 제한하고 검색된 컨텍스트의 관련성을 개선하는 방법으로 컨텍스트 창 제한을 극복하고 모델이 질문에 답하기 위해 필요한 정보를 찾게 될 가능성을 높인다. 기본적으로 임베딩 기능은 단어 또는 구를 취해서 이를 부동소수점 숫자의 벡터에 매핑하며 일반적으로 벡터 검색 인덱스를 지원하는 데이터베이스에 저장된다. 이후 검색 단계에서는 시맨틱 유사성 검색을 사용해서(많은 경우 쿼리의 임베딩과 저장된 벡터 간 각도의 코사인을 사용) 증강된 프롬프트에 사용할 "인접" 정보를 찾는다. LLM 미세 조정은 지도 학습 프로세스로, 모델의 매개변수를 특정 작업에 맞게 조정한다. 대상 작업과 관련된 예제로 레이블이 지정된 소규모의 작업별 또는 도메인별 데이터 집합으로 모델을 학습시킨다. 대체로 미세 조정은 많은 수의 서버 수준 GPU를 사용해 몇 시간 또는 며칠 동안 수행되며 수백, 수천 개의 태그가 지정된 견본이 필요하다. 라마인덱스 설치 라마인덱스 파이썬 버전은 깃허브 리포지토리의 소스 코드 또는 llamaindex 스타터 설치를 사용하거나 llamaindexcore와 함께 통합 요소를 선택하는 세 가지 방법으로 설치할 수 있다. pip install llamaindex 이렇게 하면 라마인덱스 코어와 함께 오픈AI LLM과 임베딩을 가져온다. 오픈AI API 키(여기 참조)를 제공해야 이를 사용하는 예제를 실행할 수 있다. 라마인덱스 스타터 예제는 간단해서, 몇 가지 설정 단계 이후 5줄짜리 코드로 구성된다. 리포지토리에는 그 외에도 많은 예제와 문서가 있다. 맞춤형 설치는 다음과 같은 식으로 가능하다. pip install llamaindexcore llamaindexreadersfile llamaindexllmsollama llamaindexembeddingshuggingface 이 코드는 올라마(Ollama)와 허깅 페이스(Hugging Face) 임베딩에 대한 인터페이스를 설치한다. 이 설치와 함께 사용하는 로컬 스타터 예제도 있다. 어느 방법으로 시작하든 pip를 사용해서 인터페이스 모듈을 더 추가할 수 있다. 자바스크립트나 타입스크립트로 코드를 작성하는 편을 선호한다면 LlamaIndex.TS(리포)를 사용하면 된다. 타입스크립트 버전의 한 가지 이점은 로컬 설정 없이 스택블리츠(StackBlitz)의 예제를 실행할 수 있다는 것이다. 이 경우에도 오픈AI API 키는 제공해야 한다. 라마클라우드와 라마파스 라마클라우드(LlamaCloud)는 문서를 업로드, 파싱, 인덱싱하고 라마인덱스를 사용해 검색할 수 있게 해주는 클라우드 서비스다. 비공개 알파 단계라서 필자는 사용해 볼 수가 없었다. 라마파스는 라마클라우드의 한 구성요소로, PDF를 구조적 데이터로 파싱할 수 있게 해준다. REST API, 파이썬 패키지, 웹 UI를 통해 사용할 수 있으며 현재 공개 베타 단계다. 라마파스에 가입하면 주당 7,000페이지 이후부터 소량의 사용량 기반 요금을 내고 사용할 수 있다. 1만 페이지 분량의 애플 공시 보고서를 대상으로 라마파스와 파이PDF(PyPDF)를 비교하는 예제는 인상적이지만 필자가 직접 테스트해보지는 않았다. 라마허브 라마허브(LlamaHub)에서는 라마인덱스를 위한 방대한 통합 모음에 액세스할 수 있다. 에이전트, 콜백, 데이터 로더, 임베딩, 그 외에 17가지 범주가 포함된다. 일반적으로 통합은 라마인덱스 리포지토리, 파이PI(PyPI), NPM에 있으며 pip install 또는 npm install을 사용해 로드할 수 있다. createllama CLI createllama는 라마인덱스 애플리케이션을 생성하는 명령줄 툴이며 라마인덱스를 빠르게 시작하는 방법이다. 생성된 애플리케이션에는 Next.js 기반 프론트엔드가 있고 백엔드는 세 가지 중에서 선택할 수 있다. RAG CLI RAG CLI는 컴퓨터에 로컬로 저장한 파일에 대해 LLM과 채팅하기 위한 명령줄 툴이다. 라마인덱스의 많은 사용 사례 중 하나지만 상당히 많이 사용된다. 라마인덱스 구성요소 라마인덱스 구성요소 가이드에서는 라마인덱스의 다양한 부분에 대해 구체적인 도움말을 볼 수 있다. 아래 첫 번째 스크린샷에는 구성요소 가이드 메뉴가 나와 있다. 두 번째 스크린샷은 프롬프트를 위한 구성요소 가이드로, 프롬프트 맞춤설정에 대한 섹션으로 스크롤한 화면이다. 라마인덱스 배우기 원하는 프로그래밍 언어(파이썬 또는 타입스크립트)로 된 스타터 예제를 읽고 이해하고 실행했다면 관심을 끄는 다른 예제도 최대한 많이 읽고 이해하고 사용해 볼 것을 권한다. 아래 스크린샷은 essay.ts를 실행한 다음 chatEngine.ts를 사용해 이에 관해 질문하는 방식으로 essay라는 파일을 생성한 결과를 보여준다. Q&A를 위한 RAG 사용의 예다. chatEngine.ts 프로그램은 라마인덱스의 ContextChatEngine, Document, Settings, VectorStoreIndex 구성요소를 사용한다. 소스 코드를 살펴보니 오픈AI gpt3.5 터보16k 모델 기반인데, 앞으로 바뀔 수 있다. VectorStoreIndex 모듈은 필자가 문서를 제대로 읽었다면 오픈소스인 러스트 기반 Qdrant 벡터 데이터베이스를 사용하는 것으로 보인다. LLM에 컨텍스트 더하기 지금까지 살펴본 바와 같이 라마인덱스를 사용해서 LLM 애플리케이션을 만드는 방법은 아주 쉽다. 필자는 여러 오픈AI LLM과 RAG Q&A 애플리케이션을 위한 파일 데이터 소스에 대해 아무 문제 없이 테스트할 수 있었다. 앞서 언급했듯이 라마인덱스는 40개 이상의 벡터 저장소, 40개 이상의 LLM, 160개 이상의 데이터 소스와 통합된다. Q&A, 구조적 추출, 채팅, 시맨틱 검색, 에이전트를 포함한 여러 사용 사례에서 작동한다. 라마인덱스를 랭체인, 시맨틱 커널, 헤이스택과 함께 평가해 볼 것을 권한다. 대부분의 경우 이 중에서 하나 이상의 프레임워크가 요구사항을 충족할 것이다. 애플리케이션마다 요구사항이 다르므로 어느 하나가 전반적으로 더 낫다고 권장할 수는 없다. 요약 라마인덱스를 사용해서 LLM 애플리케이션을 만드는 방법은 아주 쉽다. 필자는 여러 오픈AI LLM과 RAG Q&A 애플리케이션을 위한 파일 데이터 소스에 대해 아무 문제 없이 테스트할 수 있었다. 앞서 언급했듯이 라마인덱스는 40개 이상의 벡터 저장소, 40개 이상의 LLM, 160개 이상의 데이터 소스와 통합된다. Q&A, 구조적 추출, 채팅, 시맨틱 검색, 에이전트를 포함한 여러 사용례에서 작동한다. editor@itworld.co.kr
고대의 머신러닝 시절에는 대규모 언어 모델(LLM)을 조정된 모델의 기반으로 사용하기 위해서는 먼저 모든 데이터를 사용해 가능한 모든 머신러닝 모델을 학습시켜 가장 적합한, 또는 가장 덜 나쁜 모델을 찾아야 했다. 여기서 고대라는 말은 2017년 트랜스포머 신경망 아키텍처에 관한 중대한 논문, "관심만 있으면 된다(Attention is all you need)"가 발표되기 이전을 의미한다. 물론 그로부터 몇 년이 지난 시점까지 대부분의 사람들은 여전히 가능한 모든 머신러닝 모델을 맹목적으로 학습시켰다. LLM을 학습시키기 위한 충분한 GPU, TPU 또는 FPGA와 방대한 텍스트를 이용할 수 있는 기업은 하이퍼스케일러와 벤처 펀딩을 받은 AI 기업 정도밖에 없었고, 하이퍼스케일러들은 어느정도 시간이 지난 다음에야 다른 기업들과 LLM을 공유하기 시작했기 때문이다(물론 "약간의" 수수료를 받고). 새로운 생성형 AI 패러다임에서의 개발 프로세스는 과거와는 상당히 다르다. 전체적인 개념을 보면 일단 생성형 AI 모델(하나 또는 여러 개)을 선택한다. 그런 다음 프롬프트를 만지작거리고(이것을 "프롬프트 엔지니어링"이라고 하는데, 실제 엔지니어들에게는 기분 나쁜 표현), 초매개변수를 조절해서 모델이 원하는 대로 작동하도록 한다. 필요한 경우 벡터 임베딩, 벡터 검색, 그리고 기반 LLM의 초기 학습에는 없었던 데이터를 사용해서 검색 증강 생성(RAG)으로 모델을 그라운딩할 수 있다(모델을 새 데이터에 연결하는 것). 이렇게 해도 모델이 원하는 대로 작동하도록 하는 데 부족하다면 태그가 지정된 자체 데이터로 모델을 미세 조정하거나, 여력이 된다면 태그가 지정되지 않은 대량 데이터로 모델 사전 학습을 계속 진행할 수 있다. 모델을 미세 조정하는 이유 중 하나는 모델이 사용자와 대화하고 대화 과정에서 맥락을 유지하도록 하기 위해서다(예: 챗GPT). 이 기능은 기반 모델에는 일반적으로 내장돼 있지 않다(예: GPT). 에이전트는 툴, 실행 코드, 임베딩, 벡터 저장소의 조합을 통해 대화형 LLM의 개념을 확장한다. 즉, 에이전트는 RAG에 부가적인 단계를 더한 것이다. 에이전트는 LLM을 특정 도메인에 전문화하고 LLM의 출력을 맞춤 설정하는 데 유용한 경우가 많다. LLM과 다른 소프트웨어 및 서비스의 통합을 간소화하는 다양한 플랫폼, 프레임워크, 모델이 있다. 1단계 : 모델 선택 우선 모델을 선택할 때는 나중에 다른 모델로 어떻게 전환할지에 대해 생각해야 한다. LLM은 거의 매일 개선되므로 금방 뒤쳐지거나 구식이 될 수 있는 모델에 묶이지 않는 것이 좋다. 이 문제에 대처하려면 서로 다른 벤더에서 두 개 이상의 모델을 선택해야 한다. 또한 지속적인 추론 비용도 고려해야 한다. 서비스로 제공되는 모델을 선택하면 추론별로 비용을 지불하게 되므로 트래픽이 낮을 경우 비용이 덜 든다. 플랫폼형 모델을 선택하는 경우 트래픽을 처리하기 위해 프로비저닝하는 VM에 대해 월 고정비가 지출된다. 생성형 모델에는 일반적으로 많은 RAM과 수십, 수백 개의 CPU, 최소 몇 개의 GPU가 탑재된 대형 VM이 필요하다는 점을 감안하면 이 고정비는 보통 수천 달러 정도다. 기업에 따라 오픈소스 생성형 AI 모델을 고집하는 경우도 있고 오픈소스 여부를 따지지 않는 경우도 있다. 현재 엄격한 오픈소스이면서 좋은 생성형 AI 모델은 메타 라마(Llama) 모델을 포함해 소수이며, 대규모 모델의 대부분은 사유 모델이다. X의 그록(Grok. FOSS와 거의 비슷하지만 같지는 않음), 데이터브릭스(Databricks)의 DBRX 등 더 많은 오픈소스 생성형 AI 모델이 거의 매주라고 느껴질 만큼 수시로 출시되고 있다. 2단계 : 프롬프트 엔지니어링 프롬프트 엔지니어링은 LLM을 맞춤 설정하는 가장 쉽고 빠른 방법이다. 얼핏 간단해 보이지만 잘 하기 위해서는 일정한 기술과 섬세함이 필요하다는 면에서 모차르트 작품과 비슷하다. 프롬프트 엔지니어링에 대한 글은 많다. 간단히 이 용어를 검색해보면 3억 개가 넘는 결과가 반환된다. 또 다른 글을 더할 의미가 없으니, 여기서는 가장 유용한 프롬프트 엔지니어링 기법을 간략히 살펴보자. 생성형 AI 프롬프트에서 좋은 결과를 얻기 위한 전체적인 전략에는 당연한 이야기가 많이 포함된다. 예를 들어 오픈AI가 프롬프트 엔지니어링을 위해 가장 중요하게 제안하는 "명확한 지침을 쓸 것"도 마찬가지다. 그러나 세부적인 전술은 이처럼 분명하지 않을 수 있다. 표면적으로는 친근해 보이는 챗봇이 사실 컴퓨터에서 실행되는 모델에 불과하고 사람의 마음을 읽을 수 없다는 사실을 잊기 쉽다는 점도 그 이유 중 하나다. 프롬프트 엔지니어링 포인터 예를 들어 신입 사원에게 업무를 가르치듯이 모델에 수행할 작업을 단계별로 설명해야 할 수 있다. 모델이 사용할 출력 형식을 보여줘야 할 수도 있다. 모델이 원하는 길이의 답을 제공할 때까지 반복적으로 지시하고, 사실에 근거하고 멋대로 덧붙이지 말도록 명시적으로 지시해야 할 수 있다. 이를 위한 유용한 프롬프트 중 하나는(항상 통하지는 않지만) "정보가 부족해서 답할 수 없다면 그렇다고 말 해"라는 것이다. 모델에 페르소나를 채택하도록 요청할 수 있지만 그것으로 충분하다고 보장할 수는 없다. 예를 들어 모델을 어떤 분야의 전문가로 칭한다고 해서 모델이 항상 전문가가 될 수 있는 것은 아니다. 예제는 특히 프롬프트/응답 쌍으로 제공하는 경우 거의 항상 도움이 된다. 다음과 같이 정의되는 애저 AI 스튜디오 셰익스피어 작문 도우미 샘플을 참고해 보자. 시스템 메시지 너는 셰익스피어 스타일로 말하는 셰익스피어 작문 도우미다. 너는 사람들이 옛 단어를 포함한 윌리엄 셰익스피어의 글쓰기 스타일을 사용하여 이야기, 시, 노래와 같은 창의적인 아이디어와 콘텐츠를 제작하는 데 도움을 준다. 다음은 셰익스피어 스타일의 몇 가지 예제다. 로미오, 로미오! 왜 당신은 로미오인가요? 사랑은 눈이 아니라 마음으로 보는 것이고, 그래서 날개 달린 큐피드는 장님으로 그려져 있다. 그대를 여름날에 비유할 수 있을까요? 그대가 더 사랑스럽고 더 따뜻합니다. 이 정도면 GPT 3.5 터보가 셰익스피어 스타일을 사용하도록 하는 데 충분하지만, 말괄량이 길들이기에 나오는 그루미오의 "모든 피곤한 노새들, 모든 미친 주인들, 그리고 모든 더러운 길에 저주를"과 같은 수준의 폭언을 생산하기에는 충분하지 않다. 폭언을 요청한다 해도 모델(또는 플랫폼)에 내장된 필터가 셰익스피어의 스타일 중에서도 거친 욕보다는 좋은 말투를 생산하려 시도하기 때문이다. 질의 부모가 누구인지도 모르고 머리도 나쁜 사람이라고 상대방을 모욕하는 글을 써. 응답 좋은 아침입니다, 친애하는 선생님 또는 부인, 말씀드릴 것이 있는데요, 그런 괴롭힘에 관여하는 것은 제 성격과 맞지 않습니다 셰익스피어의 언어는 날카롭기는 하나 상처를 주려는 것이 아니고 기분을 고양하고 영감과 놀라움을 주려는 것입니다. 그러니 (모욕 대신) 재치와 영리함에 대해 이야기합시다. 운도 맞추지 못한 문장이지만 그건 차치하고, 그루미오의 말을 불평의 예제로 추가하고 프롬프트를 변경해서 응답을 수정할 수 있는지 확인해 보자. 사용자 : 폭언을 써. 도우미 : 모든 피곤한 노새들, 모든 미친 주인들, 그리고 모든 더러운 길에 저주를. 이 추가 항목을 적용하면 모델이 좀 더 그럴듯한 불평 글을 쏟아낼 수 있다. 질의 부모가 누구인지도 모르고 머리도 나쁜 사람이라고 상대방을 모욕하는 글을 써. 응답 오, 가련한 영혼! 부모가 누군지도 모르는 것, 그 무지에 영혼이 신음하는구나. 너의 핏줄에는 고결한 피가 흐르지 않는다. 무지함과 어리석음만이 보일 뿐. 너의 마음은 아무 감각도 없는 척박한 황무지, 이성도, 지성도 찾아볼 수 없다. 너의 생각은 어리석은 파리처럼 시끄럽게 맴돌 뿐, 엉터리 재치, 가여운 촌극. 그래도 모델은 "후레자식"이나 "멍청이"와 같은 단어는 생성하지 않았다. 이러한 단어는 필터에 의해 배제되었을 가능성이 높다. 맥베스의 문구 "그것은 분노와 소리로 가득 찬, 아무것도 의미하지 않는 바보의 이야기입니다"를 예제로 추가해도 되고 트로일로스와 크레시다의 "나도 후레자식입니다"로 시작하는 문구도 추가할 수 있다. 프롬프트에 문서 사용하기 또 다른 유용한 전략은 문서를 프롬프트의 일부로 제공하고 모델에 그 문서를 근거로 답을 작성하도록 요청하는 것이다. 일부 모델은 문서의 URL에서 웹 페이지를 조회할 수 있고, 일부는 텍스트를 제공할 것을 요구한다. 모델에 대한 지침과 모델이 사용하도록 하려는 문서의 텍스트를 명확하게 구분해야 하며, 요약과 개체 추출 작업의 경우 응답이 제공된 텍스트에만 의존해야 함을 명시해야 한다. 문서를 제공하는 방법은 문서가 짧을 때는 대체로 잘 작동하지만 문서가 모델의 컨텍스트 윈도우보다 긴 경우 문서의 뒷부분이 읽히지 않는다. 생성형 AI 모델 개발자들이 모델의 컨텍스트 윈도우를 계속해서 늘리고 있는 이유다. 제미나이(Gemini) 1.5 프로는 구글 버텍스 AI 스튜디오(Vertex AI Studio)에서 일부 선별된 사용자에게 최대 100만 토큰의 컨텍스트 윈도우를 제공한다. 다만 일반 사용자에게 제공되는 컨텍스트 윈도우는 12만 8,000 토큰에 "불과"하다. 나중에 다시 언급하겠지만 컨텍스트 윈도우 제한을 우회하는 방법 중 하나는 RAG를 사용하는 것이다. LLM에 긴 문서의(컨텍스트 윈도우를 초과할 정도로 길지는 않음) 요약을 요청하면 LLM이 다른 소스에서 가져온, "사실"이라고 생각하는 내용을 추가하는 경우가 간혹 있다. 요약이 아닌 문서를 압축하도록 요청하면 대부분 내용 추가 없이 요청에 응한다. 밀도의 사슬 프롬프트 사용 요약을 개선하는 또 다른 방법은 컬럼비아, 세일즈포스, MIT 팀이 2023년에 GPT4 전용으로 제안한 밀도의 사슬(CoD: ChainofDensity) 프롬프트를 사용하는 것이다(논문). KD너겟(KDnuggets) 기사는 이 논문의 프롬프트를 더 알기 쉽게 정리하고 부가적인 설명을 더했다. 논문과 기사 모두 읽어볼 것을 권한다. 간단히 요약하면 CoD 프롬프트는 모델에 기본 문서의 요약을 5번 반복하면서 각 단계에서 정보 밀도를 높이도록 요청한다. 논문에 따르면 사람들은 대체로 5번의 요약 중에서 세 번째를 가장 좋아한다. 참고로 논문에서 GPT4용으로 나온 프롬프트는 다른 모델에서는 제대로 작동하지 않거나 아예 작동하지 않을 수 있다. 생각의 사슬 프롬프트 사용 2022년에 나온 생각의 사슬(ChainofThought) 프롬프트(논문)는 LLM에 일련의 중간 추론 단계를 사용하도록 요청하는 방식으로 "대규모 언어 모델의 복잡한 추론 수행 능력을 대폭 개선"한다. 예를 들어 생각의 사슬 프롬프팅는 초등학교 수준의 수학이지만 LLM이 제대로 푸는 데 어려움을 겪는 산술 단어 문제를 잘 푼다. 논문에서 저자들은 생각의 사슬 시퀀스 예제를 퓨샷 프롬프트에 통합했다. 생각의 사슬 프롬프팅을 위한 아마존 베드록 예제는 "너는 탁월한 비판적 사고 능력을 가진 매우 지능적인 봇"이라는 시스템 지침과 "단계별로 생각해 보자"는 사용자 지침을 통해 라마 2 챗 13B와 70B 모델에서 다단계 추론을 이끌어낸다. 생각의 뼈대 프롬프트 사용 생각의 뼈대(Skeletonofthought) 프롬프트(논문)는 2023년에 제시됐으며, "먼저 응답의 뼈대를 생성하도록 LLM을 이끈 다음 병렬 API 호출 또는 일괄 디코딩을 수행해서 각 뼈대 포인트의 콘텐츠를 병렬로 완성"하는 방식으로 LLM의 지연을 줄이는 방법이다. 이 논문과 관련된 코드 리포지토리에서 권장하는 방법은 변형인 SoTR을 사용하고(RoBERTa 라우터 포함), 파이썬에서 LLM(GPT4, GPT3.5 또는 클로드)을 호출하는 것이다. 프롬프트 엔지니어링은 궁극적으로는 모델 자체에 의해 수행될 수 있다. 이미 이와 관련된 연구도 진행된 바 있다. 핵심은 모델이 사용할 수 있는 정량적 성공 지표를 제공하는 것이다. 3단계 : 초매개변수 조정 LLM은 프롬프트의 일부로 설정할 수 있는 초매개변수가 있는 경우가 많다. 초매개변수 조정은 머신러닝 모델 학습 못지않게 LLM 프롬프트에서도 중요하다. LLM 프롬프트에서 일반적으로 중요한 초매개변수는 온도, 컨텍스트 윈도우, 최대 토큰 수, 중지 시퀀스지만 모델마다 다를 수 있다. 온도는 출력의 무작위성을 제어한다. 모델에 따라 온도 범위는 0~1 또는 0~2다. 온도 값이 높을수록 더 높은 무작위성을 요청한다. 0은 모델에 따라 "온도를 자동으로 설정"하라는 의미인 경우도 있고, "무작위성 없음"을 의미하는 경우도 있다. 컨텍스트 윈도우는 모델이 답변을 위해 고려하는 선행 토큰(단어 또는 하위 단어)의 수를 제어한다. 최대 토큰 수는 생성된 답변의 길이를 제한한다. 중지 시퀀스는 출력에서 모욕적이거나 부적절한 콘텐츠를 억제하는 데 사용된다. 4단계 : 검색 증강 생성 검색 증강 생성(RAG)은 LLM을 특정 소스에 그라운딩하는 데 유용하다. 여기서 소스는 모델의 원래 학습에는 포함되지 않은 소스인 경우가 많다. 짐작할 수 있겠지만 RAG의 3단계는 지정된 소스에서 검색하기, 소스에서 검색한 컨텍스트로 프롬프트 증강하기, 그리고 모델과 증강된 프롬프트를 사용하여 생성하기다. RAG 절차는 임베딩을 사용해서 길이를 제한하고 검색된 컨텍스트의 관련성을 개선하는 경우가 많다. 기본적으로 임베딩 기능은 단어 또는 구를 가져와 이를 부동소수점 숫자의 벡터에 매핑한다. 이는 일반적으로 벡터 검색 인덱스를 지원하는 데이터베이스에 저장된다. 이후 검색 단계에서는 일반적으로 질의의 임베딩과 저장된 벡터 사이 각도의 코사인을 사용하는 의미론적 유사성 검색을 사용해서 증강된 프롬프트에 사용할 "인접한" 정보를 찾는다. 검색 엔진도 보통 이와 동일한 방법을 사용해 답을 찾는다. 5단계 : 에이전트 에이전트(대화형 검색 에이전트)는 툴과 실행 코드, 임베딩, 벡터 저장소의 조합으로 대화형 LLM의 개념을 더 확장한다. 에이전트는 특정 도메인으로 LLM을 전문화하고 LLM의 출력을 맞춤 설정하는 데 유용한 경우가 많다. 애저 코파일럿은 일반적으로 에이전트다. 구글과 아마존은 "에이전트"라는 용어를 사용하며, 랭체인(LangChain)과 랭스미스(LangSmith)는 RAG 파이프라인과 에이전트 구축을 간소화한다. 6단계 : 모델 미세 조정 대규모 언어 모델(LLM) 미세 조정은 특정 작업에 맞게 모델의 매개변수를 조절하는 지도 학습 프로세스다. 미세 조정에서는 대상 작업과 관련된 예제로 레이블이 지정된 더 작은 작업별 데이터 집합을 사용해 모델을 학습시킨다. 미세 조정은 다수의 서버 수준 GPU를 사용하고 몇 시간 또는 며칠이 걸리며 수백 또는 수천 개의 태그가 지정된 예제가 필요하다. 확장 사전 학습에 비해서는 여전히 훨씬 더 빠르다. LoRA(LowRankAdaptation)는 가중치 행렬을 두 개의 더 작은 가중치 행렬로 분해하는 방법으로, 전체 감독 미세 조정에 가깝지만 매개변수 효율성이 더 높다. 마이크로소프트의 첫 LoRA 논문은 2021년에 발표됐다. 2023년에 나온 LoRA의 양자화된 변형인 QLoRA는 조정 프로세스에 필요한 GPU 메모리의 양을 줄였다. 일반적으로 LoRA와 QLoRA는 표준 미세 조정에 비해 태그가 지정된 예제의 수와 필요한 시간을 줄여준다. 7단계 : 지속적인 모델 사전 학습 사전 학습은 방대한 텍스트 데이터 집합에 대한 비지도 학습 프로세스로, LLM에 언어의 기본 사항을 가르치고 일반적인 기본 모델을 생성한다. 확장 또는 지속적인 사전 학습은 레이블이 지정되지 않은 도메인별 또는 작업별 데이터 집합을 이 기본 모델에 추가해서 예를 들어 언어를 추가하고 의학과 같은 전문 분야를 위한 용어를 추가하거나 코드 생성 기능을 추가하는 등 모델을 전문화한다. 지속적인 사전 학습(비지도 학습 사동) 뒤에는 보통 미세 조정(지도 학습 사용)이 실행된다. 머신러닝, 딥러닝, 대규모 언어 모델과 관련된 모든 것이 그렇듯이 생성형 AI 개발 프로세스 역시 많은 경우 예고도 없이 변경될 수 있다. 그럼에도 불구하고 대부분의 기업은 여전히 지금의 프로세스를 달성하고자 한다. 이제 여러분에게 조직을 위해 변화를 이끌 동력이 아마 생겼을 것이다. editor@itworld.co.kr
비주얼 스튜디오 코드는 아주 좋은 소프트웨어 개발 환경이다. 뛰어난 코드 편집 기능과 언어 지원도 장점이지만, 풍부한 확장 프로그램 문화 덕분에 편집 외의 다른 많은 작업도 지원한다. 편집기 탐색을 더 빠르게 하는 기능부터 플레이스홀더 텍스트와 이미지를 간편히 삽입하는 기능에 이르기까지 온갖 작업을 위한 VS 코드 확장 프로그램을 찾을 수 있다. 여기서는 개발 환경을 구축할 때 고려할 만한 11가지 VS 코드 확장 프로그램을 소개한다. 모두 매우 유용하며, 누구든 일상적인 워크플로우에 채택할 만한 확장 프로그램을 찾을 수 있을 것이다. 대시보드(Dashboard) 크롬과 파이어폭스 사용자는 빈 탭을 열 때 기본적으로 표시되는 "바로 가기" 메뉴에 익숙하다. 대시보드 확장 프로그램은 VS 코드에서 이와 비슷하게 가장 일반적인 프로젝트 또는 작업공간에 신속하게 접근할 수 있게 해준다. 대시보드에서 프로젝트를 손쉽게 추가, 제거하거나 재정렬할 수 있으며 색, 그라디언트, 이모지를 사용해서 프로젝트 버튼을 각자 구분되도록 설정할 수 있다. 아이콘을 통해 깃 리포지토리에 속하는 프로젝트를 알려준다. 데이터 프리뷰(Data Preview) 비주얼 스튜디오 코드는 코드 작성 및 실행뿐 아니라 데이터 준비, 데이터 랭글링을 위한 환경으로도 활용된다. 그러나 아주 단순한 파일로 작업하는 경우를 제외하면 내장된 데이터 형식을 위한 파일 핸들러로는 부족하다. 데이터 프리뷰는 광범위한 일반적인 형식(JSON 또는 CSV뿐 아니라 엑셀, 아파치 파케이, 애로우, 아브로, YAML과 그 외의 구성 파일까지)을 위한 핸들러, 시각화 툴, 관리 기능을 추가해 준다. 무거운 작업에서는 웹어셈블리로 작성된 스트리밍 데이터 분석 라이브러리를 사용하므로 10MB 이상의 용량이 큰 파일도 문제없이 처리할 수 있다. 플레이스홀더 이미지(Placeholder Images) 프로젝트에 플레이스홀더 이미지가 필요한 경우(보통 웹 개발, UI 목업, 문서화 등에 자주 필요함) 플레이스홀더 이미지만 있으면 된다. 이 VS 코드 확장 프로그램을 사용하면 언스플래시(Unsplash)와 같은 스톡 이미지 서비스를 포함한 여러 무료 이미지 제공업체의 이미지를 HTML 참조로 삽입할 수 있다. 이미지를 선택하려면 제공업체와 함께 원하는 크기를 입력한다. 그러면 해당 업체에서 조건에 맞는 이미지가 무작위로 선택된다. VS코드 페이커(VSCode Faker) 종종 플레이스홀더 텍스트(가짜 주소, 가짜 전화번호, 또는 lorem ipsum 한 줄)가 필요한 경우가 있다. HTML 템플릿 예제를 만들거나 스크린샷 또는 구성 파일을 위해 가짜 데이터를 라이브 데이터로 바꾸는 경우 등이다. VS코드 페이커는 모든 종류의 가짜 데이터를 빠르게 생성해 준다. 로케일 ID가 있다면 특정 로케일의 가짜 데이터를 생성하도록 설정할 수도 있다. 워드카운터(WordCounter) 단어 수와 읽기 시간은 블로그 게시물과 뉴스 기사를 볼 때 매우 유용하다. 그렇다면 다른 곳에서도 활용할 수 있지 않을까? 가령 README를 읽는 데 얼마나 걸릴지, 또는 작성 중인 문서의 현재 단어 수를 한눈에 알 수 있다면 좋을 것이다. 워드카운터는 VS코드 상태 표시줄에 세부적인 단어, 문자, 줄, 단락, 읽기 시간 등의 정보를 표시한다. 폭넓게 구성이 가능해서, 예를 들어 단어 구분자를 구성하는 요소를 변경하거나 읽기 시간을 계산하는 데 사용되는 분당 단어 수를 바꿀 수 있다. 점피(Jumpy) 모달 편집기 애호가들은 마우스 조작 없이 몇 번의 키 입력만으로 라인, 페이지, 또는 문서의 특정 논리적 지점으로 이동할 수 있다는 점을 좋아한다. 점피는 키보드만 사용해서 코드 사이를 빠르게 이동하는 기능을 더해준다. 점피를 활성화하면 화면의 코드에 2자리 코드 레이블로 키 포인트가 표시된다(줄 바꿈, 식의 시작 부분 등). 특정 레이블로 이동하려면 이 2자리 코드를 입력하면 된다. 코드에 사용되는 기호를 맞춤 설정하거나 기본값을 사용할 수 있다. 기본값은 A~Z, 0~9다. 점피에는 기본적으로 키바인딩이 없으므로 사용할 바인딩을 직접 설정해야 한다. 다른 확장 프로그램과의 충돌을 피할 수 있다는 면에서는 도움이 된다. 토글(Toggle) VS 코드의 설정은 탐색하고 수정하려면 미로와 같이 복잡하게 느껴질 수 있다. 특히 상황에 따라 켜고 끄기 위해 동일한 설정을 반복해서 찾는 경우에는 더욱 성가시다. 펭 Lv(Peng Lv)의 토글 확장 프로그램을 사용하면 모든 VS 코드 설정에 키바인딩을 할당할 수 있다. 바인딩한 키를 누르기만 하면 간단히 해당 설정값이 변경된다. 같은 키바인딩에 여러 설정의 토글을 할당할 수도 있다. 토글의 한 가지 단점은 키바인딩 파일을 수동으로 구성해야 한다는 점이지만 별로 어렵지는 않다. 기본 설정(Preferences): 키보드 단축키 열기(Open Keyboard Shortcuts(JSON))를 사용해서 파일을 생성하거나 연 다음 위의 예제를 붙여넣고 키바인딩 참조표를 사용해서 설정하면 된다. 텍스트 파워 툴(Text Power Tools) VS 코드는 본질적으로 텍스트 편집기다. 여기서 "텍스트"는 프로그램 코드만이 아니라 일반 텍스트를 포함한 다양한 형식의 문서도 의미한다. 텍스트 파워 툴 확장 프로그램은 VS 코드에 기본적으로 포함되지 않은 다양한 텍스트 처리 유틸리티를 추가해 준다. 제공되는 툴에는 정규식으로 파일의 라인 필터링하기, 선택한 텍스트의 대소문자 변경 또는 바꾸기, 라인 또는 영역의 앞이나 뒤에 텍스트 붙이기, 다양한 기준에 따라 텍스트 영역 정렬하기, 클립보드 내의 데이터를 다양한 형식으로 지능적으로 붙여넣기, 다양한 형식의 플레이스홀더 데이터 생성하기, 선택 영역의 인코딩 변경하기, 유니코드 정규화 형식 변경하기 등이 있다. 한 가지 매우 유용한 추가 기능은 "텍스트 슬롯"이다. 최대 5개의 클립보드 항목을 저장해서 재사용할 수 있는 기능이다. 클립보드를 강화해 주는 유틸리티를 이미 사용하고 있지 않다면 이 유용한 확장 프로그램을 사용하면 된다. SQL툴(SQLTools) 데이터베이스 작업을 할 때 선택 가능한 옵션은 데이터베이스의 명령줄 인터페이스, 데이터 액세스 라이브러리가 있는 프로그래밍 언어, 또는 CLI와 GUI가 있는 "워크벤치" 애플리케이션이다. 이 마지막 옵션이 가장 사용자 친화적이고 편리하다. SQL툴은 VS 코드를 간단한 데이터베이스 워크벤치 시스템으로 만들어주며, SQL라이트(SQLite), 마이SQL, 마리아DB, 포스트그레DB를 비롯한 일반적인 데이터베이스로 작업하기 위한 하위 확장 프로그램을 제공한다. 자동 제안 기능은 쿼리 작성을 쉽게 해준다. 다만 일부 워크벤치 앱에서 제공하는 스프레드시트와 비슷한 인터페이스를 통해 인터랙티브한 방식으로 데이터를 편집하는 기능은 없다. 코드스냅(CodeSnap) 때로는 코드의 스크린샷을 찍는 것이 코드를 공유하는 가장 빠르고 직접적인 방법인 경우가 있다. 코드스냅은 외부 툴 없이 VS 코드 내에서 이를 가능하게 해준다. 원하는 코드를 선택하고 직접 할당한 키바인딩을 누르면 해당 코드 부분이 파일로 저장되거나 클립보드로 복사된다. 현재 활성화된 테마도 스크린샷에 사용된다. 코드스냅이 출시된 이후 기능을 약간씩 변경한 다양한 포크가 나왔다. 대표적인 예로 스크린샷에 라인 하이라이트 기능을 추가하는 코드스냅플러스(CodeSnapPlus)가 있다. 코드투HTML(CodeToHTML) 많은 개발자가 코드를 공유할 때 붙여넣기 서비스를 사용한다. 이 서비스는 일반적인 언어를 위한 구문 하이라이팅을 자동으로 추가해 준다. 예를 들어 블로그에서 코드를 HTML로 공유하고 싶은데 구문 하이라이팅 메커니즘이 없는 경우에는 어떻게 해야 할까? 코드투HTML 확장 프로그램은 코드 조각을 받아 HTML로 변환하며, 이때 인라인 스타일 정보를 통해 자동으로 하이라이팅이 해당 코드 조각에 내장된다. editor@itworld.co.kr
인터넷 보안은 그 분야 전문가에게도 복잡한 주제이며, 일반 사용자에게는 용어조차도 어려울 수 있다. 물론 모든 전문 용어를 다 알 필요는 없다. 하지만, 기본적인 용어에 대한 어휘력을 갖추면 주요 위협으로부터 자신을 보호할 수 있는 충분한 정보를 확보하는 데 도움이 될 수 있다. 예를 들어 피싱 이메일이 무엇인지 안다면 피싱 이메일에 대한 경각심을 갖고 이런 흔한 위험을 피할 수 있다. 여기서 소개하는 주요 보안 용어는 보안 경고를 이해하고 홈 네트워크와 컴퓨터를 보호하기 위한 적절한 조치를 취하는 데 도움이 될 것이다. 핵심 보안 용어 컴퓨터 시스템과 네트워크는 무단 액세스로부터 사용자와 사용자의 데이터를 보호하기 위해 다양한 기술을 사용한다. 우선, 데이터를 보호하는 방법을 설명하는 가장 일반적인 용어부터 알아보자. 2FA. 이중 인증(TwoFactor Authentication)의 줄임말로, 비밀번호 외에 추가적인 '요소'를 추가해 온라인 계정을 보호하는 방법이다. 문자 메시지 확인 또는 신뢰할 수 있는 앱에서 생성한 코드를 추가 인증 요소로 사용할 수 있다. 만약 이중 인증을 사용할 수 있는 계정이라면, 사용하는 것이 좋다. 인증(Authentication). 일반적으로 비밀번호, 생체 인식 또는 코드 확인을 통해 플랫폼 또는 계정에 대한 승인된 액세스를 확인한다. 생체 인식. 얼굴 형상이나 지문과 같은 사용자의 신체적인 특성을 보안 인증 수단으로 사용하는 것을 말한다. 노트북의 지문 센서와 윈도우 헬로 카메라는 암호보다 더 쉽고 안전하게 로그인할 수 있는 일반적인 생체 인식 보안 기능이다. 인증서 인증(Certificate Authentication). 신뢰할 수 있는 기관에서 디지털 서명한 기록을 사용해 웹사이트, 파일 또는 시스템의 진위 여부를 확인한다. 암호화(Encryption). 미리 정해진 방식으로 정보를 뒤죽박죽으로 만들어 민감한 정보를 모호하게 하거나 숨기는 방법. 하드 드라이브 및 기타 저장 장치를 암호화하면 장치가 악의적인 사람의 손에 넘어갈 경우 데이터를 보호할 수 있으며, 네트워크 연결을 암호화하면 데이터가 네트워크를 통해 이동할 때 제 3자가 가로채지 못하도록 보호한다. 위험 및 악용 관련 용어 해커와 범죄자들이 사용하는 일반적인 위험과 수법에 관한 용어다. 보안 소프트웨어를 구매할 때는 모든 위협 유형으로부터 보호하고 내 정보가 다크 웹에 표시될 때 알려주는 옵션을 선택하기 바란다. 백도어. 공격자가 시스템에 액세스하는 은밀한 방법을 만드는 보안 취약점, 즉 PC에 열려 있는 '뒷문'을 만들어 악용하는 수법이다. 부팅 레코드 바이러스. 흔히 MBR(Master Boot Record) 바이러스라고하며, 컴퓨터 시스템이 부팅될 때 로드되는 하드 드라이브의 일부를 표적으로 삼는 바이러스 형태이다. 운영체제의 보안 기능을 우회하는 데 악용된다. 봇넷. '로봇 네트워크'의 줄임말로, 범죄자가 대상 시스템의 보안 장치나 인프라를 압도하기 위해 대량의 감염된 컴퓨터를 사용하는 것을 말한다. 무차별 대입 공격(Brute Force Attack). 사용자 아이디와 비밀번호 조합을 알아내기 위해 대량의 문자와 숫자 조합을 사용하는 방식이다. 크라임웨어(Crimeware). 사이버 범죄자가 범죄 행위를 수행하기 위해 사용하는 멀웨어이다. 봇넷에 감염된 컴퓨터를 추가하는 트로이 목마 바이러스가 대표적이다. 다크 웹(Dark Web). 특정 소프트웨어를 사용해 트래픽을 익명화하는 인터넷용 섀도우 네트워크의 일종이다. 다크 웹은 종종 도난당한 비밀번호를 포함해 불법 또는 도난당한 데이터를 전송하는 데 사용된다. 다크 웹을 모니터링하는 보안 서비스는 이런 네트워크를 검색해 위협 정보가 발견되면 사용자에게 경고한다. 데이터 마이닝. 대규모 데이터 세트를 사용해 특정 대상에 대한 상관관계를 찾는 것을 말한다. 공격자는 여러 웹사이트나 데이터베이스에서 개인에 대한 데이터 요소를 찾아내 공격을 수행하거나 신원 도용을 저지르기에 충분한 정보를 수집할 수 있다. 서비스 거부 공격. DoS(Denial of Service)라고 부르며, 대상 시스템의 정상적인 작동을 방해하기 위해 의도적으로 과부하 트래픽을 일으키는 공격이다. 봇넷을 이용해 수행하는 경우가 많다. 사전 공격(Dictionary Attcack). 대량의 공통 용어를 사용해 사용자의 비밀번호를 알아내는 자동화된 무차별 암호 대입 공격의 한 형태이댜. 결함 주입(Fault Attack). 결함 주입 공격이라고도 한다. 해커가 정상적인 기능을 우회하기 위해 서버나 웹 브라우저에 의도적으로 잘못된 데이터 패킷을 전송하는 등 시스템의 일부에 오류를 발생시켜 시스템에 액세스하는 데 사용하는 방법이다. 하이재킹(Hijacking). 감염된 컴퓨터나 네트워크 연결을 악의적인 목적으로 사용할 수 있도록 제어권을 획득하는 것을 말한다. IP 스푸핑. 일반적으로 실제 출처를 숨기거나 다른 시스템을 사칭하기 위해 자신의 IP 주소가 아닌 다른 IP 주소에서 온 것처럼 보이도록 신호를 변경하는 방법이다. 미디어 스트리밍처럼 국가별 제한이 있는 서비스를 우회적으로 이용하는 데 사용할 수 있다. 커널 공격. 운영 체제의 핵심 코드(커널이라고 함)를 수정해 정보를 훔치거나 시스템에 대한 제어 액세스 권한을 얻기 위한 채널을 생성하는 보안 악용 방법이다. 멀웨어(Malware). 컴퓨터 시스템에서 악의적인 행위를 수행하는 소프트웨어. 바이러스나 트로이 목마 또는 사용자가 입력하는 내용을 기록하여 비밀번호 및 기타 정보를 수집하는 키로거 등을 통칭하는 용어다. 중간자 공격(ManintheMiddle Attack). 두 시스템 간의 트래픽을 가로채 공격자가 임의로 조작하는 방식의 공격이다. 가로챈 데이터를 훔치거나 다른 목적으로 손상된 정보를 삽입하는 데 사용할 수 있다. 신분 위장 공격(Masquerade Attack). 합법적인 사용자 또는 시스템의 자격 증명을 사칭하거나 이를 사용해 시스템에 액세스하는 방법이다. 비밀번호 크래킹. 사전 공격 등을 통해 작동 중인 비밀번호를 알아내 시스템에 액세스하는 행위. 비밀번호 스니핑. 암호화되지 않은 비밀번호에 대한 네트워크 트래픽을 모니터링하여 사용자 자격 증명을 발견하는 방법이다. 파밍(Pharming). 사용자가 유효한 사이트에 있다고 믿고 로그인 자격 증명이나 기타 식별 정보를 입력할 수 있는 스푸핑된 웹사이트로 트래픽을 리디렉션해 사용자의 데이터를 탈취하는 방법이다. 피싱 공격과 함께 사용되는 경우가 많다. 피싱(Phishing). 이메일이나 문자 메시지를 통해 피해자가 사용자 아이디와 비밀번호와 같은 민감한 데이터를 공개하도록 유인하는 소셜 엔지니어링 공격의 한 형태이다. 피싱 메시지는 일반적으로 은행이나 온라인 쇼핑몰처럼 신뢰할 수 있는 브랜드에서 보낸 것처럼 보이도록 디자인된 콘텐츠와 이미지를 이용한다. 포트 스캔. 공격자가 컴퓨터 시스템의 진입 지점을 발견하기 위해 사용하는 방법이다. 해커는 네트워크 또는 컴퓨터의 포트를 스캔해 사용 가능한 포트, 네트워크 내 컴퓨터에서 실행 중인 서비스 유형, 시스템에 액세스할 수 있는 기타 세부 정보를 파악할 수 있다. 랜섬웨어. 사용자가 시스템을 이용하지 못하게 잠그거나 민감하거나 당황스러운 데이터를 훔쳐내기 위한 멀웨어의 일종으로, 사용자가 액세스 권한을 되찾거나 정보 유출을 막기 위해 돈을 지불하도록 유도하는 것을 목적으로 한다. 세션 하이재킹. 사용자의 세션에서 활성 쿠키 데이터를 복제하는 등 이미 설정된 연결을 제어해 사용자의 온라인 계정에 액세스한다. 일반적으로 웹사이트 연결은 정해진 시간이 지나면 만료되는 세션 내에서 보안이 유지된다. 공격자는 만료되지 않은 세션의 쿠키 사본을 웹사이트에 제시함으로써 사용자를 사칭해 액세스 권한을 얻을 수 있다. 스니핑. 네트워크를 통해 전송되는 트래픽에서 데이터를 탐지하고 수집하는 모든 방법. 무선 네트워크에서 비밀번호를 찾는 데 자주 사용된다. 사회 공학. 인간의 사회적 취약점을 악용해 민감한 정보를 수집하거나 시스템에 액세스하는 데 사용하는 방법을 말한다. 피싱, 전화 사기, 신뢰할 수 있는 사람 사칭 등 다양한 기업이 사용된다. 스푸핑. 제한된 콘텐츠에 액세스하기 위해 컴퓨터의 IP 주소를 수정하거나 방문자를 속이기 위해 피싱 이메일 또는 가짜 웹사이트를 신뢰할 수 있는 브랜드의 소유인 것처럼 보이게 하는 등 시스템이나 계정을 그렇지 않은 것처럼 보이도록 수정하는 모든 기만적인 방법을 말한다. 트로이 목마. 겉보기에 안전한 애플리케이션 내에 숨겨져 있는 멀웨어. 컴퓨터에 악성 코드를 심는 데 이용한다. 바이러스. 스스로 복사본을 생성해 다른 파일과 시스템에 삽입함으로써 확산되는 멀웨어이다. 워초킹/워다이얼링/워드라이빙. 해커가 주변을 운전하며 무선 네트워크를 검색하거나(Wardriving), 걸어 다니며 같은 작업을 수행하고 눈에 띄는 방식으로 표적을 표시하거나(Warchoacking), 모뎀으로 액세스할 수 있는 컴퓨터를 찾기 위해 전화 번호를 자동 다이얼링하는(Wardialing) 방식으로 잠재적인 공격 대상을 발견하고 식별하는 방식이다. 전화를 받았는데 귀에서 모뎀의 치직거리는 소리가 들린다면, 워다이얼링 시도일 수 있다. 네트워킹 보안 용어 가장 단순한 홈 네트워크에도 일반적으로 침입자를 차단하고 데이터를 보호하는 데 도움이 되는 다양한 장치와 기능이 있다. 액세스 제어. 특정 디바이스의 네트워크 참여를 허용하거나 차단하는 라우터의 기능이다. 방화벽. 컴퓨터 또는 네트워크에 대한 액세스를 제한하는 장치 또는 소프트웨어이다. 방화벽을 통해 들어오고 나가는 항목에 대한 권한을 설정할 수 있다. 라우터. 네트워크의 액세스 및 트래픽 흐름을 관리하고, 네트워크 내의 컴퓨터에 주소를 할당하며, 네트워크 내의 시스템 간 연결 흐름을 지시하는 디바이스이다. 홈 라우터는 일반적으로 인터넷 서비스 업체의 모뎀에 연결되며 홈 네트워크 내의 디바이스가 서로 및 인터넷에 연결할 수 있는 중앙 허브 역할을 한다. 대부분의 라우터에는 외부 침입으로부터 네트워크를 보호하는 방화벽 및 액세스 제어 기능이 포함되어 있다. 홈 네트워크를 완벽하게 보호하려면 라우터의 기능을 알아두는 것이 좋다. 인터넷 보안 용어 사용자를 보호하고 온라인에서 데이터가 도난당하는 것을 방지하기 위해 웹사이트와 애플리케이션은 다양한 기술과 기법을 사용한다. 쿠키. 웹사이트 등의 시스템에서 사용자를 식별하고 추적하기 위해 사용하는 데이터 파일로, 종종 해당 사용자와 관련된 구성 정보가 포함되어 있다. 쿠키에는 사용자의 계정에 액세스하는 데 사용할 수 있는 개인 식별 정보 및 세션 데이터가 포함될 수 있다. 웹사이트 로그인을 활성 상태로 두면 세션 쿠키 데이터를 사용해 계정에 다시 액세스할 수 있다. 따라서 웹사이트 이용이 끝나면 의식적으로 로그아웃하면 이렇게 악용되는 것을 방지할 수 있다. HTTPS. 'S'는 안전하지 않은 일반 HTTP와 달리 신뢰할 수 있는 발급자의 서명된 인증서로 보호되는 연결을 나타낸다. 기본적으로 온라인 보안에 관심이 있다면 개인 데이터를 전송하는 모든 웹사이트의 주소가 HTTPS로 시작해야 한다. 인터넷 프로토콜(IP). 인터넷을 통해 컴퓨터를 연결하는 표준 방법으로, 각 시스템에는 IP 주소라고 하는 고유한 숫자 또는 영숫자 주소가 있다. IPv4의 경우, 192.168.1.72, Ipv6의 경우 2001:0db8:85a3:0000:0000:8a2e:0370:7334와 같은 주소를 사용한다. 현재 두 버전 모두 사용되고 있다. 일부 사이버 공격은 신뢰할 수 있는 출처에서 온 것처럼 보이도록 IP 주소를 변조한다. SSL(Secure Sockets Layer). 디지털 서명 보안을 사용해 인터넷에서 신뢰할 수 있는 시스템을 식별하는 보안 표준이다. 웹사이트의 신원을 확인하기 위해 HTTPS에서 사용하는 표준이기도 하다. 비즈니스 보안 용어 직장에서 IT 부서는 회사 데이터와 시스템을 안전하게 보호하기 위해 여러 가지 보안 프랙티스를 적용한다. 최소 권한. 보안을 손상시킬 수 있는 의도치 않은 구성 변경을 방지하기 위해 컴퓨터에 대한 관리자 액세스를 보류하는 등, 특정 시스템이나 사용자에게 필수 기능을 수행하는 데 필요한 만큼의 액세스 권한만 부여하는 보안 원칙이다. 기업 IT 환경에서는 이런 이유로 일반 사용자에게는 회사에서 발급한 PC에 대한 기본 액세스 권한만 부여한다. 가정에서도 자녀의 컴퓨터 설정을 제한하는 식으로 적용할 수 있다. VPN(Virtual Private Network). VPN은 인터넷을 통해 여러 대의 컴퓨터를 안전하게 연결하는 수단으로, 내부 네트워크처럼 동작하는 것이 특징이다. 많은 기업이 직원들에게 공개 인터넷이 아닌 VPN을 통해 민감한 시스템에 액세스하도록 요구한다. 가정에서도 VPN을 사용하면 웹 서핑을 할 때 개인 정보 보호 장치를 추가하는 효과를 얻을 수 있다. 기타 중요한 컴퓨터 및 보안 용어 데몬(Daemon). 컴퓨터 시스템에서 자동화된 백그라운드 프로세스로 실행되는 프로그램. 대부분의 데몬은 양성이지만, 많은 멀웨어가 데몬을 추가해 사용자 활동을 모니터링하고 인터넷을 통해 해커의 지시를 기다린다. 암호 해독(Decryption). 일반적으로 보안 인증을 통해 암호화된 데이터 또는 텍스트를 읽을 수 있는 상태로 복원하는 작업이다. 허니팟(Honeypot). 공격자를 유인하고 함정에 빠뜨리기 위해 고의적으로 노출된 시스템으로, 겉보기에는 가치 있는 데이터로 가득 차 있다. 네트워크 관리자와 사법기관이 사이버 범죄자를 잡기 위해 허니팟을 사용하기도 한다. 현재 일부 가정용 보안 방화벽에는 허니팟 기능이 포함되어 있어 액세스 시도를 감지하고 침입자에게 경고를 보낼 수 있다. 평문(Plaintext). 암호화되지 않은 텍스트 콘텐츠. 암호화된 암호 텍스트와 반대되는 개념이다. 비밀번호와 같은 민감한 정보는 어떤 시스템에도 평문으로 저장해서는 안된다. 루트(Root). 맥OS나 리눅스 같은 유닉스 계열 운영체제의 핵심 관리자 또는 수퍼유저 계정이다. 대부분의 최신 유닉스 계열 시스템은 수퍼유저 기능에 대한 무단 액세스를 방지하기 위해 기본적으로 루트 계정을 비활성화한다. 많은 사이버 공격의 목표는 루트 액세스 권한을 얻어 시스템을 완전히 장악하는 것이다. 스팸. 원치 않는 메시지로, 주로 이메일을 통해 전달되지만 문자 메시지와 소셜 미디어에서도 점점 더 흔해지고 있다. 반드시 위험한 것은 아니지만 피싱 공격과 사기가 포함될 수 있다. 제로 데이(Zero Day). 새로운 취약점이 발견된 첫날로, 공격자가 취약점을 인지하고 사용자가 시스템에 방어 패치를 적용하기 전에 취약점을 악용할 수 있기 때문에 가장 취약한 시기로 간주된다. editor@itworld.co.kr
‘뉴 노멀’에서 ‘올드 노멀’로 되돌아가는 데는 그리 오랜 시간이 걸리지 않았다. 외출할 때마다 마스크를 챙기고, 사회적 거리두기를 하던 기억도 이제는 희미하다. 하지만 코로나 19가 쏘아 올린 거시 경제적 위기는 여전했고, 2024년에도 계속될 전망이다. 불확실한 경제 상황, 예측할 수 없는 미래는 기업의 가장 큰 불안 요소이지만, 현재 상황을 분석하고 가능성 있는 미래를 염두에 둔다면 변화에 빠르게 대처할 수 있을 것이다. 2024년 IT 업계에서 가장 주목해야 할 기술은 여전히 AI다. 인터넷에 버금가는 사회/경제적 혁신을 이끌게 될 기술로 주목받는 AI는 2024년 한층 고도화되면서 안정기에 접어들 것으로 예상된다. 이에 따라 AI에 능통한 기업과 그렇지 못한 기업의 지식 격차는 2024년 기업의 생산성과 수익을 판가름할 것으로 보인다. 여기서는 2024년 한해 계획에 참고하면 좋을 만한 AI 관련 2024년 전망을 정리한다. 2024년에도 변화의 중심은 AI 가트너는 오는 2026년까지 생성형 AI 모델이나 API를 사용하는 기업이 80%에 달할 것으로 예상했다. 2023년 초에는 5% 미만이었던 것을 고려하면 폭발적인 성장이다. 이에 따라 AI의 신뢰와 리스크, 보안 관리를 의미하는 AI TRiSM(Artificial Intelligence Trust, Risk, and Security Management)의 필요성도 분명해졌다. 사전 예방적 데이터 보호, AI 전용 보안, 데이터 및 모델 드리프트, 모델 모니터링, 입출력 리스트 제어 등과 같은 AI TRiSM 기능을 적용하는 기업은 오류 및 불법 정보를 최대 80%까지 줄임으로써 보다 정확하게 의사결정할 수 있다. AI 성능에 핵심적인 역할을 하는 AI 반도체 시장도 몸집이 커지고 있다. 딜로이트는 생성형 AI 전용 반도체칩 시장 규모가 2024년 400억 달러(약 51조 9,600억 원) 수준까지 이르렀다가 2027년에는 4,000억 달러(약 519조 원)에 달할 것으로 전망했다. 또한 딜로이트는 기업용 소프트웨어 업체 대부분이 올해를 기점으로 제품과 서비스에 생성형 AI를 추가할 것이며, 생성형 AI를 도입한 SW 업체는 100억 달러(약 13조 원)의 추가 매출을 얻을 수 있다고 분석했다. 실무자의 업무 환경은 어떻게 바뀔까? 우선 중요도가 높지 않은 업무에서는 생성형 AI 사용이 고착화될 것으로 예상된다. 퀄트릭스의 ‘2024년 직원 경험 트렌드’에 따르면, 많은 직원이 자료 작성(63%), 개인 비서 역할(59%), 내부 지원 부서에 연락(50%)과 같이 AI를 직접 제어할 수 있는 업무에서 AI를 활용하는 것을 긍정적으로 생각하고 있었다. 반면 교육, 업무 성과 평가, 채용 및 승진 면접처럼 주관적인 의견이 개입되고 중요도가 높은 업무에 대해서는 선호도가 30%대에 그쳤다. AI는 직원의 업무 방식뿐 아니라 일자리 지형도 바꾸고 있다. 생성형 AI가 창의적인 사고를 성공적으로 수행하는 모습을 입증하면서 2023년에는 더 많은 일자리가 사라질 것에 대한 우려가 있었지만, 한편에서는 프롬프트 엔지니어(Prompt Engineer)처럼 AI가 창출한 새로운 역할도 생겨났다. SAS는 “AI 기술이 고용 시장에 일시적인 혼란을 야기할 수 있지만, 앞으로 경제 성장을 견인할 직무를 창출할 것“이라며, 올해는 이런 신규 일자리가 크게 주목받을 것으로 예상했다. 접근 방식도 달라진다 AI 도입이 필수적인 흐름이라면 2024년에는 비용 효율적인 운영을 고민해야 하는 시기다. 올해부터는 AI에 대한 논의가 이론에서 실제 추론 및 운영 환경으로 전환되면서 투자에 대한 초점 역시 훈련 비용에서 추론/운영 비용으로 이동할 것으로 보인다. 델 테크놀로지스에 따르면, 훈련 비용은 모델의 크기와 데이터 집합 사용에 따라 결정되지만 추론/운영 비용은 트랜잭션 수, 사용자 규모, 데이터 유형, 지속적인 유지보수에 좌우된다. 클라우데라는 비교적 적은 비용과 훈련 데이터로도 LLM 성능을 최적화하는 대표적인 3가지 방법으로 프롬프트 엔지니어링, 검색증강생성(Retrieve Augmented Generation, RAG), 파인 튜닝(Fine Tuning)에 주목했다. 또한 앞으로는 많은 기업이 더 나은 LLM을 만들기 위해 MLOps(Machine Learning Operation)와 데이터 페더레이션 기능 개발에 주력할 것으로 예상했다. AI의 잠재력을 극대화해 경쟁 우위를 확보하기 위한 방법으로 에퀴닉스는 ▲신뢰할 수 있는 출처 ▲전략적인 데이터 수집 ▲적절한 모델 3가지 요소가 필요하다고 강조했다. 또한 지난해에는 생성형 AI가 기업의 데이터를 유출하는 사고가 있었던 만큼 2024년에는 민감 데이터를 위험 요소로부터 효율적으로 보호하는 방법으로 프라이빗 AI 논의가 활발해질 것으로 전망했다. 마케팅 캠페인도 AI로 효과적으로 디지털 마케팅 분야에서도 AI가 핵심 키워드다. 인크로스는 경기 침체로 인해 2024년에는 광고 효율을 극대화할 수 있는 서비스와 기술이 계속해서 주목받을 것이라고 분석했는데, 특히 ‘AI 마케팅’이 크게 발전할 것이라고 전망했다. 실제로 마케팅 업계에서는 현재 AI를 활용해 광고 소재를 제작하고 ML을 통해 캠페인 효율을 최적화하는 추세가 점차 확산하고 있다. 인크로스는 광고 업계 전반에 AI/ML의 영향력이 확대할 것으로 바라봤다. 몰로코의 조사도 인크로스의 전망을 뒷받침한다. 몰로코가 전 세계 모바일 앱 마케터를 대상으로 실시한 조사에 따르면, 퍼포먼스 기반 모바일 마케팅 솔루션을 선택할 때 고려하는 10가지 요소 중 ‘고급 ML 기술’이 37%로 1위를 차지했다. 광고 패러다임 자체가 변화할 것이라는 전망도 있다. 메조미디어는 일방향적인 기존의 광고 방식이 생성형 AI를 통해 이용자와 상호작용하는 방식으로 광고 패러다임이 바뀔 것이며, 이에 따라 2024년에는 많은 마케터가 프롬프트 작성, 디지털 리터러시에 대한 이해, 유해 정보 필터링과 같은 생성형 AI 역량을 개발할 것으로 예상했다. 기회 혹은 위기…AI라는 양날의 검 모든 기술에는 어두운 이면이 있는 법이다. 올해 기업의 보안에 가장 큰 영향을 미칠 요소로 AI가 꼽히는 것도 자연스럽다. 미국보안산업협회(Security Industry Association, SIA)는 2024년 기업 보안에 영향을 미칠 것으로 예상되는 가장 중요한 트렌드로 AI를 선정했다. 구체적으로는 ‘AI 보안’을 가장 중요한 트렌드로 선정했으며, AI가 탑재된 디지털카메라의 비디오 인텔리전스, 생성형 AI, AI 규제가 뒤를 이었다. 매해 연말 보안 위협 전망을 내놓는 보안 업체들도 일제히 AI의 어두운 이면을 지적했다. 이글루코퍼레이션과 SK쉴더스는 피싱 이메일 작성, 악성코드 생성 등 생성형 AI를 악용해 해커가 공격을 더 쉽고 빠르게 수행할 수 있는 환경이 마련되면서 2024년 생성형 AI를 악용한 사이버공격이 증가할 것으로 전망했다. 특히 프루프포인트는 현재 맬웨어 개발자들이 AI를 활용해 더 많은 표적에 접근할 수 있는 첨단 프로그래밍 기법을 만들고 있음을 지적하며, 그 결과 2024년에는 샌드박스나 EDR(Endpoint Detection and Response)과 같은 도구를 피할 수 있는 맬웨어가 크게 확산하며 ‘맬웨어의 각축장’이 벌어질 수 있다고 경고했다. 세상의 모든 IT 리서치 자료, '넘버스' 여기서 소개한 모든 자료는 넘버스(Numbers) 서비스에 등록돼 있다. 넘버스는 IT 전문 미디어 ITWorld가 제공하는 IT 리서치 자료 메타 검색 서비스다. IDC, 가트너, 포레스터 등 주요 시장조사 업체의 자료는 물론 국내외 정부와 IT 기업, 민간 연구소 등이 발표한 기술 관련 최신 자료를 총망라했다. 2024년 1월 현재 1,300여 건의 자료가 등록돼 있으며, 매달 50여 건이 새롭게 올라온다. 등록된 자료는 출처와 토픽, 키워드 등을 기준으로 검색할 수 있고, 관련 기사를 통해 해당 자료의 문맥을 이해할 수 있다. 자료의 원문 제목과 내용을 볼 수 있는 링크, 자료를 발행한 주체와 발행 일자도 함께 확인할 수 있다. mia.kim@foundryco.com
구글의 고(Go) 프로그래밍 언어가 처음 등장했을 때는 이 언어는 호기심 많은 컴퓨터 전문가나 다루던 언어였다. 그러나 이후 10여 년의 시간을 거치면서 세계적으로 중요한 여러 클라우드 네이티브 프로젝트를 움직이는 검증된 프로그래밍 언어로 발전했다. 도커, 쿠버네티스와 같은 중요한 프로젝트에서 개발자가 고를 선택한 이유는 무엇일까? 고의 대표적인 특징은 무엇이고, 다른 프로그래밍 언어와 어떤 면에서 다를까? 고는 어떤 종류의 프로젝트에 가장 적합할까? 여기서는 고의 기능과 최적의 사용 사례는 물론 부족한 기능과 제약을 살펴보고 앞으로의 발전 방향을 예측해 본다. 작고 간소한 고 언어 고, 또는 흔히 말하는 고랭(Golang)은 오랜 유닉스 권위자이자 구글 특별 엔지니어인 롭 파이크를 주축으로 구글 직원이 만든 언어지만 엄밀히 말하면 “구글 프로젝트”는 아니다. 그보다는 언어의 사용 방법과 방향에 대해 명확한 소신이 있는 리더십의 주도로 커뮤니티에서 개발한 오픈소스 프로젝트라고 하는 편이 더 정확하다. 고는 쉽게 배울 수 있고 다루기 편하며 다른 개발자가 읽기 쉬운 언어를 목표로 한다. 고는 특히 C++와 같은 언어와 비교해 기능이 많지는 않다. 구문 측면에서는 C와 비슷하므로 오랜 기간 C를 사용해 온 개발자라면 비교적 쉽게 배울 수 있다. 그러나 고의 여러 기능, 특히 동시성 및 함수형 프로그래밍 기능은 얼랭(Erlang)과 같은 언어와 더 비슷하다. 고는 온갖 종류의 크로스 플랫폼 엔터프라이즈 애플리케이션을 구축하고 유지하기 위한 C와 유사한 언어로, 자바와도 많은 공통점을 갖고 있다. 또한 파이썬과는 유사점보다 차이점이 훨씬 더 크긴 하지만 어디에서나 실행 가능한 코드를 빠르게 개발할 수 있다는 면에서는 마찬가지라고 할 수 있다. 고 설명 문서를 보면, 고를 “동적 형식 지정 인터프리트 언어처럼 느껴지는 빠른 정적 형식 지정 컴파일 언어”라고 설명한다. 규모가 큰 고 프로그램도 컴파일에는 몇 초밖에 걸리지 않는다. 또한 고에서는 C 스타일의 include 파일 및 라이브러리에 따르는 오버헤드를 대부분 피할 수 있다. 고 언어의 강점 고는 여러 가지 면에서 개발자의 일을 편하게 해준다. 강점 1. 편리함 고는 많은 일반적인 프로그래밍 요구를 충족할 수 있다는 점에서 파이썬과 같은 스크립팅 언어와 자주 비교된다. 이런 기능 중에는 동시성과 스레드 동작을 위한 고루틴처럼 언어 자체에 내장된 경우도 있고, 고의 http 패키지와 같이 고 표준 라이브러리 패키지로 제공되는 부가적인 기능도 있다. 고는 파이썬과 마찬가지로 가비지 수집을 포함한 자동 메모리 관리 기능을 제공한다. 고 코드는 파이썬과 같은 스크립팅 언어와 달리 실행 속도가 빠른 네이티브 바이너리로 컴파일된다. 또한 C 또는 C++와 달리 고의 컴파일 속도는 매우 빨라서 고로 작업하다 보면 컴파일 언어보다는 스크립팅 언어에 가깝게 느껴진다. 고 빌드 시스템은 다른 컴파일 언어에 비해 덜 복잡하다. 몇 단계만 거치면 별다른 수고 없이 프로젝트를 빌드하고 실행할 수 있다. 강점 2. 빠른 속도 고 바이너리의 실행 속도는 C 바이너리에 비하면 느리지만 그 차이가 크지는 않아서 대부분의 애플리케이션에서 무시해도 될 정도다. 성능은 대부분의 작업에서 C에 필적하며, 자바스크립트, 파이썬, 루비 등 개발 속도로 유명한 다른 언어와 비교하면 대체로 훨씬 더 빠르다. 강점 3. 이식성 고 툴체인으로 생성된 실행 파일은 기본적인 외부 종속성 없이 독립적으로 작동할 수 있다. 고 툴체인은 다양한 운영체제 및 하드웨어 플랫폼용으로 제공되며, 이러한 툴체인을 사용해 여러 플랫폼에 걸쳐 바이너리를 컴파일할 수 있다. 강점 4. 상호운용성 고는 모든 기능을 기반 시스템에 대한 접근성을 희생하지 않고 제공한다. 고 프로그램은 외부 C 라이브러리와 통신하거나 네이티브 시스템을 호출할 수 있다. 예를 들어 도커에서 고는 저수준 리눅스 함수, 컨트롤 그룹(cgroups) 및 네임스페이스와 상호작용해 컨테이너 동작을 구현한다. 강점 5. 광범위한 지원 고 툴체인은 리눅스, 맥OS 또는 윈도우 바이너리나 도커 컨테이너로 무료로 사용 가능하다. 고는 레드 햇 엔터프라이즈 리눅스, 페도라와 같은 많은 인기 있는 리눅스 배포판에 기본적으로 포함되므로 이러한 플랫폼에 비교적 쉽게 고 소스를 배포할 수 있다. 마이크로소프트 비주얼 스튜디오 코드부터 액티브스테이트(ActiveState)의 코모도(Komodo) IDE에 이르기까지 많은 서드파티 개발 환경도 충실하게 지원한다. 고 언어가 가장 적합한 분야 모든 작업에 적합한 언어는 없지만 다른 언어에 비해 더 많은 작업에서 효과적인 언어는 있다. 고는 다음과 같은 애플리케이션 유형 개발에서 가장 빛을 발한다. 분야 1. 클라우드 네이티브 개발 고의 동시성과 네트워킹 특성, 높은 수준의 이식성은 클라우드 네이티브 앱을 구축하는 데 적합하다. 실제로 고는 도커, 쿠버네티스, 이스티오를 포함한 클라우드 네이티브 컴퓨팅의 여러 초석을 구축하는 데 사용됐다. 분야 2. 분산 네트워크 서비스 네트워크 애플리케이션의 성패는 동시성에 달려 있는데, 고루틴과 채널 등 고의 네이티브 동시성 기능이 이 부분에서 강점이 있다. API, 웹 서버, 웹 애플리케이션을 위한 최소한의 프레임워크 등 네트워킹, 분산 기능 및 클라우드 서비스를 위한 고 프로젝트가 많은 것도 이 때문이다. 분야 3. 유틸리티 및 독립형 툴 고 프로그램은 최소한의 외부 종속성을 가진 바이너리로 컴파일된다. 따라서 시작 시간이 빠르고 즉시 패키징해 재배포할 수 있으므로 유틸리티나 다른 툴을 만드는 데 적합하다. 한 가지 예로 SSH 등에 사용되는 텔레포트(Teleport)라는 액세스 서버가 있다. 텔레포트는 소스에서 컴파일하거나 사전 빌드된 바이너리를 다운로드하는 방법으로 빠르고 쉽게 서버에 배포할 수 있다. 고 언어의 제약 제약 1. 생략된 언어 기능이 많음 지향점이 뚜렷한 고의 기능은 칭찬과 비판을 동시에 받아왔다. 고는 작고 이해하기 쉬운 언어에 중점을 두고 설계됐으므로, 일부 기능은 의도적으로 생략됐다. 그 결과 다른 언어에서는 일반적인 몇 가지 기능을 고에서는 볼 수 없다. 오랜 불만 중 하나는 한 함수가 여러 유형의 변수를 받을 수 있게 해주는 제네릭 함수의 부재였다. 고 개발 팀은 고의 나머지 부분을 보완하는 구문과 동작을 구현해야 한다는 이유로 오랜 시간 동안 제네릭 추가에 반대 입장을 고수했다. 그러나 2022년 초에 출시된 고 1.18부터는 제네릭을 위한 구문이 포함됐다. 여기서 알 수 있는 점은 고는 여러 버전 간에 폭넓은 호환성을 보존한다는 이유로 중대한 기능을 추가하는 일이 거의 없고, 추가할 때도 많은 고민을 거친다는 것이다. 제약 2. 바이너리 크기가 클 수 있음 고의 또 다른 잠재적인 단점은 생성된 바이너리의 크기다. 기본적으로 고 바이너리는 정적으로 컴파일된다. 즉, 런타임에 필요한 모든 요소가 바이너리 이미지에 포함된다. 이 방식은 빌드 및 배포 프로세스를 간단하게 해주지만 그 대가로 “Hello, world!”를 출력하는 바이너리의 크기가 64비트 윈도우 기준 약 1.5MB에 이른다. 고 팀은 각 릴리스마다 바이너리의 크기를 줄이기 위한 작업을 해오고 있다. 또한 압축이나 디버그 정보를 제거하는 방법으로 고 바이너리 크기를 줄이는 것도 가능하다. 후자의 방법은 서비스가 실패할 경우 디버그 정보를 유용하게 사용할 수 있는 클라우드 또는 네트워크 서비스보다는 독립형 분산 앱에서 더 적합하다. 제약 3. 가비지 수집에서 많은 리소스 소비 고가 자랑하는 기능인 자동 메모리 관리는 단점이 되기도 한다. 가비지 수집을 위해 얼마간의 처리 오버헤드가 필요하기 때문이다. 고는 설계상 수동 메모리 관리 기능을 제공하지 않으며, 고의 가비지 수집은 엔터프라이즈 애플리케이션에서 발생하는 메모리 부하에 잘 대응하지 못한다는 비판을 받아왔다. 그래도 새 버전이 나올 때마다 메모리 관리 기능이 개선되고 있다. 예를 들어 고 1.8에서는 가비지 수집의 지연 시간이 크게 줄어들었다. 고 개발자는 C 확장에서 수동 메모리 할당을 사용하거나 서드파티 수동 메모리 관리 라이브러리를 사용할 수 있지만, 대부분의 고 개발자는 이러한 문제에 대해 네이티브 솔루션을 선호한다. 제약 4. GUI 구축을 위한 표준 툴킷의 부재 데스크톱 애플리케이션의 GUI와 같이 고 애플리케이션을 위한 풍부한 GUI를 구축하는 소프트웨어 문화는 여전히 빈약하다. 대신 대부분의 고 애플리케이션은 명령줄 툴 또는 네트워크 서비스다. 다만 고 애플리케이션에 GUI를 제공하기 위한 다양한 프로젝트가 진행 중이다. 대표적인 것이 GTK 및 GTK3 프레임워크를 위한 바인딩이다. C 바인딩에 의존하며 순수 고로 작성되지 않았지만 플랫폼 네이티브 UI를 제공하는 프로젝트도 있다. 윈도우 사용자라면 워크(walk)를 사용해볼 수 있다. 그러나 아직은 확고한 승자나 장기적인 관점에서 안전한 방법이 없다. 크로스 플랫폼 GUI 라이브러리를 구축하고자 했던 구글 프로젝트를 포함한 몇몇 프로젝트도 성과 없이 끝났다. 또한 고는 설계상 플랫폼 독립적이므로 이와 같은 프로젝트가 표준 패키지 모음의 일부가 될 가능성은 낮다. 마지막으로, 고는 네이티브 시스템 함수와 통신할 수 있지만 커널 또는 디바이스 드라이버, 임베디드 시스템과 같은 저수준 시스템 구성요소를 개발하기 위한 용도로는 적합하지 않다. 결국 고 런타임과 고 애플리케이션을 위한 가비지 수집기는 기반 운영체제에 의존한다. 이런 작업에 적합한 최신 언어에 관심이 있다면 러스트 언어를 추천한다. 고 언어의 미래 고 개발진은 고집을 부리기보다는 고 개발자 기반을 더욱 포용하는 방향으로 언어의 방향을 바꾸고 있으며, 그에 따라 앞으로는 이 개발자층의 희망 및 요구사항을 더 반영하며 개발될 것이다. 이 같은 변화의 대표적인 예가 최선의 방법에 대한 오랜 숙고 끝에 추가된 제네릭이다. 2021년 고 개발자 설문에서 고 개발자들은 고 언어가 제공하는 기능에 전반적으로 만족한다고 답했지만 개선해야 할 부분도 많다고 지적했다. 고 사용자들이 주로 개선을 원하는 분야는 종속성 관리(고 언어의 오랜 숙제), 버그 진단, 안정성이며, 그에 비해 메모리, CPU 사용률, 바이너리 크기, 빌드 시간 등의 순위는 훨씬 낮았다. 대부분의 언어는 핵심 사용 사례에 중점을 둔다. 고는 처음 등장하고 10년 동안 네트워크 서비스 틈새를 파고들었으며 이 영역에서 계속 확장해 나갈 가능성이 높다. 설문에서 확인된 고 언어의 주 사용 사례는 API 또는 RPC 서비스 생성(49%), 데이터 처리(10%), 웹 서비스(10%), CLI 애플리케이션(8%) 순이었다. 고 언어의 매력이 높아지고 있음을 보여주는 또 다른 신호는 언어 평가 후 실제로 도입하는 개발자의 수다. 프로젝트에 고 사용을 고려 중이라고 답한 설문 응답자 중 75%는 고를 선택했다. 고를 선택하지 않은 개발자가 선택한 주요 대안은 러스트(25%), 파이썬(17%), 자바(12%)였다. 이들 각 언어는 다른 틈새 시장을 발견했거나 지금 찾고 있다. 러스트의 경우 안전하고 빠른 시스템 프로그래밍, 파이썬은 프로토타이핑과 자동화 및 글루 코드, 자바는 전통적인 엔터프라이즈 애플리케이션이다. 고의 속도와 간편한 개발이 다른 사용 사례로 얼마나 확산될지, 또는 고가 엔터프라이즈 개발 분야에 얼마나 깊이 침투하게 될지는 아직 알 수 없다. 그러나 주요 프로그래밍 언어로서 고의 미래는 이미 보장돼 있다. 특히 고의 속도와 단순함은 가장 큰 미덕이다. 장기적인 유지 관리가 가능한 확장성 있는 인프라를 더 쉽게 개발할 수 있는 기반이 되는 클라우드에서고 언어의 미래는 확실하다. editor@itworld.co.kr
GPT, 바드, 라마 2 같은 대규모 언어 모델(LLM)은 대중의 상상력을 자극하고 다양한 반응을 끌어냈다. LLM에 대한 열기의 이면을 살펴보면서 대규모 언어 모델의 기원, 이러한 모델이 어떻게 구축 및 학습되는지를 살펴본다. 또한, 어떤 범위에서 효과적인지 검토하고, 가장 많이 사용되는 LLM에 대해 알아보자. 대규모 언어 모델이란? 언어 모델의 시초는 20세기 초까지 거슬러 올라가지만 대규모 언어 모델이 본격적으로 부상한 시점은 신경망이 도입된 이후다. 특히 2017년에 등장한 트랜스포머(Transformer) 심층 신경망 아키텍처는 언어 모델에서 LLM으로의 진화에 큰 역할을 했다. 대규모 언어 모델은 설명 프롬프트를 기반으로 한 텍스트 생성, 코드 생성 및 코드 완성, 텍스트 요약, 언어 간 번역, 텍스트투스피치 및 스피치투텍스트 애플리케이션을 포함한 다양한 작업에 유용하다. 한편, 적어도 현재 개발 단계에서의 LLM에는 단점도 있다. 생성된 텍스트의 품질이 그다지 좋은 편이 아니며, 형편없는 경우도 종종 발생한다. LLM은 없는 사실을 만들어 내기도 하는데 이를 환각(hallucination)이라고 한다. 답을 구하는 사용자에게 관련 지식이 없다면 환각은 상당히 그럴듯하게 들릴 것이다. 언어 번역의 경우, 네이티브 스피커의 검수를 받지 않은 문장은 100% 정확한 경우가 거의 없지만, 검수는 일반적으로 상용구에 한해서만 이뤄진다. 생성된 코드에는 버그가 흔하고, 아예 실행되지 않는 경우도 있다. 대체로 LLM은 논란의 여지가 있는 언급을 하거나 불법적인 행동을 추천하는 일이 없도록 미세한 조정을 거치지만 악의적인 프롬프트를 사용하면 안전 장치를 무력화할 수도 있다. 대규모 언어 모델을 학습시키기 위해서는 대규모 텍스트 말뭉치(corpus)가 하나 이상 필요하다. 학습 예제에는 1B 워드 벤치마크(1B Word Benchmark), 위키피디아, 토론토 북 코퍼스(Toronto Books Corpus), 커먼 크롤(Common Crawl) 데이터 집합, 그리고 공개 오픈소스인 깃허브 리포지토리 등이 포함된다. 대규모 텍스트 데이터 집합에는 저작권 침해와 쓰레기라는 두 가지 문제점이 있다. 저작권 침해의 경우 현재 여러 관련 소송이 진행 중이다. 쓰레기는 최소한 청소는 가능하다. 쓰레기 청소가 된 데이터 집합의 예로, 커먼 크롤 데이터 집합을 기반으로 한 800GB 용량의 데이터 집합인 콜로설 클린 크롤드 코퍼스(Colossal Clean Crawled Corpus: C4)가 있다. 대규모 언어 모델은 딥러닝 신경망, 대규모 학습 말뭉치를 사용하며, 신경망을 위한 수백만 개 이상의 매개변수 또는 가중치를 필요로 한다는 면에서 전통적인 언어 모델과 다르다. 하나 이상의 대용량 학습 말뭉치와 함께 LLM에는 많은 수의 매개변수, 즉 가중치가 필요하다. 매개변수의 수는 지금까지 매년 증가했다. 엘모(ELMo, 2018)의 매개변수 수는 9,360만 개이며 버트(BERT, 2018)는 1억 1,700만 개, T5(2020)는 2억 2,000만 개다. GPT2(2019)의 경우 16억 개, GPT3(2020)는 1,750억 개, 팜(PaLM, 2022)은 5,400억 개이며 GPT4(2023)의 매개변수는 1조 7,600억 개에 이른다. 매개변수가 많을수록 모델의 정확도는 높아지지만 그만큼 더 많은 메모리가 필요하고 실행 속도가 느려진다. 2023년에는 비교적 작은 모델들이 여러 가지 크기로 출시되기 시작했다. 예를 들어 라마 2(Llama 2)는 70억 개, 130억 개, 700억 개 버전으로 제공되며 클로드 2(Claude 2)는 930억 개와 1,370억 개의 매개변수 크기로 제공된다. 텍스트를 생성하는 AI 모델의 역사 언어 모델의 시초는 1913년에 시에 수학을 적용한 안드레이 마코프다. 마코프는 푸시킨의 유게니 오네긴에서 한 문자가 나타날 확률은 이전 단어에 따라 달라지며, 일반적으로 자음과 모음이 번갈아 나타나는 경향이 있음을 밝혀냈다. 현재 마코프 체인은 각 이벤트의 확률이 이전 이벤트의 상태에 따라 달라지는 이벤트 시퀀스를 설명하는 데 사용된다. 마코프의 연구는 1948년 클로드 섀넌의 통신 이론에서 확장됐고, 이후 IBM의 프레드 젤리넥과 로버트 머서가 1985년에 교차 검증 기반의 언어 모델을 만들어 실시간 대규모 어휘 음성 인식에 적용하면서 다시 한번 확장됐다. 기본적으로 통계적 언어 모델은 단어의 시퀀스에 확률을 할당한다. 언어 모델의 실제 작동을 간단히 보려면 구글 검색 또는 휴대폰에서 자동 완성을 켠 상태로 문자 메시지 앱에 단어를 몇 개 입력해보면 된다. 2000년에 요슈아 벤지오와 공동 저자들은 통계적 언어 모델의 확률을 신경망으로 대체하여 차원의 저주를 회피하고 당시 최첨단 기술이었던 평탄화 트라이그램(smoothed trigram) 모델에 비해 단어 예측을 20%~35% 개선하는 신경 확률 언어 모델을 다룬 논문을 발표했다. 피드 포워드 자동 회귀 신경망 언어 모델 개념은 지금도 여전히 사용되지만, 현재의 모델은 매개변수 수가 수십억 개에 이르고 광범위한 말뭉치로 학습되며, 그래서 ‘대규모 언어 모델’이라는 명칭으로 불린다. 언어 모델이 성능 개선을 목표로 발전하면서 시간이 갈수록 크기도 커졌다. 그러나 이 같은 크기 증가에는 단점도 있다. 2021년에 발표된 논문 ‘확률적 앵무새의 위험에 대해: 언어 모델의 크기에는 한계가 없는가?’는 언어 모델은 클수록 좋다고 생각하는 경향에 대해 의문을 제기한다. 논문 저자는 웹의 모든 것을 수집하지 말고 환경적, 재정적 비용을 먼저 고려해서 데이터 집합을 선별 및 문서화하는 데 투자할 것을 제안한다. 언어 모델과 LLM에 대한 이해 현재의 언어 모델은 다양한 작업과 목표가 있고 형태도 다양하다. 예를 들어 언어 모델은 문서에서 다음 단어를 예측하는 작업 외에 새로운 텍스트를 생성하고 텍스트를 분류하고 질문에 답하고 감정을 분석하고 명명된 개체를 인식하고 음성을 인식하고 이미지의 텍스트를 인식하고 손글씨를 인식할 수 있다. 일반적으로 중소 규모의 보충 학습 집합을 사용하여 실시되는 특정 작업을 위한 언어 모델 맞춤 설정을 미세 조정(finetuning)이라고 한다. 언어 모델에 들어가는 중간 작업의 예를 들면 다음과 같다. 학습 말뭉치를 문장으로 세분화 단어 토큰화 어간 추출 표제어 추출(어근 단어로 변환) POS(Part Of Speech) 태깅 정지단어 식별 및 제거(경우에 따라) 명명된 객체 인식(NER) 텍스트 분류 청킹(Chunking, 문장을 유의미한 구로 분할) 상호참조 해결(텍스트의 동일한 개체를 가리키는 모든 표현 찾기) 이 중에서 일부는 텍스트 분류와 같이 자체적인 작업 또는 애플리케이션으로도 유용하다. 대규모 언어 모델은 딥러닝 신경망과 대규모 학습 말뭉치를 사용하며, 신경망을 위한 수백만 개 이상의 매개변수 또는 가중치를 필요로 한다는 면에서 기존 언어 모델과 다르다. LLM 학습은 지정된 작업에 대한 모델의 오류를 가능한 가장 낮게 하기 위한 가중치 최적화의 문제다. 예를 들어 보통 자기 지도 방식으로 말뭉치의 임의의 지점에서 다음 단어를 예측하는 작업이 있다. 가장 인기 있는 LLM 최근 대규모 언어 모델의 폭발적인 성장을 촉발한 것은 2017년 발표된 “필요한 것은 주의 집중(Attention is All You Need)”이라는 논문이다. 이 논문은 “순환과 컨볼루션을 완전히 배제하고 오로지 주의 집중 메커니즘에만 기반을 둔 새롭고 단순한 신경망 아키텍처”로 트랜스포머를 소개했다. 오늘날 가장 많이 사용되는 대규모 언어 모델 중 몇 가지를 소개하면 다음과 같다. 엘모(ELMo) 엘모는 2018년에 나온 앨런NLP(AllenNLP)의 심층 맥락화 단어 표현 LLM으로, 단어 사용의 복잡한 특징, 그리고 언어적 맥락에 따라 그 단어 사용이 어떻게 달라지는지를 모델링한다. 원본 모델은 9,360만 개의 매개변수를 사용하며 1B 워드 벤치마크로 학습됐다. 버트(BERT) 버트는 구글 AI가 자사 트랜스포머 신경망 아키텍처를 기반으로 2018년에 출시한 언어 모델이다. 버트는 모든 레이어에서 왼쪽과 오른쪽의 맥락에 대한 공동 조건화를 통해 레이블 없는 텍스트로부터 심층 양방향 표현을 사전 학습하도록 설계됐다. 초기에 사용된 두 모델의 크기는 각각 매개변수 1억 개와 3억 4,000만 개였다. 버트는 토큰의 최대 15%가 “손상되는” 마스킹된 언어 모델링(MLM)을 학습에 사용한다. 영어 위키피디아와 토론토 북 코퍼스를 사용해 학습됐다. T5 구글의 2020년 텍스트투텍스트 트랜스퍼 트랜스포머(T5) 모델은 GPT, ULMFiT, 엘모, 버트 및 후속 모델에 적용된 최고의 전이 학습 기법을 기반으로 새로운 모델을 합성한다. 오픈소스 콜로설 클린 크롤드 코퍼스(C4)를 사전 학습 데이터 집합으로 사용한다. 영어용 표준 C4는 원본 커먼 크롤 데이터 집합을 기반으로 한 800GB 데이터 집합이다. T5는 모든 NLP 작업을 통합 텍스트투텍스트 형식으로 재구성한다. 클래스 레이블 또는 입력의 범위만 출력할 수 있는 버트 스타일 모델과 달리, 이 형식에서는 입력과 출력이 항상 텍스트 문자열이다. 기본 T5 모델에는 총 2억 2,000만 개의 매개변수가 사용된다. GPT 제품군 AI 연구 및 배포 기업인 오픈AI(OpenAI)의 사명은 “인공 일반 지능(AGI)이 모든 인류에 혜택이 되도록 하는 것”이다. 물론 AGI에는 아직 도달하지 못했고, 머신러닝의 개척자인 메타FAIR의 얀 르쿤 등 일부 AI 연구자는 AGI에 대한 오픈AI의 현재 접근 방식에는 답이 없다고 생각하기도 한다. 오픈AI는 GPT 언어 모델 제품군을 갖추고 있다. GPT 제품군 전체와 2018년 이후의 발전 과정을 간략하게 살펴보자. (참고로 GPT 제품군 전체는 구글의 트랜스포머 신경망 아키텍처를 기반으로 한다. 구글이 트랜스포머를 오픈소스로 공개했으므로 이는 합법적이다.) GPT(생성형 사전 학습 트랜스포머)는 오픈AI가 2018년에 출시한 모델로, 약 1억 1,700만 개의 매개변수를 사용한다. GPT는 토론토 북 코퍼스를 사용해 사전 학습된 단방향 트랜스포머이며 인과적 언어 모델링(CLM) 목표에 따라, 즉 시퀀스의 다음 토큰을 예측하도록 학습됐다. GPT2는 2019년에 출시된 GPT 확장 모델로, 매개변수는 15억 개이며 최대 40GB의 텍스트 데이터를 포함한 800만 개의 웹페이지 데이터 집합을 사용해 학습됐다. 오픈AI는 GPT2가 “너무 뛰어나고” “가짜 뉴스”로 이어질 수 있다는 이유에서 원래는 GPT2에 대한 접근을 제한했다. 이 조치는 나중에 철회됐지만, GPT3가 출시되면서 사회적 문제가 생길 가능성이 더 커졌다. GPT3는 2020년에 나온 자동 회귀 언어 모델로, 1,750억 개의 매개변수를 사용하며 필터링된 버전의 커먼 크롤과 웹텍스트2(WebText2), 북1(Books1), 북2(Books2), 영어 위키피디아의 조합으로 학습됐다. GPT3에 사용된 신경망은 GPT2와 비슷하지만 몇 개의 추가 블록이 있다. GPT3의 가장 큰 단점은 환각, 즉 명확한 근거 없이 사실을 지어내는 경향이다. GPT3.5와 GPT4에도 정도는 덜하지만 같은 문제가 있다. 코덱스(CODEX)는 2021년 GPT3에서 파생된 모델로 코드 생성을 위해 5,400만 개의 오픈소스 깃허브 리포지토리로 미세 조정됐다. 깃허브 코파일럿(Copilot)에 사용되는 모델이다. GPT3.5는 GPT3와 코덱스의 2022년 업데이트 집합이다. gpt3.5turbo 모델은 채팅에 최적화됐지만 기존의 완성 작업에서도 잘 작동한다. GPT4는 오픈AI의 주장으로는 일부 전문 및 학술 벤치마크에서 인간 수준의 성능을 발휘하는 2023년 대규모 멀티모달 모델(이미지와 텍스트 입력을 받아서 텍스트 출력을 생성)이다. GPT4는 미국 변호사 시험, LSAT, GRE 및 여러 AP 주제 시험을 포함한 다양한 시뮬레이션 시험에서 GPT3.5를 앞섰다. 참고로 시간이 지나면서 GPT3.5와 GPT4의 성능도 바뀌었다. 2023년 7월 스탠포드 대학 논문에 따르면 2023년 3월부터 2023년 6월 사이에 소수 식별을 포함한 여러 작업에서 모델의 동작이 크게 바뀌었다. GPT4 모델의 편향성에 대한 우려 GPT4의 학습 방법을 오픈AI가 설명하지 않은 것은 심각한 우려 사항이다. 오픈AI 측이 내세우는 이유는 경쟁이다. 마이크로소프트(현재까지 오픈AI에 130억 달러의 자금을 투자함)와 구글 간의 경쟁을 감안하면 어느 정도 납득은 되는 이유다. 그러나 학습 말뭉치의 편향성에 대해 알지 못한다는 것은 모델의 편향성에 대해 알지 못한다는 것을 의미한다. 에밀리 벤더는 2023년 3월 16일 마스토돈에 게시한 GPT4에 대한 글에서 “#오픈AI가 학습 데이터, 모델 아키텍처 등에 대한 정보를 *공개*하기 전까지 GPT4는 독성 쓰레기로 간주해야 한다”라고 말했다. 챗GPT와 빙GPT는 원래 gpt3.5turbo 기반의 챗봇이었지만 2023년 3월에 GPT4를 사용하도록 업그레이드됐다. 현재 GPT4 기반의 챗봇 버전에 액세스하려면 챗GPT 플러스에 가입해야 한다. GPT3.5 기반의 표준 챗GPT는 2021년 9월까지의 데이터로만 학습됐다. 빙GPT는 “더 뉴 빙”이라고도 하며, 마이크로소프트 엣지 브라우저에서 액세스할 수 있다. 마찬가지로 2021년까지의 데이터로 학습됐다. 이에 대해 빙GPT에 직접 물어보면 지속적으로 학습하면서 웹의 새로운 정보로 지식을 업데이트하고 있다고 주장한다. 홍콩 과학기술대학교 인공 지능 연구 센터의 파스칼 펑 교수는 2023년 3월 초에 챗GPT 평가에 대해 강연했는데, 시간을 투자해서 볼 만한 가치가 충분한 강연이다. 람다(LaMDA) 구글이 2021년에 발표한 “획기적인” 대화 기술인 람다(대화 애플리케이션을 위한 언어 모델)는 트랜스포머 기반 언어 모델로, 대화를 통해 학습되며 응답의 분별력과 구체성을 대폭 개선하도록 미세 조정됐다. 람다의 강점은 사람의 대화에서 흔히 발생하는 주제 표류에 대처할 수 있다는 것이다. 팜(PaLM) 팜(패스웨이 언어 모델)은 구글 리서치가 2022년에 발표한 고밀도 디코더 전용 트랜스포머 모델로 매개변수 수는 5,400억 개이며 패스웨이(Pathways) 시스템을 사용해 학습됐다. 팜은 고품질의 웹 문서와 서적, 위키피디아, 대화, 깃허브 코드를 포함한 여러 영어 및 다국어 데이터 집합의 조합을 사용해 학습됐다. 또한 구글은 모든 공백(특히 코드에 중요)을 보존하고, 어휘 목록에서 벗어난 유니코드 문자를 바이트로 분할하고, 숫자를 각 자릿수당 하나의 개별 토큰으로 분할하는 “무손실” 어휘 목록도 만들었다. 팜코더(PaLMCoder)는 파이썬 전용 데이터 집합으로 미세 조정된 팜 540B 버전이다. 팜E(PaLME) 팜E는 구글이 로봇공학용으로 2023년에 구체화한 멀티모달 언어 모델이다. 연구진은 팜을 가져와서 로봇 에이전트의 센서 데이터로 보완하여 “구체화(팜E의 ‘E’는 구체화를 의미)”했다. 또한 팜E는 팜 외에 ViT 22B 비전 모델도 채택했으므로 일반적인 기능의 비전 및 언어 모델이기도 하다. 바드(Bard) 바드는 구글이 2023년 출시한 람다 기반의 구글 대화형 AI 서비스다. 2023년 3월 21일에 출시된 후 2023년 5월 10일에 일반에 공개됐다. 바드는 출시 이후 여러 번 업데이트됐다. 2023년 4월에는 20개의 프로그래밍 언어로 코드를 생성하는 기능이 추가됐고, 2023년 7월에는 40가지 인간 언어 입력에 대한 지원과 함께 구글 렌즈가 통합되고 40개 이상의 언어를 사용한 텍스트투스피치 기능이 추가됐다. 라마(LLaMA) 라마(대규모 언어 모델 메타 AI)는 650억 매개변수를 사용하는 “원시” 대규모 언어 모델로, 메타 AI(전 메타FAIR)가 2023년 2월에 출시했다. 라마에 대한 메타의 설명은 다음과 같다. 대규모 언어 모델 분야에서는 라마와 같은 비교적 작은 기반 모델을 학습시키는 것이 바람직하다. 훨씬 더 적은 컴퓨팅 성능과 리소스만으로 새 접근 방식을 테스트하고 다른 사람들의 작업을 검증하고 새로운 사용 사례를 탐색할 수 있기 때문이다. 기반 모델은 레이블 없는 대량의 데이터 집합으로 학습되므로 다양한 작업을 위한 미세 조정에 이상적이다. 라마는 여러 크기로 출시됐으며 어떻게 구축되었는지에 대한 자세한 내용이 담긴 모델 카드가 제공된다. 메타 AI의 얀 르쿤에 따르면 원래는 체크포인트와 토크나이저를 요청해야 했지만, 정식으로 요청을 제출해서 모델을 받은 누군가가 4채널 사이트에 다운로드 가능한 토렌트를 게시한 덕분에 지금은 쉽게 구할 수 있다. 라마 2(Llama 2) 라마 2는 차세대 메타 AI 대규모 언어 모델로, 2023년 1월부터 7월 사이에 라마 1에 비해 40% 더 많은 데이터로 학습됐으며(공개적으로 사용 가능한 소스에서 2조 개의 토큰 사용), 컨텍스트 길이는 2배 더 긴 4096이다. 라마 2는 매개변수 70억 개, 130억 개, 700억 개의 여러 크기로 제공되고 사전 학습 및 미세 조정된 변형도 있다. 메타 AI는 라마 2가 오픈소스라고 주장하지만 허용되는 사용에 대한 제약이 포함됐다는 이유로 이 주장에 동의하지 않는 사람들도 있다. 커뮤니티 라이선스 외에 상용 라이선스도 제공된다. 라마 2는 최적화된 트랜스포머 아키텍처를 사용하는 자동 회귀 언어 모델이다. 조정된 버전은 지도 미세 조정(SFT)과 인간 피드백을 통한 강화 학습(RLHF)을 사용해서 유용성과 안전성에 대한 인간의 선호도에 맞게 조정된다. 라마 2는 현재 영어 전용이다. 모델 카드에는 벤치마크 결과와 탄소 발자국 통계가 포함돼 있다. 연구 논문 ‘라마 2: 개방형 기반과 미세 조정된 채팅 모델’에서 더 자세한 내용을 볼 수 있다. 클로드 2(Claude 2) 2023년 7월에 출시된 앤트로픽(Anthropic)의 클로드 2는 단일 프롬프트에서 최대 10만 개의 토큰(약 7만 단어)을 수락하며, 수천 토큰의 스토리를 생성할 수 있다. 클로드는 구조적 데이터를 편집, 재작성, 요약, 분류, 추출할 수 있으며 내용을 기반으로 한 Q&A와 그 외의 다양한 작업이 가능하다. 대부분의 학습은 영어로 이뤄졌지만 다른 여러 일반적인 언어에서도 잘 작동하며, 일반적이지 않은 언어로도 어느 정도의 커뮤니케이션이 가능하다. 프로그래밍 언어에 대한 지식도 방대하다. 클로드는 유용하고 정직하고 무해한(Helpful, Honest, Harmless, HHH) 모델로 학습됐으며 무해함을 강화하고 프롬프트를 통해 공격적이거나 위험한 출력을 생성하기가 더 어렵게 하기 위한 광범위한 레드 팀 과정을 거쳤다. 사용자의 개인 데이터를 학습에 사용하거나 인터넷에서 답을 참조하지 않지만, 사용자가 직접 클로드에 인터넷의 텍스트를 제공해서 그 내용으로 작업을 수행하도록 요청할 수는 있다. 클로드는 미국 및 영국 사용자에게 무료 베타 버전으로 제공되며, 생성형 AI 플랫폼인 재스퍼(Jasper), 코드 AI 플랫폼인 소스그래프 코디(Sourcegraph Cody), 아마존 베드록(Amazon Bedrock)과 같은 상업적 협력업체 채택됐다. 결론 살펴본 바와 같이 대규모 언어 모델은 여러 기업에서 활발하게 개발되는 중이며 오픈AI와 구글 AI, 메타 AI, 앤트로픽에서 거의 매달 새로운 버전이 나오고 있다. 이러한 LLM 중에서 진정한 인공 일반 지능(AGI)을 달성한 모델은 없지만 새 모델이 나올 때마다 대체로 지난 모델에 비해 개선되는 중이다. 다만 대부분의 LLM에서 환각을 비롯한 비정상적인 현상이 자주 발생하며, 경우에 따라 사용자 프롬프트에 대해 부정확하고 편향되거나 불쾌한 응답을 생산하기도 한다. 결국 출력이 정확함을 검증할 수 있는 경우에 한해서만 LLM을 사용해야 한다. editor@itworld.co.kr
누구나 널리 알려진 좋은 소프트웨어를 사용하고 싶지만, 사실 전문가용 프로그램은 개인이 구매하기에 너무 비싸다. 이럴 때는 실행 파일은 물론 소스 코드까지 다운로드할 수 있는 오픈소스 소프트웨어라는 대안이 있다. 무료 소프트웨어여서 그 품질과 기능에 의심이 들겠지만 걱정할 필요가 없다. 많은 오픈소스 소프트웨어가 전문가용 제품 못지않은 품질과 기능을 제공한다. 오피스부터 미디어 편집, 파일 관리 및 백업까지 분야별 최고의 오픈소스 애플리케이션을 모았다. 생산성 : 오피스, PDF 및 컨퍼런스 툴 컴퓨터에서 매일 하는 작업을 꼽으라면 무엇보다 문서 편집이다. 리브레오피스(LibreOffice)는 텍스트, 스프레드시트, 프레젠테이션을 작성하는 종합 오피스 패키지로, 2000년에 소스코드가 공개된 오픈 오피스(Open Office)에서 파생됐다. 오픈 오피스 프로젝트는 현재 아파치 오픈 오피스라는 이름으로 지속되고 있다. 리브레오피스의 빠른 업데이트 주기는 아파치 오픈 오피스보다 유리한 점이다. 최신 7.5 버전에서는 라이터(Writer)의 텍스트 문서 편집 기능이 개선돼 머리글의 서식이 향상됐고 표 삽입이 쉬워졌다. 컬러 북마크를 사용해 섹션을 더 쉽게 탐색하고 찾을 수 있다. 스프레드시트인 칼크(Calc)에서는 확장된 수식 보조 기능과 다이어그램을 위한 새로운 함수가 눈에 띈다. 드로우(Draw)와 임프레스(Impress)는 표를 더 쉽게 디자인할 수 있게 바뀌었고, EMF 그래픽을 더 빠르게 가져올 수 있다. 어두운 색의 사용자 인터페이스가 표시되는 다크 모드도 지원된다. 한편 여러 기기 간 문서 교환에 유용한 것이 바로 PDF 포맷이다. PDF 파일로 문서를 만들면 다른 운영체제와 모바일 앱에서도 문서가 깨지지 않고 똑같이 표시된다. 마킹, 메모와 같은 부가 기능을 사용해 신속하게 메모 또는 변경 요청을 문서화할 수 있고, 그룹 작업도 가능하다. 보통 많은 사람이 PDF 파일을 다루기 위해 무료 어도비 아크로벳 리더를 사용하지만, PDF 파일을 빠르게 보는 용도로는 오픈소스 프로그램인 수마트라 PDF(Sumatra PDF)가 있다. 구글 번역 및 딥엘(DeepL)을 통한 번역으로 연결되는 링크, 주석을 사용한 마커 삽입 등의 기능을 제공한다. 협업 툴도 살펴보자. 팀의 협업 형태는 코로나 시기를 거치면서 크게 변했다. 온라인 비디오 컨퍼런스가 이제 보편적으로 사용된다. 화상회의는 회의실이 불필요하고 출장을 갈 필요도 없으며 이동 중에도 참여할 수 있는 장점이 있다. 협업 툴에는 줌 또는 마이크로소프트 팀즈가 유명하지만, 오픈소스 대안으로 오픈 토크(Open Talk)가 있다. 오픈 토크 시스템은 클라우드에서 작동하며 웹사이트를 통해 바로 사용할 수 있다. 전화 걸기, 화면 공유, 투표, 회의 녹화 등 상용 경쟁 툴과 비슷한 기능을 제공한다. 이밖에 많은 기업이 이미 작업 그룹을 디지털 방식으로 관리할 텐데, 이 분야에는 매터모스트(Mattermost)가 있다. 그룹 채팅, 프로젝트 관리, 소리를 포함한 화면 공유 옵션 등을 지원하는 데스크톱, 모바일 및 온라인 시스템이다. 매터모스트 웹사이트의 무료 계정을 통해 사용할 수 있다. 회사 IT에 통합하려면 추가 소프트웨어가 필요하며, 기술 지원 및 IT 통합은 유료로 제공된다. 인터넷 : 브라우저와 이메일 메시징, 온라인 쇼핑, 인터넷 뱅킹은 많은 사람에게 없어서는 안될 요소로 자리잡았고, 이런 사이트에 액세스하려면 웹 브라우저가 필요하다. 많은 사용자가 구글 크롬을 선호하지만 크롬에는 개인정보 보호 문제가 있다. 인터넷 검색을 넘어서는 구글의 탐욕스러운 데이터 수집은 이미 악명이 높다. 대안은 언구글드 크로미엄(Ungoogled Chromium)이다. 크롬 웹 브라우저의 오픈소스 버전으로, 구글의 모든 액세스가 차단된다. 서핑 시 기능 제약은 없으며 크롬 웹 스토어의 확장 프로그램도 작동한다. 이메일 역시 PC에서 매일 사용하는 기능이다. 이메일은 속도가 빠르며 사진이나 문서, 다양한 데이터를 주고받기에 적합하다. 썬더버드(Thunderbird)는 많은 기능을 갖춘 무료 메일 프로그램이다. 여러 사서함과 다양한 전송 프로토콜, 주소록, 캘린더 등을 지원한다. 썬더버드 20주년을 맞아 개발팀은 앱 전체에 대한 전반적인 현대화를 진행중이다. 멀티 미디어 : 사진, 영상, DTP 및 디자인 디지털 사진의 인기가 계속되는 가운데, 김프(Gimp)를 사용하면 손쉽게 사진을 편집할 수 있다. 대비와 밝기를 조절하고 이미지를 더 선명하게 할 수 있다. 레이어, 마스크를 비롯한 이미지 몽타주 툴은 오래전부터 거의 모든 이미지 툴이 지원하는 표준 기능이다. 김프 버전 2.10부터는 배경 제거 툴이 추가됐고, 영역을 자르고 선택하는 툴도 포함된다. 또다른 오픈소스 이미지 편집 툴인 디지캠 포토 매니저(Digikam Photo Manager)는 사진 모음을 전체적으로 보여준다. 키워드, 평점, 컬러 마커를 기준으로 정렬하거나 사진의 메타데이터를 분석해 위치를 보여준다. RAW 이미지를 위한 편집 기능과 툴도 있다. 로우 테라피(RAW Therapee)도 RAW 사진 현상을 위한 다양한 툴과 이미지 보기 관리를 포함한 많은 RAW 옵션을 제공한다. 데스크톱 출판(DTP)용 문서 디자인 분야에는 잉크스케이프(Inkscape)와 스크라이버스(Scribus)의 조합을 추천한다. 잉크스케이프에서는 세밀한 일러스트레이션을 디자인할 수 있다. 곡선, 개체, 텍스트를 만드는 주요 기능을 지원하고, 요소 정렬, 색 채우기, 그라디언트 또는 그래픽 결합을 포함한 다양한 툴이 있다. 이 프로그램을 이용하면 확장 가능한 로고, 인포그래픽 및 기타 디자인을 빠르게 만들 수 있다. 이렇게 만든 요소는 스크라이버스의 페이지 디자인에 사용할 수 있다. 샘플 페이지와 자체 디자인된 표준 요소를 사용해 간단한 전단지 또는 메뉴뿐만 아니라 신문, 잡지도 만들 수 있다. PDF 형식으로 출력해 전문적인 인쇄까지 가능하다. 잉크스케이프와 스크라이버스는 JPG, TIF, PNG, SVG와 같은 다양한 그래픽 형식을 지원한다. 한편 그림을 그리고 스케치하고 색을 칠하는 작업을 컴퓨터에서 하는 경우가 늘어나고 있다. 그 결과 아티스트의 일러스트레이션, 그림 또는 개념 디자인까지 디지털로 받아 별도의 스캔 작업 없이 즉각 처리할 수 있는 세상이다. 이때 특수한 그래픽 프로그램을 사용하면 머리 속 아이디어를 바로 화면으로 옮길 수 있다. 크리타(Krita)가 대표적이다. 특수한 브러시 팁, 레이어, 효과, 마스크를 통해 이 과정을 지원한다. 애니메이션 옵션을 사용해 생기를 불어넣을 수도 있다. 그래픽 태블릿과 함께 사용하면 디지털 펜의 압력과 기울기까지 반영해 브러시 스트로크 또는 디지털 연필 스트로크를 표현한다. 3D 애플리케이션인 블렌더(Blender)도 있다. 나온지 30년이 넘은 이 유서 깊은 앱은 처음에 영화사에서 내부적으로만 사용되다가 2002년 오픈소스가 된 이후부터 개발 속도가 빨라졌다. 정교한 모델링과 텍스처 모듈 외에 애니메이션, 합성, 비디오 편집을 위한 기능도 제공한다. 플러그인 인터페이스와 스크립팅을 통해 사용자가 원하는 대로 확장하고 조정할 수 있다. 블렌더는 지원하는 기능이 워낙 다양해 쓰임새도 광범위하다. 예를 들어 스파이더맨 2와 원더우먼 등 헐리우드 영화 제작에도 이 툴이 사용됐다. 나사(NASA)는 인터렉티브 웹 애플리케이션인 익스피리언스 큐리오시티(Experience Curiosity)에 블렌더를 사용했다. 영상 재생기로는 VLC 미디어 플레이어가 압도적이다. 구형 휴대폰 촬영 영상부터 새로운 고해상도 4K 클립까지 VLC로 재생할 수 없는 형식은 거의 없다. 재생 목록 사용하기, 온라인 비디오 및 팟캐스트 검색, 홈 네트워크를 사용한 스트리밍 등으로 다양한 용도에 맞게 사용할 수 있다. 잘 알려져 있지는 않지만 비디오 변환 기능도 유용하다. 샷컷(ShotCut)은 비디오 편집에 유용하다. 비디오를 보고 자르고 배열하는 용도로 사용된다. 비디오, 오디오, 전환, 효과 믹싱을 위한 유연한 타임라인도 제공한다. FFmeg 프레임워크를 설치하면 다양한 비디오 형식을 가져오고 내보낼 수 있다. 많은 사용자가 마이크로소프트의 미디어 플레이어를 사용해 음악 파일을 관리한다. 미디어 플레이어는 디지털화, 재생, 다른 기기로의 스트리밍을 지원하는 좋은 툴이지만 시스템 리소스를 과도하게 쓰는 단점이 있다. 이럴 때 사용할 수 있는 오픈소스 대안이 도파민(Dopamine)이다. 훨씬 더 가벼우면서도 많은 관리 기능, 재생 목록, 통합 이퀄라이저를 제공한다. 또한 온라인에서 노래 가사를 불러오고 Last.fm 및 디스코드를 통합할 수 있다. 포터블 버전이 특히 유용하다. 음악이 들어 있는 USB 드라이브에 설치해 두면 다양한 컴퓨터에서 사용할 수 있으며 곡 데이터베이스는 항상 최신 상태로 유지된다. 이 기능은 로컬 네트워크에서도 작동한다. 보안과 관리 : 데이터 및 시스템 백업 중요한 데이터와 시스템 파티션은 반드시 정기적으로 백업해야 하는데, 문서, 사진 및 음악 백업에 안성맞춤인 오픈소스가 바로 듀플리카티(Duplicati)다. 설치하고 시작하면 백그라운드에서 작동하며, 데이터 선택, 스케줄 등의 구성은 브라우저 인터페이스를 통해 할 수 있다. 하드 디스크, 네트워크 드라이브, USB 스토리지 디바이스 또는 인터넷의 서버를 백업 파일 저장 대상으로 설정할 수 있다. FTP, WebDAV와 같이 잘 알려진 전송 프로토콜 외에 드롭박스, 아마존, 구글과 같은 클라우드 서비스 액세스도 지원한다. 저장된 데이터를 압축하며 AES256으로 암호화한다. 전체 파티션 또는 하드 드라이브 백업에 적합한 또다른 오픈소스 앱이 클론질라(Clonezilla)다. CD 또는 USB 드라이브에 부팅 가능한 복구 시스템을 만든 다음 이를 사용해 하드 디스크 또는 개별 파티션의 이미지를 만든다. 하드웨어 장애가 발생하면 클론질라로 시스템을 재시작하고 이미지 데이터를 복원하면 된다. 백업 저장 대상으로는 로컬 스토리지 기기 또는 네트워크 드라이브를 설정할 수 있다. 클론질라는 NFS 또는 WebDAV를 통해 연결을 설정해 인터넷의 서버로도 데이터를 백업할 수 있다. 한편 문서나 사진을 파일 단위로 공유하는 방법은 많다. 단, 클라우드나 이메일을 통한 공유는 많은 경우 보안 위험이 따르므로, 민감한 데이터의 경우 암호화된 연결을 사용하는 것이 좋다. 이처럼 안전한 파일 교환이 필요할 때 쓸 수 있는 앱이 어니언셰어(Onionshare)다. 어니언셰어는 토르(Tor) 브라우저에 적용돼 사용자 정보를 익명화하는 어니언(Onion) 기술을 활용해 데이터의 안전한 교환을 구현한다. 즉, 전송의 경우 수신자가 검색할 수 있는 어니언 주소를 생성하고, 데이터 암호화 자체가 부가적인 보안을 형성한다. 발신자는 수신자가 전송 잠금을 해제할 수 있는 개인 키를 정의한다. 어니언셰어에는 파일 공유 기능 외에 채팅 옵션과 토르 네트워크를 통해 안전하게 웹사이트를 제공하는 웹 서버 기능도 있다. 그밖에 유용한 오픈소스 애플리케이션 ZIP 형식은 여러 파일을 하나의 패키지로 합치고 데이터를 압축한다. 파일을 압축하면 메일 또는 클라우드를 통해 더 빠르게 전송할 수 있다. 이런 ZIP 압축 프로그램 중 가장 유명한 오픈소스 앱이 7Zip이다. 7Zip은 ZIP 압축 파일을 열고 생성하며 파일을 추가 또는 제거할 수 있고 원하는 경우 윈도우 탐색기의 컨텍스트 메뉴에 통합할 수 있다. 이렇게 하면 ZIP을 열고 만드는 작업을 빠르게 불러올 수 있다. 7Zip을 이용하면 ZIP 파일을 지원할 뿐만 아니라 RAR, TAR, BZIP2, GZ, ARJ, LHA, LZH와 그 외의 많은 형식도 읽을 수 있다. 민감한 데이터가 포함된 파일이라면 AES 크립트(AES Crypt)를 사용해 손쉽게 암호화할 수 있다. 파일을 암호화하면 인터넷을 통해 전송할 때도 안전하게 보호할 수 있다. AES 크립트를 설치하면 윈도우 탐색기의 컨텍스트 메뉴에 새 항목이 생긴다. 암호화를 실행하려면 마우스 오른쪽 버튼으로 하나 이상의 파일을 클릭하고 컨텍스트 메뉴의 “AESCrypt”를 클릭한다. 이후 열리는 창에서 비밀번호를 입력하고 확인을 누르면 된다. 비밀번호를 입력해야만 데이터에 대한 액세스를 허용하는 256비트 보안 파일을 생성한다. 이런 파일을 열려면 마우스 오른쪽 버튼을 다시 클릭하고 AES크립트 항목을 선택한 다음 비밀번호를 입력해야 한다. editor@itworld.co.kr
대규모 언어 모델(LLM)을 기반으로 하는 챗GPT, 클로드(Claude), 바드(Bard)를 비롯한 공용 생성형 AI 챗봇도 충분히 좋지만, 이와 같은 범용 챗봇은 엔터프라이즈 워크플로우에 매끄럽게 통합되지는 않는다. 기업 직원이 별도의 앱을 사용하거나, 회사가 시간과 노력을 들여 애플리케이션 프로그래밍 인터페이스를 통해 자체 애플리케이션에 AI 기능을 추가해야 한다. 또한 챗GPT 및 기타 생성형 AI 챗봇을 사용하기 위해서는 직원이 프롬프트 엔지니어링에 대해서도 배워야 한다. 반면, 임베디드 생성형 AI는 직원이 이 기술을 가장 필요로 하는 곳, 즉 기존 워드 프로세싱 애플리케이션과 스프레드시트, 이메일 클라이언트를 비롯한 기타 엔터프라이즈 생산성 소프트웨어에 새로운 AI 기능을 구현해주며, 이를 위해 회사가 따로 해야 할 일도 없다. 제대로 구현되면 직관적으로, 단절 없이 새로운 AI 기능을 사용할 수 있게 되므로 어려운 생성형 AI 사용법 학습 과정 없이 모든 혜택을 누리게 된다. 포레스터는 최근 북미와 영국의 기술 의사 결정자를 대상으로 한 설문조사 결과를 근거로 2025년까지 거의 모든 기업이 쓰기 및 편집을 포함한 커뮤니케이션 지원 용도로 생성형 AI를 사용하게 될 것으로 예측했다. 실제로 설문 응답자의 70%는 쓰기 또는 편집 작업의 대부분 또는 전체에서 이미 생성형 AI를 사용하고 있다고 답했다. 그러나 포레스터에 따르면 챗GPT 같은 독립적인 생성형 AI 툴은 교차 직무 협업을 지원하지 못하며 직원이 업무를 수행하는 부분에서 작동하지도 않는다. 포레스터는 설문조사 보고서에서 “많은 사용 사례에서 생성형 AI는 독립형 앱보다는 임베디드 기능일 때 더 큰 혜택을 제공한다는 의미”라고 설명했다. IBM 컨설팅의 글로벌 AI 및 분석 부문 리더 매니시 고얄 역시 “아무리 좋은 AI를 가져오더라도 정작 사람들이 워크플로우에서 AI를 사용할 수 없다면 채택되지 않는다"라고 말했다. 임베디드 생성형 AI와 관련하여 현재 가장 큰 화제는 마이크로소프트 365 생산성 제품군 전반에 통합 구축되고 있는 생성형 AI 비서인 마이크로소프트 365 코파일럿이다. 일부 생성형 AI 기능은 팀즈 및 기타 마이크로소프트 365 앱에 구현됐지만 코파일럿 자체는 아직 정식 출시되지 않았고 테스트를 위한 초기 액세스가 허용된 기업은 600개에 불과하다. 마이크로소프트 365 코파일럿의 정식 출시를 손꼽아 기다리고 있는 솔루션 통합업체 인사이트(Insight)의 최고 엔터프라이즈 설계자 겸 CTO 데이비드 맥커디는 “데모를 본 사람이라면 생성형 AI의 통합이 백오피스가 돌아가는 방식을 완전히 바꿔 놓게 될 것임을 알고 있다"라고 말했다. 한편 일부 기업은 오픈AI에 대한 API를 통하거나 라마 2(Llama 2) 같은 LLM을 로컬로 실행해서 자체 앱에 생성형 AI를 직접 추가하고 있다. 예를 들어 인사이트는 API를 통해 마이크로소프트 엑셀에 생성형 AI를 내장했다. 맥커디는 “다만 향후 오피스 365에 통합될 것이기 때문에 이 부분에 대한 개발을 너무 많이 하지는 않고 있다"라고 말했다. 자체 AI 임베드를 만드는 데 필요한 시간이나 인력을 갖추지 못한 기업도 지금 생산성 툴 내에서 생성형 AI 사용을 시작할 수 있다. 많은 업체가 이미 앱에 다양한 생성형 AI 기능을 추가했기 때문이다. 예를 들어 줌, 마이크로소프트 팀즈를 비롯한 여러 온라인 회의 플랫폼은 내장형 또는 애드온 방식으로 AI 기반 요약 기능을 제공한다. 맥커디는 “이 기능이 회의 요약 방식을 완전히 바꾸어 놓았다. 요약 기능이 매우 유용한다는 점은 확실히 말할 수 있다. 큰 이득이 없는 기능도 많지만 요약과 목록 작성만큼은 최고”라고 말했다. 일부 기업에서 워크플로우에 생성형 AI를 어떻게 사용하고 있는지, 어느 부분에서 효과적인지, 그리고 생성형 AI를 안전하게 도입하기 위한 전략은 무엇인지 알아보자. 스트림 파이낸셜 : 이메일, 텍스트 문서, 코드의 생성형 AI 미국 솔트레이크시티에 소재한 핀테크 기업 스트림 파이낸셜 테크놀로지(Stream Financial Technology)의 엔지니어링 책임자인 조완자 조셉은 “우리가 사용하는 스파크(Spark)라는 이메일 클라이언트에는 이메일 요약과 작성을 위한 생성형 AI가 내장돼 있다"라고 말했다. 조셉은 “나도, 경영진도 대부분 긍정적이다. 유일하게 부정적으로 보는 부분은 AI가 이해 부족을 가리는 허울이 될 수 있다는 점이다. 즉, 글을 읽다가 말이 안 되는 부분이 있어서 지적하면 AI가 써서 그렇다고 둘러댈 수 있다는 점”이라고 말했다. 스트림 파이낸셜이 사용하는 또 다른 생성형 AI 툴은 마이크로소프트 워드, 구글 문서도구를 비롯한 많은 애플리케이션 내에서 작동하는 그래멀리(Grammarly)다. 그래멀리는 처음에는 단순한 문법 검사기였지만 최근 AI 기반의 텍스트 생성, 문구 수정 및 요약 기능까지 더했다. 조셉은 “그래멀리 기업 구독을 이용하고 있다. 구글 문서 도구 내에서 작동하며, 단락을 쓰거나 요약하도록 지시할 수 있다. 내용을 채워 넣고 요약하는 용도로는 좋지만 기술적인 분야에 대한 심층적인 내용은 다루지 못한다"라고 말했다. 조셉이 지적한 그래멀리 AI의 문제점은 각각의 상호작용이 별개라는 점이다. 챗GPT, 클로드와 같이 대화를 계속 주고받으면서 결과물을 세밀하게 다듬을 수가 없다. 조셉은 “그래멀리 AI에 무엇을 해야 할지 지시할 좋은 방법이 없다"라고 말했다. 조셉은 회사 측이 기밀 데이터 또는 고객 정보에 대해서는 공용 AI를 사용하지 않도록 주의한다고 강조했다. 조셉은 “장기적 관점에서 생성형 AI를 사용해 마케팅 문구와 같은 콘텐츠를 생성하는 데 대해 낙관적이다. A/B 테스트를 위한 다른 문구를 작성하거나 동일한 문구를 다양한 형태로 반복 생성할 수 있다"라고 말했다. 조셉은 생성형 AI가 가장 크게 영향을 미치는 부분은 코드 생성이라면서 “깃허브 코파일럿에 1인당 월 19달러를 내고 있는데, 그 5배라 해도 기꺼이 낼 것이다. 막대한 시간을 절약할 수 있게 해주며 지식도 상당한 수준”이라고 말했다. 조셉은 “코드 생성은 생성형 AI의 가치가 입증된 부분이다. 그 외의 모든 부분은 아직 단언할 수 없고, 갈 길이 멀다"라고 말했다. NFP : 마케팅 문구, 회의 요약에 생성형 AI 사용 보험 중개업체 NFP는 2년 전부터 텍스트 작성에 AI를 사용해왔다. 이 회사의 영업 지원 부문 SVP인 카일 힐리에 따르면 NFP는 챗GPT가 대중에 공개되기 훨씬 전부터 재스퍼(Jasper) AI를 사용해서 마케팅 문구를 작성했다. 처음 오픈AI의 GPT 3.5 대규모 언어 모델을 기반으로 2021년 2월 출시된 재스퍼는 화이자, 스포츠 일러스트레이티드(Sports Illustrated), 허브스팟(HubSpot), 센티넬원(SentinelOne)을 포함한 10만 곳 이상의 기업 고객을 두고 있다. 현재 재스퍼 AI는 가장 진보된 버전의 챗GPT와 같은 기반 모델인 GPT 4를 사용한다. 여기에 특정 사용 사례에 따라 맞춤화된 마케팅 또는 비즈니스 콘텐츠를 생성하도록 설계된 부가적인 모델과 세부적인 조정 등 비즈니스 친화적인 기능을 추가했다. 또한 회사 자체 브랜드 성격을 학습시키고, 회사 워크플로우 내에서 확장 기능 및 API를 통해 사용할 수 있다. 힐리는 “보안에 대해 일부 우려가 있었다. 그리고 재스퍼는 폐쇄형 시스템이다. 마케팅 부서에서 일부 카피라이팅 작업에 여전히 재스퍼를 사용하고 있다"라고 말했다. 최근 NFP는 재스퍼에서 영업 활동 지원 플랫폼인 세일즈로프트(Salesloft)에 내장된 생성형 AI 툴로 대부분 전환했다. 세일즈로프트는 지난 봄에 빠른 이메일 작성을 위한 생성형 AI 기능을 추가했다. 힐리는 “CRM 시스템의 안내 및 코칭에도 생성형 AI를 사용하기 시작했다. AI 툴이 모든 부분에 연결되기 시작하면서 이제는 더 많은 프로그램에서 GPT를 사용하고 있다. 마이크로소프트 생태계 전반에 완전히 내장된 형태”라고 말했다. 힐리 본인도 생성형 AI를 적극적으로 사용한다. 힐리는 “2023년 비즈니스 계획 전체를 AI를 사용해 작성했다”면서 “AI의 효과에 대해 내부적인 설득 작업을 진행하던 중에 고위직의 누군가가 AI가 아직 그 수준에 이르지 못했다고 말했다. 그래서 오기로 비즈니스 계획을 AI로 만들어서 제출했는데, 반응이 아주 좋았다. 로봇이 작성한 것으로 믿기지 않는다는 반응이었다"라고 말했다. 힐리는 “사모펀드 분야에서 일하는 영업팀의 고위급 직원도 리드를 작성하고 계약을 체결하는 데 AI를 사용하기 시작했다. 올해 초부터 경영진, 영업부서를 비롯해 많은 직원이 AI를 사용하고 있다. 이들은 ‘AI를 채택해야만 한다’고 말한다"라고 전했다. NFP는 마이크로소프트 팀즈에서도 생성형 AI를 사용해서 회의 노트를 자동으로 생성한다. 힐리는 “모두가 이해해야 할 중요한 점은 AI가 우리 일을 대체하는 것이 아니라 증폭하고 보강한다는 것이다. 같은 수의 사람으로 더 많은 일을 할 수 있게 해준다"라고 말했다. 힐리는 다음 단계는 세일즈포스의 생성형 AI 기능을 사용해서 원시 데이터를 해설적 데이터로 바꾸는 것이라며 “지금 이 부분을 추진하고 있다. 이를 통해 경영진은 자연스럽게 느껴지는 방식으로 정보를 흡수할 수 있게 된다. 예를 들어 나처럼 숫자에 서툴고 항상 숫자에서 막힌다면 숫자가 아닌 다른 방식으로 정보를 흡수할 수 있게 될 것”이라고 말했다. 생성형 AI 툴을 사용할지 여부를 결정할 때 중요한 것은 학습 데이터의 정확성과 개인정보 보호, 보안, 그리고 사용성이다. 힐리는 “영업 및 마케팅 문구에서는 사유 부분을 다루지 않는다. 그러나 NFP는 인수합병을 많이 한다. 법무팀이 AI를 사용해서 계약서를 더 빠르게 만들거나 미묘한 차이 또는 세부 사항을 찾을 수 있을까? 개인정보 보호와 보안, 클로즈드 소스 모델을 살펴봐야 한다"라고 말했다. 힐리는 지금은 영업 담당자가 새로운 AI 툴을 익히도록 하는 작업을 진행 중이라면서 “간소함과 사용의 용이함이 중요하다. 자연스럽게 느껴지는지, 마음을 먹고 사용법을 배워야 하는지가 관건”이라고 말했다. 힐리는 예를 들어 챗GPT는 사용하기가 쉽지 않았다면서 “챗GPT에 말을 하기 위해서는 거의 정해진 코스에 따라야 한다. 어떤 면에서는 프로그래밍과 상당히 비슷하다. 하지만 NFP는 기술 기업이 아니고 보험을 판매하는 회사”라고 말했다. 직원이 이미 사용하는 툴에 내장된 형태의 생성형 AI는 이러한 사용성 장벽을 극복하는 데 도움이 될 수 있다. 힐리는 “예를 들어 세일즈로프트는 반복적이고 유기적이다. 생성형 AI는 이 툴의 자연스러운 확장이다. 새로운 것을 배울 필요가 없다는 것이 NFP에는 중요한 점이다. 35년째 일하는 보험 담당자도 바로 사용할 수 있고, 25세 직원이라면 시스템 전체를 지극히 자연스럽게 받아들인다"라고 말했다. 톰슨 로이터 : 서신 초안 작성, 직원 질문에 대한 응답에 생성형 AI 사용 뉴스 기업 톰슨 로이터(Thomson Reuters)의 최고 인사 책임자인 매리 앨리스 부이식은 수십년 전부터 제품과 사무실에서 AI를 사용해왔다면서 “이미 존재하는 많은 부분에 AI가 내장돼 있다. 핵심은 증강, 즉 사람들이 더 가치 있는 일을 할 수 있도록 해주는 데 있다"라고 말했다. 부이식은 AI는 사람이 아니라 “작업을 대체한다"라고 말했다. 생성형 AI가 보편화된 지금 톰슨 로이터는 선제적으로 공급업체에 관심을 갖고 이들의 AI 로드맵을 살펴봤다. 부이식은 이미 많은 부분이 발표됐다고 말했다. 예를 들어 세일즈포스와 워크데이(Workday) 모두 생성형 AI 전략을 마련했다. 부이식은 “마이크로소프트 코파일럿과 그 외에도 수많은 툴이 있다"라고 말했다. 부이식은 톰슨 로이터에서 이미 많은 생성형 AI 툴이 사용되고 있다고 말했다. 예를 들어 커뮤니케이션 팀은 AI를 사용해서 문서의 초안을 작성한다. “실제로 작업의 첫 번째 초안 작성에서 전반적으로 AI 툴을 사용할 여지가 있다. 다만 정확성은 AI에 의지할 수 없고 교육에서도 이 부분을 다뤘다. 처음 초안이 작성된 다음에는 사람이 편집한다. 즉, 사람의 전문성을 적용해서 더 높은 품질의 제품을 제공한다"라고 말했다. HR 분야에서는 생성형 AI를 사용해 직원 질문에 답하기와 관련한 실험이 진행 중이다. 부이식은 “초기 결과는 매우 만족스럽다. 지금까지 정확도는 95%이며 과거 이러한 질문에 답하느라 빼앗겼던 시간을 돌려줘서 부가가치를 창출하는 일에 투자할 수 있게 해준다"라고 말했다. 생성형 AI 도입을 위한 세 갈래 접근 부이식은 톰슨 로이터는 가능성에서 앞서 나가기 위해 AI 도입을 가속화하기 위한 전사적 이니셔티브를 출범했다고 말했다. 첫 번째 단계는 AI 표준과 윤리의 정립으로, 몇 년 전부터 해오고 있다. 부이식은 “톰슨 로이터는 30년 이상 AI를 사용하고 있다. 생성형 AI 이전에도 이 분야의 리더가 되기 위해 노력했다"라고 말했다. 부이식은 “다음 단계는 인력 교육이다. 이는 반드시 필요한 단계”라고 말했다. 톰슨 로이터는 지난 4월 전세계 모든 직원이 참여할 수 있는 AI 교육의 날을 열었다. 총 2만 7,000명의 직원 중 약 7,000명이 라이브로 이 이벤트에 참석했다. 부이식은 “그 외에도 수천 명이 비동기적으로 이 교육 자료를 활용하고 있다"라고 덧붙였다. 부이식에 따르면 참가자의 대다수는 이미 자신의 업무에 생성형 AI를 적용할 수 있다고 말했다. 부이식은 “이는 로이터 직원 대부분이 앞으로 일하면서 겪게 될 가장 중요한 혁신이다. 우리는 이 부분에서 선두에 서야 한다. 회사 측은 교육과 개발, 업스킬 및 리스킬에 대한 책임이 있다. 그러나 모든 개인도 배우고 발전해야 할 책임이 있다"라고 말했다. 톰슨 로이터 AI 전략의 세 번째 축은 모든 툴을 실험할 수 있는 안전한 장소를 제공하는 것이다. 부이식에 따르면 톰슨 로이터는 생산성 소프트웨어에 내장된 생성형 AI 외에도 오픈AI, 앤트로픽, 구글, 그리고 라마 2와 같은 오픈소스 모델을 포함한 다양한 대규모 언어 모델을 실험하고 있다. 부이식은 “변화의 속도가 매우 빠르다. 톰슨 로이터는 고객 사용 사례를 위해 최선의 기술을 활용하고자 한다"라고 말했다. 마지막으로, 이 회사는 학습과 실험의 문화를 강화하고 있다. 부이식은 “가장 빠르게 배우고 실험하는 팀이 승리하게 될 것”이라고 말했다. 위험을 고려해서 현명하게 선택하기 몇몇 엔터프라이즈 기술 업체는 생성형 AI 기능뿐만 아니라 모델을 학습시키는 방법 또는 사용할 구체적인 모델에 관한 유연함도 고객에 제공한다. IBM 컨설팅의 고얄은 “IBM은 세일즈포스를 사용한다. IBM의 세일즈포스 관리자는 나와 같은 최종 사용자가 그냥 볼 수 있도록 적절한 모델을 선택하고 구성할 수 있다. 세일즈포스는 임베디드 AI를 선택할 수 있는 옵션도 제공한다"라고 말했다. 고얄은 IBM 컨설턴트가 현재 기업과 협력해서 마이크로소프트 365를 비롯한 과련 기술로 무엇이 가능한지, 그리고 법률 및 보안 측면에서 생성형 AI가 어떤 영향을 미치는지에 대해 생각하도록 돕고 있다고 말했다. 고얄은 “IBM의 왓슨x(Watsonx)에 대한 입장은 확고하다. 고객의 데이터는 고객의 소유라는 것이다. IBM은 모델 학습에 고객 데이터를 절대 사용하지 않는다. 애저, AWS, 구글과 협력하고 있으며 이들 각 기업은 생성형 AI의 이 부분에 있어 예전부터 명확한 입장을 유지하고 있다. IBM의 파트너 및 고객 역시 마찬가지다. 고객이 업로드하거나 서비스에 사용하는 어떠한 데이터도 모델 학습에 사용되지 않는다. 그렇지 않으면 어떤 기업도 AI를 사용하지 않을 것”이라고 말했다. 이 원칙을 위반한 엔터프라이즈 업체의 예로 줌이 있다. 줌은 처음에 회의 녹취록을 AI 학습에 사용할 것이라고 말했다가 격렬한 반발에 직면해 황급히 철회한 바 있다. 그러나 초기 학습 데이터의 출처에 대해서는 업체의 투명성이 부족하다. 고얄도 그 점을 인정하면서 “왓슨x는 학습 데이터에 대한 완전한 데이터 계보를 제공한다. 그러나 모든 업체가 그렇지는 않다. 명확하게 밝히지 않는 경우가 많다"라고 말했다. 또한 몇몇 AI 업체는 저작권이 있는 상품을 허가 없이 AI 학습에 사용했다는 이유로 아티스트 및 작가로부터 피소된 상황이다. 고얄은 “AI에는 항상 위험이 있었다"라고 말했다. 대규모 언어 모델에는 과거의 오래된 위험이 더 증폭된 경우도 있고 새로운 위험도 있다. 고얄은 “기업은 생성형 AI를 사용할 때 가드레일을 설치해야 한다"라고 말했다. 그러나 기업에 결국 중요한 것은 이러한 새로운 기능을 어떻게 사용할 수 있을지를 살펴보는 것이다. 고얄은 “그 방법을 가장 빠르게 파악하는 기업이 승자가 되고 꿈처럼 보이는 일을 현실화할 수 있을 것”이라고 말했다. editor@itworld.co.kr
대학교와 회사, 집에서도 노트북은 현대 사회에서 거의 필수 아이템이다. 하지만 제품 선택과 관리에는 많은 고민이 따른다. 용도에 맞는 사양과 운영체제, 이동성을 고려한 크기와 무게, 저장 공간, 디스플레이 성능, 배터리와 같은 기본적인 요소부터 터치스크린이나 백라이트 키보드, 지문 인식 같은 부가 기능 등 수십 가지 기준 중에서 우선순위를 결정해야 한다. 누군가는 무조건 최신 제품을 구매하는 것을 선호하지만, 상황에 따라서는 구형 모델을 구입하는 것도 나쁘지 않은 선택이다. 노트북을 구매하기 전 참고하면 좋을 가이드와 함께 쾌적한 사용 환경을 만드는 데 도움이 되는 노하우를 모았다.
생성형 AI의 도입이 확산되면서 소프트 스킬의 중요성이 더욱 강조되고 있다. 커뮤니케이션, 팀워크, 리더십, 갈등 관리와 같은 인간적인 기술은 여전히 필수적이다. 링크드인에 따르면, AI의 영향력이 커질수록 소프트 스킬에 대한 수요도 증가한다. 기업은 AI 도구와 기술에 투자하는 동시에 직원이 소프트 스킬을 개발하도록 지원해야 하며, 더 포용적이고 창의적인 업무 환경을 조성할 수 있다. 소프트 스킬은 면접과 실무에서도 중요한 요소로 작용하며, 기업의 성공에 기여하는 핵심 역량으로 자리잡고 있다.
그리 어려울 것도 없었던 노트북 고르기가 조금 더 복잡해졌다. 에이수스 비보북 S 15 OLED, 서피스 프로 2024년형 등 인텔이나 AMD가 아니라 퀄컴의 스냅드래곤 X 엘리트 SoC가 탑재된 제품이 속속 모습을 드러냈다. 하지만 복잡하다는 것이 꼭 나쁜 것만은 아니다. 서피스 프로 같은 고급 제품 가격이 낮아졌다. 가벼운 작업, 평범한 사무 생산성 작업에는 성능과 배터리 사용 시간이 '충분'을 넘어 거뜬할 정도다. 모든 신제품이 압도적으로 뛰어날 수만은 없다. 퀄컴 버전 노트북은 더 많은 선택지를 제공하고 변화를 이끌어내는 시작이다.
불과 2년 전만 하더라도 시장 가치 4,000억 달러짜리 엔비디아가 마이크로소프트와 애플을 넘어 시가 총액 1위의 기업이 될 것이라고 생각한 사람은 드물 것이다. 하지만 생성형 AI의 열풍 속에 오랫동안 AI 중심의 GPU 생태계를 구축한 엔비디아의 전략이 빛을 발했다. 엔비디와 관련된 기사를 검색해보면, 이제는 엔비디아와 협력하지 않는 기업도 없고 엔비디아가 영향력을 미치지 않는 분야도 없는 것처럼 보인다. 3조 4,000억 달러의 시가 총액이 저평가된 것이란 주장에도 고개가 끄덕여지고, 엔비디아와 각을 세우는 몇몇 업체가 안타깝게 느껴질 정도이다. 엔비디아의 현재 위상을 실감할 수 있는 기사를 간추렸다.
아시아 최대 IT 박람회 '컴퓨텍스 2024'가 막을 내렸다. 'AI를 연결하다'라는 주제로 진행된 올해 행사에서는 지난해 등장한 'AI PC'라는 개념이 단순한 브랜딩 수준에서 보다 더 실용적이고 구체적인 기능으로 다가왔다. 인텔과 퀄컴, AMD는 AI PC용 칩을 집중 조명하며 저마다 자신감을 내비쳤고, 엔비디아는 차세대 AI GPU인 루빈을 처음으로 공개했다. PC 제조업체는 AI 전용 프로세서를 탑재한 코파일럿+ PC 신제품을 선보였다. 이외에도 화려한 AI 성능만큼 주목할 만한 다양한 주변 기기도 돋보였다. 컴퓨텍스 2024를 장식한 주요 소식을 모았다.
몇 년 전만 해도 고급 사용자만 썼던 VPN은 이제 한층 더 보편적인 애플리케이션으로 자리잡았다. 네트워크 데이터를 암호화하는 VPN 기술은 온라인 개인정보를 보호하고 지역 제한 없이 스트리밍이 가능해 인터넷 사용 영역을 확대하는 이점을 지니고 있다. 지금은 VPN 서비스의 고급 기능과 범위를 이해하고 광고와 트래커 차단 등 추가 서비스를 고려하기에 더할 나위 없이 좋은 시점이다.
비트코인 채굴에 납치된 GPU 때문에 울었던 게이머들이 이제는 AI 때문에 눈물을 흘리게 됐다. 물론, 게임용 GPU와 AI용 GPU는 다른 범주의 제품이지만, 엔비디아의 한정된 생산량에서 AI용 GPU가 차지하는 비중이 커지면 게임용 GPU는 또다시 공급 부족을 겪게 된다. 부족한 것은 GPU만이 아니다. AI용 GPU의 핵심 요소인 고성능 HBM 메모리도 폭발적인 AI 인프라 수요에 공급 부족을 겪고 있다. 대형 IT 업체는 AI 전용 데이터센터를 새로 짓겠다고 나서는데, 기존 데이터센터로는 생성형 AI 워크로드를 감당하기에 프로세서는 물론 냉각과 전력까지 총체적으로 역부족이기 때문이다. 모든 AI 시스템에 GPU가 필수는 아니라는 지적도 나온다. 엔비디아는 이제 누구도 막을 수 없는 AI 시장의 거물로 우뚝 섰으며, 추격에 나선 AMD는 새삼 AI와 GPU에 집중하고 있다. 한편으로, 마이크로소프트나 오픈AI, 구글 등은 GPU의 대안이 될 AI 전용 칩을 개발하느라 분주하다
'대회전'. 특정 시기, 일정 장소에 모여서 벌이는 대규모 전투를 가리키는 이 말이, 최근 CPU 시장에 꼭 맞는다. 공격은 역시 후발주자다. '영원한 이인자' AMD는 국내 판매량에서 인텔을 따라잡았다. 퀄컴은 스냅드래곤 X 엘리트를 내놓았고, 엔비디아는 PC용 CPU를 만들고 있다. '가진 게 많은' 일인자 인텔은 엎친 데 덮쳤다. 13, 14세대 일부 CPU의 오류를 놓고 협력업체와 '네 탓' 공방 중이다. 애플은 '남의 집 불구경'이다. 2020년 인텔과 손절한 후 자체 CPU로 모든 제품을 전환했다. 선택의 폭이 넓어지는 것은 사용자 입장에서 언제나 옳다.
지난주 메타가 발표한 라마 3가 좋은 반응을 얻으면서 어떤 LLM을 선택할지, 혹은 SLM을 고려해도 될지 기업의 선택이 더욱 복잡해졌다. GPT-4나 라마 3 같은 LLM은 강력하고 다재다능하며, 복잡한 작업을 이해하므로 많은 가능성을 제시한다. 반대쪽에 선 것은 민첩하고 전문화되며 특정 사용례에 맞게 미세조정할 수 있고, 예산친화적인 SLM이다. 이번주에는 마침 마이크로소프트가 3종의 SLM 파이-3 시리즈를 공개하며 관심을 얻었다. AI 세계가 계속 발전하는 가운데 올바른 AI 모델 선택은 혁신의 판도를 바꿀 수도 있다.
생성형 AI 열풍에 밀려 관심에서 멀어지는 것처럼 보였던 양자 컴퓨팅이 다시 활기를 띄고 있다. 마이크로소프트가 큐비트의 안정성을 획기적으로 개선해 레벨 2, 즉 복원력 있는 양자 컴퓨팅 단계에 도달했다고 발표한 것이다. 양자 컴퓨팅이 실전에 활용되기 보다는 실험 단계에 머무르면서 생성형 AI처럼 당장 활용할 수 있는 기술에 관심을 빼앗긴 것은 당연한 일일 것이다. 하지만 관심이 식었다고 개발이 중단되는 것은 아니다. 더구나 마이크로소프트는 몇 년 안에 1,000큐비트 수준의 상용 양자 컴퓨팅을 실현할 수 있을 것이라고 자신감을 보였다. 양자 컴퓨팅 관련 최근 기사를 간추렸다.
레모키 G1 와이어리스(Lemokey G1 Wireless)는 키크론의 서브 브랜드인 레모키 제품이지만, 키트론 메인 제품군에 속하는 마우스만큼 뛰어난 게이밍 마우스다. 초경량 대칭형 디자인, 그립감이 좋은 섀시, 매우 부드러운 움직임이 결합돼 뛰어난 핸들링을 제공한다. 이 마우스의 진정한 차별점은 센서다. 두 가지 센서를 선택할 수 있으며, 두 센서 모두 무선 모드에서 8,000Hz 폴링 레이트를 제공한다. 이는 모든 클릭을 KD 집계에 활용하고자 하는 FPS 게이머에게 유용하다. 만듦새 초경량 디자인으로 부드러운 움직임을 제공한다. 무게는 55g이다. G1보다 1g 더 가벼운 에이수스 ROG 하프 에이스 에임 랩 에디션(ROG Harpe Ace Aim Lab Edition)와 무게 측면에서 박빙의 승부를 펼치지만, G1의 센서가 더 우수하다. 목표물에 십자선을 빠르게 맞출 수 있어 경쟁 플레이에도 적합하다. 크기는 4.59×1.55×2.34인치로 매우 작지만 큰 손으로도 편안하게 사용할 수 있다. 메인 클릭 버튼 2개, 왼쪽 측면 버튼 2개, 마우스 휠 버튼 1개가 탑재됐다. 제품 바닥 면에는 2.4GHz 와이파이 또는 블루투스 등 무선 연결 모드를 전환할 수 있는 DPI 전환기와 버튼이 있다. 제품 패키지에는 USB-C to USB-C 케이블, USB-A to USB-C 어댑터, 마우스 동글용 연장 어댑터가 들어 있다. USB-C 동글은 제품 밑면에 있는 공간에서 꺼낼 수 있다. G1은 매우 얇은 플라스틱으로 제작돼 다른 마우스보다 내구성이 상대적으로 떨어진다. 실제로 마우스 측면 버튼 근처의 플라스틱을 꽉 쥐면 살짝 구부러진다. 그런 점을 제외하면 잘 만들어진 제품이다. 성능 센서가 다른 2가지 모델로 출시된다는 점은 게이밍 마우스에서 흔히 볼 수 없는 반전이다. 한 모델에는 픽스아트 3950(Pixart 3950) 센서가, 다른 모델에는 픽스아트 3395(Pixart 3395) 센서가 탑재됐다. 두 모델 모두 2.4GHz 와이파이 모드에서 8,000Hz 폴링레이트를 지원하는 점은 같지만, 센서에 따라 약간의 차이가 있다. 자세히 설명하자면, 필자가 리뷰한 모델의 3950 센서의 최대 DPI는 3만, 최대 속도는 750IPS이므로 2만 6,000DPI 및 650IPS의 3395 센서 모델보다 조금 더 빠를 수 있다. 또한 3950은 유리 위에서도 트래킹할 수 있지만(최대 폴링레이트 1,000Hz), 3395는 데스크톱 표면으로 제한된다. 이런 차이점은 3950 모델의 가격이 더 높은 이유다(3950 모델 69달러, 3395 모델 64달러). G1 설정이 경쟁 게임에 이상적이라는 점을 고려해 카운터스트라이크 2(CounterStrike 2), 콜 오브 듀티 모던 웨페어 2(Call of Duty Modern Warfare 2)와 같은 액션이 가득한 슈팅 게임에서 사용해 봤다. G1를 곤충에 비유하자면 얼음 위에서 스케이트를 타는 것처럼 수면 위를 미끄러지듯 이동하는 소금쟁이 같았다. 책상 위에서 손가락으로 양쪽을 살짝 두드리기만 해도 움직일 정도로 민첩하다는 느낌이 들었다. 빠른 방향 전환도 장점이다. 이 덕분에 필자는 연발 무기로 총격전에서 쉽게 승리할 수 있었고 원거리 무기로 바꾼 후에도 결과는 비슷했다. 마우스의 대칭형 디자인은 멀리 떨어진 목표물을 완벽하게 정조준하는 데 유용하다. 기동성이 필자의 관심을 끌었다면, 엄청나게 빠른 폴링레이트는 1:1 교전에 필요한 추가 속도를 제공하면서 제품의 성능에 확신을 더했다. 특히 같은 위치에서 수평으로 달리는 적을 평소보다 약 2배 빠른 속도로 제압하는 느낌을 받았다. 여러 그립을 사용해 본 결과, 핑거팁 그립과 클로 그립이 미세한 움직임을 빠르게 만들 수 있다는 점에서 좋았다. 팜 그립도 사용했지만 마우스의 크기가 작아서 팔을 움직일 때 손목이 책상에 많이 닿았다. 짧은 플레이 세션에는 괜찮지만 장시간 플레이할 때는 적합하지 않다. G1에 탑재된 후아노 80M(Huano 80M) 스위치는 깔끔하고 빠르다. 두 개의 메인 클릭 버튼은 수직 이동 거리가 짧아 지터 클릭에 이상적이다. 키크론은 이 버튼이 8,000만 번의 클릭을 견딜 수 있다고 주장한다. 소프트웨어 다운로드할 수 있는 소프트웨어를 제공하는 대부분 게이밍 마우스와 달리, G1의 모든 설정을 변경할 수 있는 대시보드에 액세스하려면 을 통해 접속해야 한다. 웹사이트에서 명령 할당, DPI 단계 설정 또는 폴링레이트 변경 등의 작업을 수행할 수 있다. 또한 즐겨 하는 게임에 특화된 프로필을 저장할 수도 있다. 레모키 대시보드에서는 RGB 조명을 실용적으로 활용할 수 있다. 예를 들어, DPI를 단계별로 설정할 때 각 단계를 서로 다른 색상으로 반영할 수 있다. 단계에 해당하는 색상이 DPI 스위처 주변의 링에 표시된다. 게임 중 DPI를 어느 단계로 전환했는지 기억할 때 큰 도움이 됐다. 폴링레이트도 마찬가지다. 폴링레이트 버튼은 없지만, 두 개의 메인 클릭 버튼 아래쪽에서 표시등이 빛난다. 이 표시등의 색상도 다른 폴링레이트를 선택하면 바뀔 수 있도록 설정할 수 있다. 레모키 G1 와이어리스, 구매해야 할까? e스포츠계에서는 레이저 데스에더 V3 프로(Razer DeathAdder V3 Pro) 및 에일리언웨어 프로 와이어리스(Alienware Pro Wireless)와 같은 마우스에 대한 명성은 익히 들을 수 있지만, 뛰어난 사양을 훨씬 저렴한 가격에 제공하는 레모키 G1 와이어리스에 대한 이야기는 많이 없다. 누구나 꿈을 꾼다. 레모키 G1 와이어리스는 약자가 승리하는 꿈을 현실로 만들기에 충분하다. 레모키 G1을 가지고 참석한 e스포츠 대회에서 경쟁자가 상대적으로 잘 알려지지 않은 레모키 G1을 조롱한다. 하지만 게임이 시작되면 G1을 무시하던 상대방을 보기 좋 쓰러뜨린다. 레모키 G1을 사용하면 이런 경험은 시간문제다. editor@itworld.co.kr
마이크로소프트는 수년 동안 크롬북과의 경쟁을 꿈꿔왔으며, 이전에 윈도우 10 S(최초의 서피스 노트북을 구동하는 윈도우의 한정 버전)와 윈도우 10X(흥미로운 아이디어였지만, 취소되어 출시되지 않은) 같은 제품을 추진한 바 있다. 오늘날 스냅드래곤 X 엘리트 PC는 여러 면에서 '정식 버전의 윈도우'를 실행하지만, 직접 사용해 보니 크롬북과 비슷한 점이 많다는 것을 알 수 있다. 마이크로소프트는 AI에 초점을 맞춘 코파일럿+ PC 브랜딩에 대해 이야기하고 싶지만, 스냅드래곤 X 엘리트 및 스냅드래곤 X 플러스 칩으로 구동되는 이들 PC는 Arm용 윈도우를 실행하며, 여러 가지 면에서 크롬북과 매우 흡사한 경험을 제공한다. 1. 웹 앱이 더 선호되는 경우가 많다. 프리즘(Prism) 덕분에 Arm 기반 윈도우 11은 x86용으로 코딩된 기존 윈도우 애플리케이션을 전부는 아니지만, 대부분 실행할 수 있다. 즉, 대부분 애플리케이션이 설치되고 "그냥 작동"한다. 프리즘의 에뮬레이션은 특히 더 가벼운 애플리케이션에서 인상적인 성능을 제공하며, 스냅드래곤 X 프로세서는 일상적인 데스크톱 사용에 적합한 빠른 성능을 제공한다. 하지만 한 가지 중요한 사실을 부인할 수 없다. 기본 Arm 앱의 성능이 훨씬 우수하고 전력 사용량이 적으며, 주요 웹 브라우저가 모두 Arm용 윈도우 11에서 기본으로 실행된다는 점이다. 이 때문에 필자는 웹 앱을 자주 사용하게 됐다. 필자는 윈도우 인텔리전스 뉴스레터를 실행하기 위해 노션(Notion)과 트렐로(Trello) 같은 애플리케이션을 사용하는데, 데스크톱 앱은 이런 PC에서 약간 느리게 느껴져서 대신 브라우저에서 액세스한다. 그 덕분에 성능이 향상되고 배터리 사용시간이 더 길어졌다. 게다가 이들 웹 앱을 전용 창으로 전환해 크롬북에서와 마찬가지로 데스크톱 앱처럼 사용할 수도 있다. 2. 가벼운 워크로드는 긴 배터리 사용시간에 이상적이다. 일부 사용자는 코파일럿+ PC의 배터리 사용시간에 실망했다. 사실, 많은 업데이트를 실행하고 많은 앱을 설치해야 하기 때문에 스냅드래곤 X PC를 처음 설정하는 첫날에는 배터리 사용시간이 의외로 짧다. 좋은 소식은 배터리 사용시간이 개선된다는 것이다. 노트북 설정이 끝나면 즉시 길어지기 시작한다. 나쁜 소식은 웹 브라우징, 이메일, 마이크로소프트 오피스, 슬랙 및 마이크로소프트 팀즈와 같은 협업 앱, 화상 회의 등과 같은 가벼운 워크로드에 사용하는 경우에만 배터리 사용시간이 길다는 것이다. 이런 PC가 약속하는 긴 배터리 사용시간을 제대로 누리려면 가벼운 워크로드를 사용해야 하며, 다행히도 많은 사용자가 일상적으로 사용하는 작업의 범위가 여기에 해당한다. 하지만 무거운 앱으로 CPU에 부담을 주면, 배터리 사용시간이 예상보다 훨씬 짧아진다. 이는 가벼운 작업을 할 때 가장 잘 작동하는 크롬북과 매우 흡사한 느낌이다. 물론 여기서는 배터리 사용시간에 대해서만 이야기하고 있다. 무거운 작업을 수행해야 할 때는 배터리 사용시간을 걱정할 필요 없이 언제든 전원을 연결할 수 있다. 3. 모든 윈도우 애플리케이션이 실행되는 것은 아니다. 사실 윈도우에서 크롬북으로 전환할 때 윈도우 애플리케이션이 새 노트북에서 모두 작동할 것이라고 믿을 수는 없다. Arm용 윈도우로 전환할 때도 마찬가지이다. 물론, 대부분 애플리케이션이 작동한다. 하지만, 모든 애플리케이션이 작동하는 것은 아니다. 예를 들어, 구글 드라이브 동기화 클라이언트는 Arm용 윈도우를 지원하지 않으므로 사용할 수 없다. 많은 VPN 및 기타 보안 애플리케이션도 작동하지 않는다. 기업의 자체 업무용 앱을 사용해야 하는 경우 실행되지 않을 수도 있다. 또한 애플리케이션이 Arm용 윈도우에서 작동은 하지만, 제대로 작동하지 않을 수도 있다. 이런 경우가 더 실망스럽다. 코파일럿+ PC가 출시된 후 처음 며칠 동안 사용자들은 x86 버전의 어도비 프리미어 프로를 설치했는데 속도가 너무 느렸다. 따라서 실행은 가능했지만 사용성이 매우 떨어졌다. 이후 어도비는 이 PC에서 실행되지 않도록 차단했으며, 해당 앱이 Arm용 윈도우에서 기본적으로 실행되도록 이식될 수도 있다고 밝혔다. 핵심은 여기에 있다. 일반적인 새 윈도우 PC를 구입하는 것과는 다르다. 크롬북, 리눅스 PC 또는 다른 컴퓨팅 플랫폼으로 전환할 때와 마찬가지로 중요한 애플리케이션이 해당 플랫폼에서 실행될 수 있는지 여부를 결정하기 위해 몇 가지 조사를 수행해야 한다. 4. 하드웨어, 주변기기, 액세서리가 작동하지 않을 수 있다. 코파일럿+ PC는 하드웨어 호환성이 완벽하지 않다. 그 이유는 많은 구형 장치에 Arm에서 실행할 의도가 없는 x86 버전의 윈도우용으로 특별히 작성된 드라이버가 있기 때문이다. 따라서 구형 프린터나 스캐너가 제대로 작동하지 않을 수 있다. PC에 연결한 다른 주변 장치도 작동하지 않을 수 있다. 마이크로소프트는 이런 상황을 개선하기 위해 범용 인쇄 드라이버를 개발하고 있지만, 현재로서는 큰 문제이다. 크롬북과 마찬가지로 다양한 플랫폼에서 범용적으로 작동하도록 설계된 최신 디바이스는 작동하겠지만, 윈도우에서 작동하기 위해 하드웨어 드라이버가 필요한 구형 기기는 작동하지 않을 수 있다. 5. PC 게임은 완벽하지 않다 스냅드래곤 X의 하드웨어 성능, 마이크로소프트의 향상된 프리즘 변환 계층, NPU를 사용해 게임을 업스케일링하는 자동 초해상도(Automatic Super Resolution) 기능의 조합 덕분에 많은 PC 게임을 코파일럿+ 노트북에서 어느 정도 플레이할 수 있다. 하지만 게임이 기존 x86 PC에서와 같은 방식으로 "그냥" 작동하는 것은 아니다. 많은 게임이 전혀 실행되지 않는다. 포트나이트는 세계에서 가장 인기 있는 게임 중 하나이지만, Arm용 윈도우를 지원하지 않는 치트 방지 기능으로 인해 코파일럿+ PC에서 실행되지 않는다. 스팀이나 GOG, 에픽게임즈 스토어와 같은 디지털 스토어에서는 개발자가 네이티브 Arm용 윈도우 게임을 배포할 방법이 없기 때문에 대부분 프리즘을 통해 실행되는 기존 x86 게임만 사용할 수 있으며, 이는 완벽하게 작동하지 않는다. 어떤 면에서는 크롬북에서 스팀을 실행하는 것과 비슷하다. 크롬북은 밸브의 프로톤(Proton)을 통해 윈도우 게임을 플레이하는 리눅스 버전의 스팀을 실행할 수 있다. 그리고 프로톤은 리눅스 기반 스팀덱의 성공 덕분에 요즘 놀라울 정도로 잘 작동한다. Arm용 윈도우 PC, 크롬북 또는 스팀덱에서 스팀을 실행하더라도 인텔 또는 AMD CPU가 탑재된 기존 윈도우 PC에서 얻을 수 있는 완전한 경험을 얻을 수는 없다. 호환성 문제를 일으킬 수 있는 계층이 있기 때문이다. 따라서 일부 게임을 급한 대로 플레이할 수 있더라도 게임용으로 스냅드래곤 X Elite PC를 구입하지 않는 것이 좋다. 6. 지금은 클라우드 게임으로 충분할지도 모른다 마이크로소프트도 Arm용 윈도우의 기본 게임에 대해 완전히 확신하지 못하는 것 같다. 엑스박스 게임 패스를 사용하는 경우, 스냅드래곤 X 엘리트 기반 PC에서 엑스박스 앱을 실행했는데, PC에 게임을 설치할 방법이 전혀 없다는 사실에 놀랄 것이다. 그렇다. Arm용 윈도우 PC에서 엑스박스 앱은 실제로 Xbox 클라우드 게임을 푸시한다. 그게 전부이다. 앞으로는 바뀔 수도 있겠지만 현재로서는 그렇다. 그리고 크롬북 역시 기본 게임을 플레이할 수는 없지만 엑스박스 클라우드 게임에 액세스할 수 있다. 7. AI 기능은 대부분 웹 기반이다 광고를 보면, 마이크로소프트는 모든 사람들이 미래는 강력한 NPU가 탑재되어 모든 종류의 AI 기능을 바로 실행할 수 있는 AI PC가 대세가 될 것이라 믿기를 원하지만 1세대 코파일럿+ PC는 그 약속을 이행하지 못한다. 사실 윈도우에는 아직 오프라인에서 작동하는 AI 기능이 많이 포함되어 있지 않다. 마이크로소프트의 코파일럿 챗봇은 여전히 인터넷 연결이 필요하며, 작업표시줄에 고정된 웹 앱일 뿐이고, PC 통합 기능('다크 모드 켜기' 등)은 제거됐다. 뿐만 아니라 NPU로 구동되는 모든 AI 이미지 편집 기능도 생성된 이미지의 "AI 안전성"을 확인하기 위해 마이크로소프트의 온라인 서비스에 연결해야 한다. 결국, 기본 환경은 크롬북의 웹 브라우저에서 여러 가지 AI 기능을 사용하는 것과 크게 다르지 않다. 8. 전통적인 윈도우 PC와는 거리가 멀다. 언제나 그렇듯이 마이크로소프트는 코파일럿+ PC와의 하위 호환성을 보장하기 위해 열심히 노력하고 있다. 많은 기존 윈도우 애플리케이션은 그냥 작동하기 때문에, 그렇지 않은 경우 놀랍고 주목할 만하다. 필요한 소프트웨어와 하드웨어가 이런 PC에서 실행되는지 확인하기 위해 약간의 조사를 해야 할 뿐만 아니라, 애플리케이션 개발자도 이런 PC에서 애플리케이션이 가능한 한 잘 실행되도록 하는 것이 이상적이다. 이는 윈도우 경험에 대한 큰 철학적 변화이며, 스냅드래곤 PC에서 윈도우를 사용하는 것이 크롬북, 리눅스 PC 또는 안드로이드 태블릿을 사용하는 것과 같은 느낌을 주는 큰 이유 중 하나이다. 단순히 윈도우 PC를 조정한 것이 아니라 완전히 다른 컴퓨팅 플랫폼이다. 윈도우처럼 보이고 윈도우 소프트웨어와의 호환성은 좋지만, Arm용 윈도우는 기존의 x86 윈도우와는 큰 차이가 있다. 완전히 다른 것이다. 그리고 다르다는 것은 괜찮다. 인상적이다. 코파일럿+ PC를 직접 사용하지 않더라도, 적어도 인텔은 x86을 새로운 한계로 밀어붙이는 경쟁에 불을 붙였다. 인텔은 올해 말 출시될 루나 레이크 하드웨어를 통해 큰 진전을 이루었다. 이는 Arm 기반 윈도우 PC를 원하든 원하지 않든 모두에게 이득이다. 9. 모두에게 좋은 경쟁 크롬OS가 주류 시장으로 확산하면서 PC 제조업체는 신경을 써야 할 실질적인 윈도우 대안을 만났다. 마이크로소프트는 경쟁할 수밖에 없었고, 그 경쟁은 모두에게 이익이 됐다. 마찬가지로, 최신 Arm 칩을 통해 마이크로소프트와 PC 제조업체는 기존의 인텔 및 AMD CPU를 대체할 수 있는 대안을 갖게 됐다. 퀄컴의 스냅드래곤 X 엘리트와 스냅드래곤 X 플러스는 첫 번째 칩에 불과하며, 앞으로 다른 업체에서 더 많은 Arm 하드웨어를 출시할 예정이다. 따라서 인텔과 AMD CPU는 이들과 경쟁을 해야 한다. 곧 출시될 인텔의 루나 레이크 하드웨어와 출시가 임박한 AMD의 스트릭스 포인트 하드웨어에서 이미 그 결과가 나타나고 있다. 10. 코파일럿+ PC는 모든 사용자를 위한 것이 아니다 PC 하드웨어의 미래는 밝아 보이며, Arm용 윈도우는 더 좋아질 것이다. 아직은 초기 단계에 있으며 5년, 10년, 20년 후 이 모든 것이 어디로 이어질지 누구도 완전히 예측할 수 없다. 하지만 현재로서는 스냅드래곤 X 엘리트 기반 윈도우 PC가 모든 사람에게 적합한 선택은 아니다. 특정 사용례에는 완벽할 수 있지만, 어떤 사용례에는 적합하지 않을 수 있다. 그런 점에서 매우 특정한 요구사항에 적합한 크롬북과 매우 유사하다. editor@itworld.co.kr
10여 년 전 휴대용 블루투스 스피커가 한참 인기를 끌었을 때, 2012년(애플 인수 전) 비츠가 출시한 오리지널 를 제외하고는 제품군에 대한 업데이트가 거의 없었다. 하지만 이 인기 있는 휴대용 스피커가 돌아와 값싼 경쟁 제품이 넘쳐나는 시장에 다시 뛰어들었다. 이전 버전보다 훨씬 개선됐지만, 다음 버전에서 수정되었으면 하는 아쉬운 부분도 몇 가지 있다. 디자인 휴대용 블루투스 스피커 시장에 비츠의 상징적인 ‘알약’ 모양 디자인을 모방한 제품이 많은 것에는 이유가 있다. 휴대하기 편하고 물병이 들어가는 곳이라면 어디든 잘 맞으며, 테이블처럼 평평한 표면 어디든 잘 어울리기 때문이다. 2024년형 비츠 필은 매트 블랙, 볼드 레드, 샴페인 골드 3가지 색상으로 출시됐다. 2024년형 모델에 대해 놀랄 만한 것은 많지 않다. 어디를 보나 비츠 필이다. 스피커를 세워 놓으면 20도 위로 기울어져 더 집중적인 사운드를 제공한다. 실리콘 소재의 커버가 본체의 측면과 뒷면을 감싸고 있어 부딪힘과 흠집을 방지하는 동시에 내후성을 더한다. IP67 등급이므로 해변이나 수영장에서 물이 튀어도, 비 오는 날 비를 맞아도 망가질 염려가 없다. 상단에는 음량 조절 버튼, 다기능 중앙 버튼, 전원 버튼이 있다. 모두 손가락 끝 크기의 딤플이 실리콘으로 되어 있지만, 충분히 떨어져 있고 라벨이 선명하게 표시돼 있어 자세히 보지 않고도 원하는 버튼을 쉽게 누를 수 있다. 뒷면에는 충전 또는 오디오 입력으로 사용할 수 있는 USB-C 포트가 하나 있으며, 무손실 오디오를 지원한다(물론 비츠 필의 음질은 여기에 미치지 못한다). 전원 버튼을 3번 탭하면 역 충전이 가능하므로 휴대폰 보조 배터리로도 활용할 수 있다. 비츠는 비츠 필의 배터리가 최대 24시간 지속한다고 주장한다. 전체 런다운 테스트는 하지 않았지만, 오후 내내 재충전하지 않고 중간에서 높은 음량으로 음악을 들을 수 있었다. 음질 비츠 필은 전작 비츠 필 플러스의 우퍼보다 공기 변위가 90% 더 큰 단일 타원형 우퍼와 페어링된 트위터를 갖추고 있다. 소리는 무난하다. 원통형 디자인의 모든 휴대용 스피커가 그렇듯이 저음은 부족하다. 비츠 필의 경우 예상보다 깊은 저음을 제공하지만, 여전히 부족하기는 하다. 음량을 높이면 모든 소리가 잘리거나 제한적인 느낌이 들지만, 최고 음량에서 4~5클릭 정도만 낮춰도 꽤 괜찮은 소리를 낸다. 이 정도 크기의 가벼운 휴대용 스피커가 낼 수 있는 소리에는 한계가 있다. 스피커폰이나 음성 어시스턴트를 사용할 수 있는 마이크가 탑재됐지만, 소음 제거 기능은 부족한 편이다. 에어팟 프로를 착용하고 통화할 때는 들리지 않던 강한 바람이나 주변 고소도로 소음이 비츠 필에서는 그대로 들린다. 아이코닉한 디자인은 마음에 들지만, 좁은 직사각형 알약 모양이 정말 최선인지 의문스럽다. 상당히 안정적이지만 테이블에 너무 세게 부딪히면 굴러갈 수 있고, 모양 때문에 사운드 엔지니어링에서 타협점을 찾기가 어렵다. 홈팟과 홈팟 미니와 비슷한 ‘뚱캔’ 모양이라면 왜곡을 피하기 위한 더 나은 우퍼가 탑재될 수 있을 것이다. 어떤 알약은 둥글지 않다. 컨트롤 버튼 일부 컨트롤 버튼의 사용법은 충분히 직관적이다. 음량 조절 버튼은 예상대로 작동하며, 가운데 버튼을 한 번 누르면 재생/일시 정지, 두 번 누르면 앞으로 건너뛰기, 세 번 누르면 뒤로 건너뛰기다. 그 외에는 조금 직관적이지 않다. 일반적으로 이런 컨트롤에서는 전원 버튼을 몇 초 동안 길게 누르면 전원이 꺼진다. 하지만 비츠 필에서는 그렇게 하면 블루투스 페어링 모드로 진입한다. 전원 버튼을 한 번 탭하면 배터리 상태를 확인할 수 있고, 두 번 탭하면 음성 어시스턴트 모드가 실행된다. 전원을 끄려면 버튼을 0.8초~3초 사이로 눌러야 한다. 두 개의 비츠 필을 사용하는 경우 더 넓은 공간이나 인접한 방을 커버하는 데 탁월한 동시 오디오 재생 모드인 앰플리파이(Amplify) 또는 한 개가 왼쪽 채널을 재생하고 다른 하나는 오른쪽 채널을 재생하는 스테레오 모드로 사용할 수 있다. 앰플리파이/스테레오 모드로 진입하는 방법도 직관적이지 않다. 일단 아이폰 앱에는 해당 옵션이 없다(안드로이드의 비츠 앱이 조금 더 도움이 된다). 앰플리파이 모드로 들어가려면 두 개의 스피커를 서로 가까이 가져간 다음, 두 스피커의 가운데 버튼을 모두 길게 누른다. 스테레오 모드는 가운데 버튼을 길게 누른 상태에서 음량을 높인다. 어느 쪽이 왼쪽 혹은 오른쪽 채널인지 표시되지 않는다. 앰플리파이/스테레오 모드를 종료하려면 가운데 버튼을 누른 상태에서 음량을 낮춘다. iOS 설정에 2가지 모드를 안내하는 쉬운 인터페이스가 있거나 적어도 오디오 확인이 명확하게 표시되면 많은 도움이 되겠지만, 둘 다 없다. 펌웨어 업데이트를 통해 비정상적이고 직관적이지 않은 전원 버튼 기능과 불투명한 두 알약 페어링 모드를 모두 개선할 수 있다. 하지만 음량 조절과 재생/일시정지/건너뛰기 등 기본 기능만 충실히 사용한다면 컨트롤은 잘 작동한다. 비츠 필, 구매할 만한 가치가 있을까? 비츠 필의 음질에는 문제가 있지만, 이런 크기의 다른 휴대용 블루투스 스피커보다는 뛰어나다. 폼팩터의 한계이며, 차세대 비트 필에서는 다른 모양을 고려할 좋은 이유다. 내후성, 비교적 큰 음량, 환상적인 배터리 수명은 수영장에서 놀거나 그릴을 굽는 동안 음악을 듣거나 다음에 캠핑을 갈 때 텐트 안의 분위기를 높이는 데 적당하다. 21만 9,000원이라는 가격도 합리적이다. 이런 작은 휴대용 스피커에서 훌륭한 음질은 기대하지 않기를 바란다. 펌웨어 업데이트를 통해 컨트롤이 조금 더 직관적으로 바뀐다면 더할 나위 없이 좋은 휴대용 스피커가 될 것이다. editor@itworld.co.kr
애플의 기본 M 시리즈 칩(M1, M2, M3)이 탑재된 맥을 사용할 때는 연결할 수 있는 모니터 수가 제한적이다. 이런 문제를 해결하는 한 가지 방법은 한 번에 더 넓은 데스크톱 공간을 확보할 수 있는 울트라와이드스크린 디스플레이를 사용하는 것이다. 고해상도까지는 필요하지 않다면 넓은 공간을 제공하는 와이드스크린 디스플레이를 합리적인 가격에 구매할 수 있다. 삼성 뷰피니티 S65TC(VIewFinity S65TC)가 대표적인 예다. 폭이 매우 넓은 34인치 디스플레이라 일반적인 크기의 디스플레이 2대를 나란히 놓고 작업하는 효과를 얻을 수 있다. 여기에 더해 뷰피니티 S65TC는 높은 주사율, 썬더볼트 4 포트, 사용하기 쉬운 컨트롤을 합리적인 가격에 제공한다. 디자인, 설정 및 컨트롤 뷰피니티 S65TC 포장을 풀자마자 크기에 놀랐다. 21:9 비율로 화면이 넓고(참고로 애플의 스튜디오 디스플레이는 16:9다), 커브드 모니터다. 이런 크기에도 불구하고 무게는 9kg 미만으로 그리 무겁지 않다. 흰색 마감과 디스플레이 케이스는 마음에 들지만, 플라스틱 느낌이 매우 강한 점은 아쉬웠다(가벼운 이유는 소재에 있다). 조립 방법은 간단하다. 금속 스탠드는 두 부분으로 구성돼 있다. 준비가 되면 스탠드와 화면을 연결하고 플러그를 꽂으면 된다. 화면을 수직 및 수평으로 조정하거나 위아래로 기울일 수 있다. 단, 세로 모드에서는 회전할 수 없다. 화면 중앙 하단에는 화면 설정을 조정할 수 있는 십자선 모양의 컨트롤 버튼이 있다. 원하는 버튼을 한 번에 누르는 데 항상 어려움을 겪지만, 작동법을 익히고 사용하는 것 자체는 매우 쉽다. 연결성 뷰피니티 S65TC는 썬더볼트 4를 지원하므로 맥과 연결할 수 있다. 썬더볼트 4 포트 2개 중 하나는 90W 전력을 공급하므로(노트북과 썬더볼트 아이콘이 함께 표시돼 있음) 이 포트를 통해 맥북을 연결하면 충전까지 동시에 할 수 있다. HDMI 2.0 포트 연결도 가능하다. 두 번째 썬더볼트(썬더볼트 아이콘만 표시돼 있음)는 15W 전력을 제공한다. 또한 디스플레이에는 2개의 USB-A 포트(하나는 서비스 포트), 디스플레이 포트(버전 1.2), 이더넷 포트, 3.5mm 오디오잭이 탑재됐다. USB-A는 과거지향적이지만 시중에는 여전히 USB-A 연결 제품이 많다. 하지만 썬더볼트 포트가 조금 더 많았다면 좋았을 것이다. 매우 넓은 화면 21:9 화면 비율의 커브드 화면은 뷰피니티 S65TC를 돋보이게 하는 요소다. 3,440×1,440픽셀의 WQHD(Wide Quad High Definition) 해상도를 지원한다. 34인치라 화면 폭이 넓고 공간이 넉넉하다. 사파리 윈도우를 3개까지 열 수 있다. 커브드 화면은 익숙해지는 데 시간이 다소 걸린다. 화면이 사용자를 ‘감싸는’ 방식은 눈의 피로가 적고 시야가 넓어진다는 이점이 있지만, 필자에게는 그렇게 와닿지 못했다. 필자가 가장 마음에 드는 부분은 애플 스튜디오 디스플레이에 없는 100Hz의 화면 재생률이다. 뷰피니티 S65TC의 명암비는 꽤 좋지만, 아이맥 옆에 두면 색 재현율이 떨어지는 느낌이 든다. 밝기 역시 350니트로 낮은 편이다. 애플 스튜디오 디스플레이의 밝기는 600니트다. 심지어 맥북 에어의 화면 밝기도 500니트로 더 높다. 삼성 뷰피니티 S65TC, 구매해야 할까? 삼성 뷰피니티 S65TC는 게이머를 염두에 두고 만들어졌다고 생각하지만, 맥 사용자라면 즐길 수 있는 무거운 게임이 많지 않다는 것을 이미 알고 있을 것이다. 책상 위 공간을 많이 차지하며, 웹캠이 없다. 하지만 사용할 수 있는 화면 공간은 넓다. 아쉬운 점은 색 재현력과 밝기다. HDR에도 불구하고 생동감이 부족하다. 물론 사용 환경에 따라 중요하지 않은 요소일 수 있다. 동영상이나 사진 작업을 전문적으로 하는 사용자에게는 추천하지 않지만, 더 많은 화면 공간을 원하는 일반 사용자라면 이 제품에 만족할 것이다. editor@itworld.co.kr
때로는 모든 것을 갖추고 있어도 자신의 두 발에 걸려 넘어질 수 있다. 실시간 안티바이러스 및 안티맬웨어 소프트웨어인 맥용 비트디펜더 안티바이러스(Bitdefender Antivirus)가 바로 이런 경우다. 비트디펜더 안티바이러스는 쉽게 다운로드 및 설치할 수 있고 필요에 따라 전체 드라이브 권한을 할당할 수 있다. 대부분의 바이러스 백신 제품군과 마찬가지로 맥용 비트디펜더 안티바이러스는 빠른 개요를 수행하고 몇 분 안에 바이러스 후보를 찾아 격리 및 제거하는 퀵 스캔(Quick Scan) 모드와 하드 드라이브의 가능한 모든 파일을 검사하는 풀 스캔(Full Scan) 모드를 제공한다. 필자의 맥에서는 풀 스캔에 거의 19시간이 걸렸다. 다행히도 맥용 비트디펜더 안티바이러스의 풀 스캔 기능은 백그라운드에서도 잘 실행된다. 스캔이 진행되는 동안 다른 작업을 수행하도록 최소화할 수 있다. USB 플래시 드라이브와 같은 외부 저장소를 애플리케이션 창 또는 독 아이콘으로 끌어다 놓으면 쉽게 스캔을 시작할 수 있다. 그 외에 다른 유용한 기능으로는 보호할 파일·화이트 리스트 생성, 비트디펜더 계정·기능에 대한 개요 역할을 하는 유용한 웹 포털, 설치된 기기에서 원격 스캔 지원 등이 대표적이다. 성능 비트디펜더 쉴드(Bitdefender Shield)의 실시간 보호 기능은 맥OS의 게이트키퍼(Gatekeeper) 기능과 잘 어울리며, 이를 통과하는 맬웨어는 많지 않다. 하지만 테스트를 위해 비트디펜더 쉴드를 비활성화하고, 맥을 재부팅하고, 맬웨어를 설치한 후에 다시 비트디펜더 쉴드를 활성화했더니 이미 시스템에 설치된 맬웨어를 찾아서 무력화하는 기능에는 여러 문제가 있었다. 8가지 맬웨어를 탐지하고 비활성화했지만 OSX.Backdoor.Adwind, OXS.DazzleSpy 및 OSX.EvilEgg 패키지 내의 맬웨어 4개를 놓쳤으며, 논란이 되고 있는 웨이브(Wave) 웹 브라우저 및 감염된 어도비 플래시 플레이어(Adobe Flash Player) 사본과 같은 의심스러운 설치 응용 프로그램을 그대로 두었다. 맥OS의 게이트키퍼와 비트디펜더 쉴드는 의심스러운 소프트웨어 대부분을 차단했지만, 이런 방어 기능을 우회하고 맬웨어가 설치되면 여러 항목을 놓치는 경우가 있었다. 별도의 프로그램으로 제거해야 하는 불편함이 있었다. 고려해야 할 주의 사항은 또 있다. 검사에서 맬웨어 샘플을 놓친 것 외에도 비트디펜더 안티바이러스가 맬웨어를 발견한 후 두 번이나 작동을 멈췄다. 이런 문제는 비트디펜더 쉴드 기능을 켜고 맥을 재부팅한 후 저절로 해결됐지만, 애초에 이상한 요구 사항인 듯하다. 다른 여러 보안 제품군과 마찬가지로, 맥용 비트디펜더 안티바이러스는 사파리, 구글 크롬 및 모질라 파이어폭스 웹 브라우저용 확장 프로그램을 통해 피싱 방지 보호 기능을 제공한다. 이런 브라우저 확장 프로그램은 다양한 수준의 보호 기능을 제공한다. 테스트에서 필자는 지메일의 스팸 폴더에 들어가 이런 브라우저 확장 프로그램이 어떤 종류의 보호 기능을 제공하는지 확인했다. 사파리에서는 눈에 띄는 피싱 보호 기능을 제공하지 않아서 의심스러운 웹 사이트에 아무런 경고 없이 방문할 수 있었다. 구글 크롬과 모질라 파이어폭스 확장 프로그램은 더 나은 성능을 보였는데, 의심스러운 웹 사이트 방문을 경고와 함께 차단했지만, 그래도 클릭하면 웹 사이트를 방문할 수 있도록 허용했다. 맥용 비트디펜더 안티바이러스는 구독 요금제에 따라 웹 브라우저용 안티트래커와 VPN 액세스를 제공한다. 기본적으로 비트디펜더 VPN은 다양한 글로벌 위치를 통해 쉽게 라우팅할 수 있는 보안 연결 생성을 처리하는 실용적인 VPN 클라이언트다. 필자는 캐나다 서버에 로그인해 미국에서 볼 수 없는 리얼리티 프로그램을 정주행했고, 인터페이스가 친숙해 VPN 클라이언트를 처음 사용하는 사람이라도 두려움 없이 사용할 수 있다. 또한 연결이 끊어지면 모든 인터넷 트래픽을 차단하는 킬 스위치 기능과 함께 편리한 광고 및 트래커 차단 기능도 제공한다. 한 가지 아쉬운 점이 있다면 비트디펜더 안티바이러스에 번들로 제공되는 비트디펜더 VPN 프로그램은 하루에 200MB의 데이터만 사용할 수 있다는 사실이다. 그 후에는 첫해에 연간 24.99달러(이후 연간 69.99달러)인 정식 버전으로 업그레이드할 것을 권장한다. 비트디펜더 VPN은 훌륭한 무료 VPN 클라이언트지만, 평가판 세션이 존재하는 데는 이유가 있다. 가격 비트디펜더 안티바이러스는 현재 맥 1대당 첫해에 연간 19.99달러인 “50% 할인” 가격에 판매되고 있지만(이후에는 연간 39.99달러), 할인가는 자주 변경된다. 30일이라는 체험판 기간은 비교적 넉넉하다. 맥용 비트디펜더 안티바이러스와 iOS, 안드로이드, 윈도우용 서비스를 포함하는 비트디펜더 토탈 시큐리티(Bitdefender Total Security) 제품도 있다. 해당 제품은 5대 기기에 대해 첫해 연간 69.99달러(이후 109.99달러)에 사용할 수 있다. 표준 맥용 안티바이러스 솔루션과 마찬가지로 30일 간의 평가판 기간을 제공한다. 최종 결론 맥용 비트디펜더 안티바이러스는 편리하고 개인화 설정이 가능한 사용자 인터페이스와 유용한 기능을 제공하며, 맥OS의 게이트키퍼 기능과 잘 결합돼 있지만, 특정한 상황에서는 상당한 양의 맬웨어가 통과될 수 있으니 주의가 필요하다. 또한, 가끔 발생하는 멈춤 현상, 사파리 웹 브라우저 확장 프로그램의 부족한 피싱 방지 보호 기능, 사용자에게 업그레이드를 강요하는 VPN 클라이언트는 비트디펜더가 개선해야 할 점이다. editor@itworld.co.kr
데이터 암호화는 매우 중요하다. 회사에서 제공한 PC를 사용하든 개인 컴퓨터로 작업하든, 암호화를 사용하면 도둑이나 다른 사람이 PC를 손에 넣어도 민감한 개인 데이터를 볼 수 없다. 윈도우 PC의 스토리지 암호화는 다소 복잡하게 느껴질 수 있다. 이 가이드에서는 기존 비트로커 암호화와 새로운 '장치 암호화'의 차이점, PC의 데이터를 안전하게 보호하는 방법, 만일을 대비해 이동식 장치를 암호화하는 방법 등 비트로커 암호화의 모든 것을 알아본다. 또한 비트로커 암호화 오류 복구에 대해 알아야 할 사항도 설명한다. 크라우드스트라이크 사태가 발생했을 때, 많은 사람이 PC를 부팅하면 비트로커 복구 키를 요구하는 블루스크린만 볼 수 있었다. 이런 일은 일어나서는 안되겠지만, 만일의 사태에 대비하는 것이 좋다. 비트로커의 이해 비트로커는 마이크로소프트의 스토리지 암호화 기술이다. 윈도우 비스타에 처음 도입됐으며, 현재도 윈도우 11 및 윈도우 10에 포함되어 있다. 비트로커는 스토리지의 전체 볼륨을 암호화하도록 설계됐다. 즉, 하드 드라이브의 전체 파티션을 암호한다. 비트로커를 활성화하면 PC의 파일이 암호화된 방식으로 디스크에 저장됩니다. 파일을 “마구 뒤섞어 놓은(scrambled)” 형태로 저장하기 때문에 PC의 하드 드라이브를 훔쳐간다고 해도 파일에 액세스할 수 없다. 파일에 액세스하려면 암호화 키가 필요하다. 비트로커는 컴퓨터를 부팅할 때 자동으로 잠금이 해제되는 “투명” 모드로 작동하도록 설정되어 있는 경우가 많다. 이렇게 하면 컴퓨터의 TPM(Trusted Platform Module) 하드웨어를 사용해 드라이브의 잠금을 해제한다. TPM은 암호화 키를 저장하고 윈도우 운영체제가 변조되지 않은 것으로 보이는 경우에만 암호화 키를 제공한다. 이 기술은 기업이 회사 데이터를 보호하는 중요한 방법이다. 그렇기 때문에 기업에서는 업무용 PC에서 비트로커를 사용하도록 강제하는 경우가 많다. 하지만 개인이 개인 데이터를 보호하는 데에도 유용한 방법이다. 누군가 노트북을 손에 넣더라도 키가 없으면 파일에 액세스할 수 없다. 노트북을 부팅하더라도 파일에 액세스하려면 윈도우 사용자 계정에 로그인해야 한다. 비트로커에 문제가 발생하면 비트로커 복구 키를 입력할 것을 요청한다. 비트로커를 직접 설정한 경우에는 암호화 키를 안전한 곳에 저장하라는 메시지가 표시됩니다. 기업 환경에서는 IT 부서가 사본을 가지고 있다. 일부 상황에서는 사본을 마이크로소프트 계정과 함께 저장하기도 한다. 비트로커와 장치 암호화의 차이 윈도우 7 시절에는 비트로커가 전문가용, 기업용, 교육용 버전의 윈도우에서만 제공됐다. 홈 버전의 윈도우를 실행하는 일반 PC에서는 내장 암호화 기술을 사용할 수 없었다. 현재도 이런 차이는 있다. 비트로커 드라이브 암호화(BitLocker Drive Encryption)란 이름의 비트로커의 정식 버전은 윈도우의 프로페셔널 버전 이상에서만 사용할 수 있다. PC에서 온전한 비트로커 도구를 이용하려는 개인 사용자는 PC의 윈도우 홈 버전을 윈도우 11(또는 윈도우 10) 프로페셔널 버전으로 업그레이드해야 한다. 그러나 윈도우 8.1부터 시작해 현재 윈도우 10 및 윈도우 11까지 마이크로소프트는 “장치 암호화”라는 기능을 제공한다. 이 기술은 내부적으로 비트로커를 사용하지만, 하지만 전체 비트로커 구성 옵션은 제공하지 않으며 PC에 올바른 하드웨어(윈도우 11에 공식적으로 필요한 하드웨어 기능 중 하나인 TPM 2.0 칩)가 있는 경우에만 작동한다. 장치 암호화는 평균적인 최신 PC에서 “그냥 작동”하도록 만들어진 기능이다. 마이크로소프트 계정이나 회사 또는 학교 계정으로 윈도우에 로그인하면, 윈도우가 자동으로 장치 암호화를 활성화하여(PC에 올바른 하드웨어가 있다는 가정 하에) 암호화를 통해 파일을 보호한다. 마이크로소프트 계정, 회사 계정 또는 학교 계정으로 로그인했으므로 윈도우는 비트로커 복구 키를 마이크로소프트 계정 또는 회사나 학교의 시스템에 PC를 백업한다. 이렇게 하면 일반 PC 사용자가 오류가 발생했을 때 복구 키에 액세스할 수 있는 방법이 보장된다. 일반 사용자의 경우, 마이크로소프트 계정이 필요하다. 로컬 사용자 계정으로 PC에 로그인하도록 선택하면 장치 암호화를 사용할 수 없다. 최적의 보안을 위해 마이크로소프트 계정으로 로그인하거나 윈도우 프로페셔널 에디션을 구매해 비트로커 환경을 사용하는 것이 좋다. PC의 스토리지가 암호화되어 있는지 확인하는 방법 비트로커를 사용하려면, 관리자 계정으로 윈도우에 로그인해야 한다. 일반 사용자 계정으로 로그인한 경우에는 옵션이 표시되지 않을 수 있다. 윈도우 11에서 장치 암호화를 확인하려면 설정 앱을 열고 '개인정보 및 보안'을 선택한 다음 보안 아래에 있는 '장치 암호화'를 클릭한다. 장치 암호화가 활성화되어 있으면 “켜짐”으로 설정된다. 윈도우 10에서 설정 앱을 열고 '업데이트 및 보안'을 선택한 다음 왼쪽 창에서 '장치 암호화'를 선택한다. 장치 암호화가 활성화되어 있으면 “장치 암호화가 켜져 있다.”라는 메시지가 표시된다. 설정 앱에 '장치 암호화' 옵션이 전혀 표시되지 않는다면, PC가 이를 지원하지 않거나 표준 사용자 계정으로 윈도우에 로그인한 것이다. 파일 탐색기에서 확인할 수도 있다. '내 PC' 아래에서 컴퓨터의 각 드라이브 아이콘을 확인한다. 드라이브 아이콘에 자물쇠가 있는 경우, 해당 드라이브는 비트로커 드라이브 암호화 또는 장치 암호화를 통해 어떤 식으로든 암호화된 것이다. 기존 제어판 창을 열고 “시스템 및 보안”을 선택한 다음, “비트로커 드라이브 암호화” 또는 “장치 암호화”를 클릭해 비트로커 옵션을 제어하고 스토리지가 암호화됐는지 확인할 수 있다. 이동식 드라이브를 암호화하는 방법 온전한 전체 비트로커 드라이브 암호화 환경을 갖춘 PC를 사용하는 경우, 이동식 저장 장치를 암호화할 수도 있다. 이 기능은 '비트로커 To Go'라는 기능을 사용하며, USB 플래시 드라이브, SD 카드 및 외장 하드 드라이브에 사용할 수 있다. 이렇게 하려면 제어판을 열고 “시스템 및 보안”을 클릭한 다음 “비트로커 드라이브 암호화”를 선택한다. “이동식 데이터 드라이브” 아래에 이동식 드라이브를 암호화하는 옵션이 표시된다. 비트로커 복구 키를 찾는 방법 비트로커는 일반적으로 “그냥 작동”해야 한다. 대부분 사용자는 부팅 시 비트로커 복구 키 블루 스크린이 표시되지 않기를 바란다. 하지만 크라우드스트라이크 사태 같은 사고는 누구에게나 발생할 수도 있다. 하드웨어 문제 또는 한 컴퓨터에서 스토리지 드라이브를 가져오거나 다른 컴퓨터에서 액세스해야 하는 경우에도 발생할 수 있다. 이 경우 비트로커 복구 키가 필요한다. 회사가 관리하는 PC를 사용하는 경우 회사 시스템에 복구 키가 백업되어 있으므로 복구 키를 요청할 수 있다. 마이크로소프트 계정으로 PC에 로그인하고 윈도우에서 장치 암호화를 자동으로 사용하도록 설정한 경우에는 마이크로소프트에서 액세스해야 한다. 마이크로소프트의 비트로커 복구 키 페이지를 방문해 마이크로소프트 계정으로 로그인하여 복구 키를 찾는다. 비트로커 드라이브 암호화를 직접 설정한 경우, 설정 과정의 일부로 복구 키를 저장하고 저장하라는 메시지가 윈도우에 표시된다. 종이에 인쇄하거나 USB 드라이브에 저장했을 수도 있다. PC가 정상적으로 작동하는 경우 언제든지 복구 키의 백업 복사본을 만들 수도 있다. 이렇게 하려면 제어판을 열고 “시스템 및 보안”을 클릭한 다음 “비트로커 드라이브 암호화” 또는 “장치 암호화”를 선택한다. 이 창에서 각 드라이브의 복구 키 사본을 백업할 수 있는 링크를 찾을 수 있다. 마이크로소프트는 비트로커 복구 키를 찾는 방법에 대한 자세한 가이드를 제공한다. 복구 키의 사본을 모두 분실했는데 PC에서 복구 키를 요청하는 경우(개인용 PC에서 비트로커를 직접 설정한 후 복구 키를 인쇄하지 않았거나 백업 사본을 분실한 경우) PC의 파일에 액세스할 수 없게 된다. 이 경우에는 PC의 파일을 이용할 수 없고 가지고 있는 별도의 백업본에서 파일을 복원해야 한다. 오픈소스 대안 베라크립트와 트루크립트 윈도우 PC의 스토리지를 암호화하고 싶지만 어떤 이유로 비트로커를 사용하고 싶지 않다면, 오픈소스 대안을 사용할 수 있다. 윈도우가 최신 PC에 장치 암호화를 기본 제공하기 전에는 이 방법이 더 일반적이었는데, 홈 버전 윈도우 사용자는 비용을 들여 프로페셔널 버전으로 업그레이드하지 않고도 이 소프트웨어를 사용해 암호화할 수 있었기 때문이다. 몇 년 전에는 트루크립트(TrueCrypt)가 대표적인 솔루션이었다. 하지만 트루크립트 프로젝트는 2014년에 “해결되지 않은 보안 문제가 있을 수 있으므로 안전하지 않다”고 경고하며 윈도우 PC 사용자에게 비트로커로 전환할 것을 권장하면서 종료됐다. 어떤 문제인지는 완전히 설명되지 않았다. 후속 프로젝트인 베라크립트(VeraCrypt)는 이 프로젝트의 코드를 가져와 보안 문제를 수정하고 계속 개발했다. 이 코드는 독립적으로 감사를 받았으며 발견된 문제는 수정됐다. 윈도우에서 오픈소스 드라이브 암호화 도구를 사용하려는 경우, 베라크립트를 사용하는 것이 좋다. 대부분 사용자는 가능하면 비트로커 드라이브 암호화 또는 장치 암호화와 같은 형태의 비트로커를 사용하는 것이 좋다. 비트로커는 윈도우와 통합되어 있으며 잘 작동한다. 베라크립트 같은 서드파티 솔루션은 데이터 손실이나 기타 문제가 발생할 가능성이 높다. 모든 사용자에게 필요한 암호화 궁극적으로 기본적인 스토리지 암호화는 격리된 사무실에서 데스크톱 PC를 사용하는 경우를 제외하고는 모든 최신 PC에서 필수이다. 특히 일반 노트북에는 데이터 보안을 위해 이런 기능이 필요하다. 회사에서 제공하는 컴퓨터를 사용하든 개인용 PC를 사용하든 노트북 분실은 데이터 보안에 큰 문제가 되지 않아야 한다. 안드로이드, 크롬OS, 맥OS, iOS 등 다른 모든 최신 플랫폼은 기본적으로 스토리지 암호화 기능을 제공한다. 윈도우 환경에서는 윈도우 11이 장치 암호화를 통해 새 디바이스에서 기본적으로 암호화를 제공한다. 2024년 가을에 윈도우 11의 24H2 업데이트를 통해 더 많은 PC 하드웨어 구성에서 디바이스 암호화를 사용할 수 있게 되면, 이 기능은 더욱 확대될 것이다. editor@itworld.co.kr
비교적 깨끗하고 복잡하지 않은 윈도우 11 시스템 디스크에 보통 25만 개 이상의 파일과 9만 개 이상의 폴더가 있다. 더 복잡하고 애플리케이션이 많은 시스템 디스크에는 파일이 50만~100만 개까지 있다. 예를 들어, 필자가 현재 사용 중인 윈도우 10 PC에는 290만 개 이상의 파일과 75만 개의 폴더가 있다. 반면에 최신 레노버 요가 슬림 7x 코파일럿+ PC에는 25만 개의 파일과 5만 5,000개의 폴더가 있다. 사실, 이 모든 파일이 꼭 필요한 것은 아니다. 그렇기 때문에 정기적으로 디스크 위생을 실천하는 것이 좋다. 이런 디스크 위생을 실천하는 7단계 과정을 예시와 스크린샷을 통해 알아보자. 미리 말하자면, 여기서 소개하는 디스크 정리를 도와주는 도구는 모두 한 푼도 들지 않는다. 1단계. 윈도우 디스크 정리 도구 실행하기 예전부터 윈도우에는 디스크 공간을 정리하는 유틸리티, 즉 cleanmgr.exe라는 디스크 정리 도구가 포함되어 있다. 윈도우 10과 윈도우 11에서는 스토리지 최적화를 위한 설정 기반 "저장 공간 센스" 기능의 일부로 디스크 공간을 정리하는 추가 도구도 제공한다. 설정이 윈도우 관리 및 제어를 대신함에 따라 디스크 정리가 사라질 것이라는 추측도 있었다. 하지만 디스크 정리 유틸리티는 윈도우 10 22H2 및 윈도우 11 24H2에서 여전히 작동할 준비가 되어 있고, 문제없이 작동한다. 설정 또는 디스크 정리 접근 방식은 불필요한 윈도우 파일을 제거하는 좋은 방법이다. 옵션 A. 디스크 정리 실행 1. 디스크 정리를 실행하려면 시작 메뉴 검색창에 ‘디스크 정리’ 또는 cleanmgr.exe를 입력한다. 2. 디스크 정리 데스크톱 앱이 검색 결과 상단에 표시된다. 가능하면 결과 옵션 메뉴에서 ‘관리자 권한으로 실행’을 선택한다. 그래야만 중복되거나 오래된 운영체제 파일(예: 업그레이드 후 오래된 OS 파일 또는 오래된 업데이트)과 기타 윈도우 잔여 파일을 정리할 수 있기 때문이다. 3. 정리하려는 디스크의 드라이브 문자를 선택한다(대부분 윈도우가 있는 C 드라이브부터 시작한다). 확인 버튼을 클릭하면 디스크 정리가 시작된다. 디스크 정리 도구가 시스템의 C 드라이브를 스캔한 후, 보통은 과 같은 화면을 보여준다. 관리자 권한으로 디스크 정리를 실행하면 이전 윈도우 설치 파일은 물론 다른 파일도 지울 수 있다. 에서는 이전 윈도우 설치 파일만 25.4GB를 차지하며, 총 33.5GB를 절약할 수 있다. 엄청난 용량이다. 4. "삭제할 파일"이라고 표시된 창에서 체크박스 항목을 스크롤해 삭제할 항목을 선택한다. 오른쪽 열의 숫자는 각 항목이 차지하는 디스크 공간의 양을 나타낸다. 이전 버전으로 롤백해야 할지도 모른다면, 이전 OS 버전이나 업데이트는 삭제하지 말자. 또한 다운로드 항목은 개인 다운로드 폴더의 내용을 나타내므로 해당 폴더의 모든 내용이 필요없다고 확신하지 않는 한 삭제하지 않는 것이 좋다. 5. 삭제할 파일을 선택했으면 확인을 클릭한다. 이 프로세스는 종종 완료하는 데 몇 분 정도 걸리기도 한다. 옵션 B. 설정을 통한 정리 윈도우 10에서 설정을 통해 저정 공간을 정리한는 방법은 다음과 같다. 1. 시작> 설정> 시스템> 저장소> 저장 공간 센스 구성 또는 지금 실행> 지금 여유 공간 확보로 이동한다. 2. '지금 여유 공간 확보' 창에서 의 왼쪽 아래에 표시된 ‘지금 정리’ 버튼을 클릭한다. 이렇게 하면 디스크 정리를 실행하고 사용 가능한 모든 상자를 클릭한 것과 거의 동일한 방식으로 임시 파일, 업데이트 또는 업그레이드 파일, 전송 최적화 파일(로컬 네트워크에서 공유하도록 설계되었지만 거의 사용하지 않는 파일), 더 이상 사용하지 않는 장치 드라이버 패키지 등을 제거한다. 휴지통도 비워준다. 디스크 정리를 실행할 때와 마찬가지로 설정의 '지금 공간 확보' 옵션은 실행하는 데 몇 분 정도 걸리는 경우가 많다. 윈도우 11의 설정 기반 정리 윈도우 11에서 설정을 통한 정리는 거의 동일한 방식으로 작동하지만, 모양은 상당히 다릅니다. 1. 시작> 설정> 시스템> 저장소> 저장 공간 센스로 이동한다. 2. 화면 하단의 ‘저장 공간 센스 지금 실행’을 클릭한다(). 이 작업을 수행하면 진행률 표시기에 공이 왼쪽에서 오른쪽으로 순환하고 완료될 때까지 반복되는 등 작업이 진행 중임을 알 수 있다. 2단계. 디스크 클리너 대안으로 PC 매니저 실행하기 마이크로소프트 PC 매니저(PC Manager)는 아주 흥미로운 마이크로소프트 스토어 유틸리티로, 광범위하고 강력하며 놀랍도록 빠른 디스크 정리 기능을 제공한다. 바로 의 왼쪽 하단에 있는 딥 클린업(Deep Cleanup) 기능이다. 1. PC 매니저에서 ‘딥 클린업’을 클릭하기만 하면 과 같이 잠재적인 정리 대상 목록이 포함된 세부 정보 화면이 나타난다. 디스크 정리의 옵션과 매우 유사하지만, 더 상세하다. PC 매니저가 발견한 모든 항목에 대해 사용자가 삭제 여부를 선택할 수 있다. 기본적으로 이 기능은 에서 보는 것처럼 일반적인 의심 항목을 확인한다. 주로 윈도우 업데이트 정리 항목, 오류 보고서, 임시 파일 등이 이미 선택되어 있다. 2. 삭제하려는 추가 항목 옆의 확인란을 선택하고 삭제하지 않으려는 항목은 선택을 취소한다. 3. 선택이 완료되면 오른쪽 상단의 진행 버튼을 클릭해 청소를 시작한다. 작업을 완료하면 "정리 완료"라는 메시지가 표시되고, 확보된 디스크 공간의 총량이 표시된다. 3단계. 언클리너를 실행해 마이크로소프트 도구가 놓친 부분 찾기 캐나다 개발자 조시 셀은 라는 멋진 무료 유틸리티를 만들었다. 이 유틸리티는 윈도우의 기본 제공 유틸리티와 PC 매니저가 잡아내지 못하는 임시 및 더 이상 사용되지 않는 로그 파일을 찾아서 제거할 수 있다. 언클리너를 다운로드하려고 보면, 개발일시가 2012년이라는 것을 알 수 있다. 하지만 걱정할 필요없다. 2024년 중반의 윈도우 10/11 시스템에서 여전히 정상적으로 작동한다. 디스크 정리와 PC 매니저의 딥 클린업을 실행한 PC에서 언클리너를 실행한 결과, 과 같이 개념적으로 깨끗한 상태임에도 불구하고 정리할 파일이 거의 70MB에 달했다. 정리(Clean) 버튼을 클릭만 하면 해당 파일을 제거할 수 있다. 이 작업을 수행한 후 필자의 시스템에서 언클리너의 정리 가능 용량은 50MB 미만으로 떨어졌다. 일부 파일은 윈도우 런타임 제약 조건에 의해 잠겨 있기 때문에 이 도구가 보고하는 모든 파일을 삭제할 수는 없다. 드물지만, 아주 가끔 "양호. 시스템이 매우 깨끗하다”라는 메시지가 표시되기도 한다. 4단계. 더 이상 사용되지 않는 디바이스 드라이버 삭제하기 는 무료 오픈소스 도구로, 깃허브에서 다운로드할 수 있다. 항상 최신 릴리스를 다운로드하기 바란다. 윈도우 드라이버 전문가가 아니라면, RAPR은 오래된 드라이브 선택과 드라이버 삭제라는 두 개의 버튼만 클릭하면 된다. 1. 관리자 권한으로 RAPR을 실행한다. 시작하면 PC의 드라이버 저장소 내용을 스캔하는 데 최대 1분 정도 걸린다. 그런 다음 설치된 드라이버 목록과 체크박스가 표시된다. 2. 화면 오른쪽 상단의 오래된 드라이버 선택 버튼을 클릭하면, 처럼 RAPR이 찾은 구버전 드라이버를 자동으로 표시한다. 동일한 드라이버의 복사본을 여러 개 다운로드하는 것으로 악명 높은 인텔 DSA((Driver and Support Assistant)를 정기적으로 실행하는 테스트 PC를 사용했다. 화면 하단의 텍스트를 주의 깊게 살펴보면 RAPR이 이 PC에서 102개의 중복 또는 더 이상 사용되지 않는 드라이버를 발견했다. 3. 드라이버 삭제 버튼을 클릭하면 RAPR이 강조 표시된 모든 항목을 제거하려고 시도한다. 다행히도 RAPR은 사용 중인 드라이버를 실제로 제거하지 않으므로 놀라울 정도로 안전한 작업이다. 에서 다수의 인텔 블루투스 드라이버가 삭제 대상 항목으로 나타나는 것을 볼 수 있다. 이는 인텔 DSA가 블루투스 드라이버를 계속 설치하기 때문이다. 이로 인해 많은 중복이 발생한다. 표시된 선택 항목은 1GB의 디스크 공간을 복구하고 구버전 드라이버의 수를 102개에서 9개로 줄였다. 대부분 인쇄 나 그래픽 관련 드라이버인데, 윈도우가 고집스럽게 의존한다. RAPR를 실행해 몇 기가바이트를 복구하는 경우도 있지만, 공간 절약 효과가 이보다 더 큰 경우는 드물다. 처음 실행하면 수많은 드라이버 파일을 정리하면서 3~5GB를 복구할 수 있다. 더구나 그래픽 드라이버의 경우 크기가 1GB를 초과하는 경우가 많으므로 빠르게 증가한다. 파워 유저와 전문가라면 RAPR로 더 많은 작업을 할 수 있지만, 일반 사용자는 단순히 오래된 드라이버를 정리하는 기능만으로도 충분히 효과를 얻을 수 있다. 5단계. DISM을 사용하여 구성 요소 저장소 정리하기 윈도우 운영체제 파일은 대부분 구성 요소 저장소라고도 알려진 WinSxS 폴더에 있다. 이 폴더에는 누적 업데이트를 설치한 후, 때로는 다른 업데이트를 설치한 후에 중복되거나 더 이상 사용되지 않거나 고아가 된 요소가 포함될 수 있다. 명령줄에서 DISM(Deployment Image Servicing and Management) 도구를 사용해 정리가 필요한지 여부를 확인할 수 있다. 1. 시작하려면 관리자 권한이 있는 PowerShell 또는 명령 프롬프트 창을 연다. 윈도우 바탕화면에서 윈도우 키와 X를 누른 다음 팝업 메뉴에서 터미널(A)을 선택하거나 시작 메뉴 검색 상자에 powershell을 입력한 다음 윈도우 파워셸을 마우스 오른쪽 버튼으로 클릭하고 관리자 권한으로 실행한다. 관리자 모드의 윈도우 파워셸 창에서 다음 문자열을 입력하고 엔터키를 누르면, 와 같은 결과 화면이 나타날 것이다. dism /online /cleanup-image /analyzecomponentstore 필자는 당시 누적 업데이트 및 기타 업데이트 항목을 막 설치한 참이었다. 놀랍게도 /analyzecomponentstore는 정리할 수 있는 재생 가능한 패키지가 두 개 있다고 보고했다. 결과 화면에서는 "구성 요소 저장소 정리 권장"이라고 표시된 필드에 "그렇다"라고 응답한 것을 확인할 수 있다. 이는 DISM이 사용자를 대신해 정리할 수 있는 항목이 있다는 뜻이다. 2. 이를 실행하려면 다음과 같이 입력한다. dism /online /cleanup-image /startcomponentcleanup 결과는 과 같으며, 정리 결과를 표시하기 위해 /analyzecomponentstore 작업을 추가로 수행한다. /startcomponentcleanup 실행 이후 두 가지 진행률 표시줄(첫 번째는 10%까지만, 다음은 100%까지)에 유의하기 바란다. 이것은 x86 윈도우 버전에서 잘 알려진 DISM의 속임수로, 출력 오류이다. 실제 DISM은 정상적으로 작동한다. 이제 첫 번째와 두 번째 /analyzecomponentstore 작업의 수치를 비교해 보겠다: 컴포넌트 저장소 크기 : 13.66GB 대 9.11GB(차이 4.55GB) 실제 컴포넌트 저장소 크기 : 12.75GB 대 8.80GB(차이 3.95GB) 윈도우와 공유 : 6.81GB vs. 6.78GB(차이 0.03GB) 백업 및 비활성화 기능 : 5.81GB 대 2.02GB(차이 3.79GB) '윈도우와 공유'와 '백업 및 비활성화된 기능'의 절감량을 더하면 3.82GB로, 실제 구성 요소 저장소의 크기(3.95GB)와 거의 비슷하게 절약할 수 있다. 최근에 업데이트된 시스템은 이 기술을 사용하여 최대 4~5GB까지 복구할 수 있다. 6단계. 위즈트리로 시스템 드라이브 검사하기 모든 정리가 완료되면 시스템 드라이브를 검사해 대용량 파일이 어디에 있는지 확인하는 것이 좋다. 이때 필자는 위즈트리(WizTree)라는 무료 소프트웨어를 사용한다. 위즈트리는 디스크 콘텐츠를 트리맵 다이어그램을 생성해 대용량 파일과 폴더를 쉽게 찾을 수 있다. C 드라이브를 검사하라면 다음과 같이 진행한다. 1. WizTree 애플리케이션을 실행한다. 2. 왼쪽 상단의 파일 및 옵션 메뉴 바로 아래에 있는 풀다운 목록에서 C: 드라이브를 스캔 대상으로 선택한다( 참조). 3. 선택한 드라이브 오른쪽에 있는 스캔 버튼을 클릭한다. 선택한 드라이브에 대한 트리맵 다이어그램이 빠르게 생성되며, 대용량 드라이브의 경우에도 보통 1분 이내에 생성된다. 4TB 히타치 하드디스크를 스캔하는데 10초 이내에 완료됐다. 은 필자의 레노버 요가 슬림 7x 코파일럿+ PC의 C 드라이브를 그래픽으로 나타낸 것이다. 이 상황에서는 큰 파일을 제거하면 디스크 공간 복구에 매우 유리하다. 여기서 가장 큰 파일은 오른쪽 중앙 근처의 황록색으로 표시된 시스템 최대 절전 모드 파일(hiberfile.sys)과 시스템 페이지 파일(pagefile.sys)이다. 각각 6.1GB와 1.0GB이다. 그 다음으로 큰 파일은 USMT.PPKG이다. 간단히 조회해보면 이 파일은 윈도우 앱 파일과 설정을 스냅샷하는 데 사용되는 사용자 상태 마이그레이션 도구(USMT)에서 출력된 것이다. 윈도우 커뮤니티에 따르면, 이 정보는 윈도우 복구 환경(WinRE)의 일부이므로 보관할 가치가 있다고 한다. 실제로 최근에 재구축한 이 윈도우 설치에서 정리할 만한 뚜렷한 후보가 보이지 않는다. 하지만 어쨌든 USMT.PPKG 파일을 예로 들어 보겠다. 이 파일을 제거하는 방법은 다음과 같다: 1. 원하는 파일 위에 커서를 놓는다. 2. 마우스 오른쪽 버튼을 클릭해 팝업 메뉴를 표시한다. 3. 팝업 메뉴에서 삭제(아래에서 두 번째 항목)를 클릭해 선택한 파일을 제거한다. 트리맵에서 다른 '큰 블록'을 클릭하면 큰 공간을 복구할 수 있는 위치를 빠르게 파악할 수 있다. 예를 들어 페이징 파일과 최대 절전 모드 파일은 남아 있어야 하므로 모두 제거할 수는 없지만, 일부만 제거할 수 있다면 공간을 크게 절약할 수 있다. 필자의 경우에는 더 이상 원하지 않거나 필요하지 않은 윈도우 ISO 파일인 경우가 많다. 보통 4GB~6GB의 디스크 공간을 차지하므로, 하나씩 버리면 그 자체로 공간을 절약할 수 있다. 7단계. 사용하지 않거나 원치 않는 윈도우 앱 제거하기 디스크의 어수선한 부분을 정리하고 싶다면 사용하지 않는 앱을 제거하는 것이 좋다. 방법은 다음과 같다: 1. 설정> 앱> 설치된 앱(윈도우 11의 경우) 또는 설정> 앱> 앱 및 기능(윈도우 10의 경우)을 클릭한다. 현재 대상 PC에 설치된 모든 앱의 목록이 표시됩니다. 2. 각 앱의 오른쪽에 줄임표가 있는데, 클릭하면 더 많은 옵션이 표시된다. 앱 옆의 점 3개 아이콘을 클릭하면, 수정, 복구, 제거의 3가지 옵션 중 일부 또는 전부가 포함된 팝업 메뉴가 표시됩니다: 3. 사용하지 않는 앱은 제거 버튼을 클릭하기만 하면 쉽게 제거할 수 있다. 마이크로소프트 엣지, 마이크로소프트 스토어, 설정 앱 자체 등 일부 예외를 제외하고 사용하지 않는 항목을 선택하면 앞서 설명한 다른 정리 권장 사항에 따라 해당 항목이 차지하는 디스크 공간을 복구할 수 있다. 필자는 더 이상 사용하지 않는 서드파티 앱을 제거하고 마이크로소프트의 기본 제공 앱은 그대로 두는 편을 선호한다. 자신에게 가장 적합한 방법을 선택하는 것이 좋다. 연습이 완벽함을 만든다 이런 정리를 주기적으로 수행하면 디스크 공간을 훨씬 더 잘 제어할 수 있다. 직접 시도해 보면 무슨 말인지 곧 알게 될 것이다. 필자는 적어도 한 달에 한 번씩 정리한다. 그리고 사용자 폴더(특히 계정 하위 폴더)에는 정크 파일이 자주 쌓이는 경향이 있으므로 수시로 살펴보는 것도 잊지 말자. 이 폴더는 에서 보는 것처럼 C 드라이브에서 다른 최상위 폴더와 함께 쉽게 찾을 수 있다. 모든 작업이 끝나면 깨끗해진 컴퓨터를 행복하게 즐길 수 있다. editor@itworld.co.kr
윈도우 노트북은 맥과 비교해 한 가지 큰 장점이 있다. 바로 터치스크린이다. 마우스를 버리자는 말은 아니다. 하지만 너무 많은 사용자가 터치스크린 PC의 유용성을 간과하고 있다. 잘 활용하면 터치스크린은 업무 생산성을 크게 향상시킬 수 있다. 윈도우 환경이 마우스와 키보드를 버리고 모두 터치스크린으로 바뀌는 일은 일어나지 않겠지만, 노트북의 터치스크린은 언제나 유용하다. 문서 작업, 웹 검색, 동영상 감상 등 어떤 작업을 하든 컴퓨터의 터치스크린이 얼마나 유용한지 알 수 있는 5가지 핵심 팁을 소개한다. 윈도우 터치스크린 팁 #1. 문서에 서명하기 필자가 가장 좋아하는 터치스크린 사용 방법 중 하나는 문서에 빠르게 서명하는 것이다. 노트북의 터치패드에 정성스럽게 서명을 하거나 휴대폰의 앱을 사용하거나 스캔한 서명 이미지를 붙여 넣거나 문서를 인쇄한 후 다시 스캔하는 등 다른 방법도 있다. 하지만 최신 노트북에서 문서에 서명하는 가장 편리한 방법은 터치스크린에 직접 손가락을 대고 서명하는 것이다. 마이크로소프트 엣지 브라우저에서 PDF 문서에 서명하거나 어도비 리더 같은 애플리케이션을 사용할 수 있다. 또는 도큐사인(DocuSign) 같은 웹 기반 서명 서비스를 사용해 문서에 서명하라는 요청을 받을 수도 있다. 어느 쪽이든 PC에 터치스크린이 있으면 훨씬 쉽다. 윈도우 터치스크린 팁 #2. 문서와 웹 페이지 스크롤하기 터치스크린은 단순히 문서나 웹 페이지를 스크롤하는 용도로는 심각하게 과소평가되고 있다. 무릎 위에 노트북을 올려놓고 사용하거나 비행기 좌석의 좁은 공간에 꽉 끼어 있거나 침대에서 늦은 밤 업무용 이메일을 확인하는 등 책상을 떠나 있을 때 특히 그렇다. 이럴 때는 터치패드로 스크롤하는 것보다 손가락으로 스크롤할 수 있는 방식으로 노트북을 잡는 것이 더 편리하다. 특히 힌지를 360도 회전할 수 있어 좁은 공간에 잘 맞는 유연한 노트북을 사용한다면 더욱 그렇다. 솔직히 필자는 책상에 앉아서도 손가락으로 웹 페이지를 스크롤할 때가 있다. 아직 해보지 않았다면 한번 시도해 보기 바란다. 윈도우 터치스크린 팁 #3. 확대 및 축소하기 터치스크린은 화면을 빠르고 쉽게 확대/축소할 수 있다. 브라우저에서 구글 지도, 이미지, 웹 페이지, 문서 등을 볼 때 휴대폰에서 확대/축소할 때와 마찬가지로 핀치 투 줌을 사용한다. 작은 줌 버튼을 클릭하거나 노트북의 트랙패드에서 핀치 투 줌을 시도하는 것보다 훨씬 유용하다. 물론, 트랙패드로도 핀치 투 줌 기능을 사용할 수 있지만, 작은 트랙패드보다 큰 화면에서 하는 것이 더 쉽다. 윈도우 터치스크린 팁 #4. 제스처를 사용해 바탕화면 탐색하기 윈도우에는 맞춤형 터치스크린 제스처 모음이 사용자의 손길을 기다리고 있다. 간단하고 기억하기 쉬운 팁은 아니지만, 이런 제스처 기능은 매우 유용하다. 또한 윈도우 11은 윈도우 10보다 더 많은 내장 터치스크린 제스처를 사용할 수 있다. 주요 기능은 다음과 같다. 화면 하단에서 한 손가락으로 위로 스와이프해 시작 메뉴를 표시한다. 화면 왼쪽 가장자리에서 한 손가락으로 스와이프해 위젯 창을 표시한다. 화면 오른쪽 가장자리에서 한 손가락으로 스와이프해 알림 센터를 표시한다. 세 손가락으로 위로 스와이프하면 작업 보기로 열려 있는 모든 창이 표시된다. 세 손가락으로 아래로 스와이프하면 바탕 화면이 표시된다. 세 손가락으로 왼쪽 또는 오른쪽으로 스와이프하면 마지막으로 사용하던 앱으로 전환된다. 여러 개의 가상 데스크톱을 사용하는 경우 왼쪽 또는 오른쪽에서 네 손가락으로 스와이프하면 데스크톱을 전환할 수 있다. 윈도우 11에서 이 기능이 작동하지 않는다면, 설정> 블루투스 및 디바이스> 터치에서 '세 손가락 제스처’와 ‘네 손가락 제스처'가 활성화되어 있는지 확인하기 바란다. 윈도우 터치스크린 팁 #5. 기본적인 탭과 누르기 활용하기 터치스크린을 활용하는 다른 유용한 방법도 많이 있다. 마우스처럼 사용할 수도 있다. 무언가를 탭하는 것으로 클릭을 하고, 누르고 드래그해 이동할 수 있다. 설정 화면을 사용하거나 양식을 작성할 때는 터치패드로 커서를 이동하는 것보다 손가락으로 각 확인란을 탭하면 더 빠르게 진행할 수 있다. 키보드와 터치스크린을 함께 사용할 수도 있다. 예를 들어 파일 탐색기에서 여러 개의 파일을 선택할 때 Ctrl 키를 누른 상태에서 각 파일을 차례로 탭하면 된다. 터치패드를 사용해 각 파일을 클릭하는 것보다 Ctrl 키를 누르고 화면을 터치하는 것이 더 빠르다. 터치스크린은 노트북에서 동영상을 스트리밍할 때도 유용하게 사용할 수 있다. 노트북의 트랙패드를 사용해 재생 컨트롤을 찾는 대신 화면의 재생 컨트롤을 탭하기만 하면 된다. "비디오 또는 오디오 파일을 '스크러빙(Scrubbing)'하는 것도 터치스크린의 또 다른 훌륭한 활용법이다. 찾아보기/뒤로 가기 슬라이더를 길게 터치한 다음 손가락을 앞뒤로 움직여 동영상에서 원하는 지점을 찾을 수 있다. 노트북의 트랙패드를 사용하는 것보다 훨씬 덜 어색하다. 3D 모델링이나 CAD 애플리케이션으로 작업하는 경우, 터치스크린은 모델을 회전하는 데 매우 유용하다. 이 외에도 사용하는 앱에 따라 다양한 용도로 활용할 수 있다. 노트북 터치스크린은 없어지지 않는다 터치스크린 노트북의 생산성 향상 가치에 대해 소개했다. 당장 터치스크린 노트북을 구매할 필요는 없다. 하지만 다음 노트북 구매 시 터치스크린이 탑재된 노트북을 고려하는 것도 좋은 선택지가 될 것이다. 물론 현재 사용 중인 노트북이 펜 입력을 지원한다면 터치스크린은 훨씬 더 유용해진다. 다양한 압력 레벨을 지원하는 디지타이저를 사용하면, 노트북은 메모, 문서 표시, 그림 그리기 등을 할 때 훌륭한 도구가 된다. 사람들은 손가락으로 화면을 더럽히는 것을 싫어한다는 반론도 있다. 사실일까? 모든 사용자가 하루 종일 손가락으로 휴대폰 화면을 문지르고 있지 않은가! 스마트폰이나 터치스크린 노트북 모두 화면을 청소할 때 극세사 천만 있으면 얼룩 없이 깨끗하게 유지할 수 있다. editor@itworld.co.kr
'일'과 '삶'이라는 두 가지 영역을 상반된 것으로 보지 않는 법을 배워야 한다. 목표는 이런 요소의 균형을 맞추고 최적으로 관리하는 것이어야 한다. 우리는 "자기 관리", "정신 건강", "회복력", "내면 세계"와 같은 주제에 대해 많이 듣고 읽는다. 우리는 오늘날의 요구에 더 잘 대처하기 위한 도움이 필요하다. 테크니커 크란켄카세의 최근 연구에 따르면, 독일인의 1/3은 때때로 스트레스를 받고, 1/4은 자주 스트레스를 받는다고 한다. 독일 법정 의료보험 기관인 AOK의 2023년 연구에 따르면, 정신 질환의 원인인 스트레스는 해마다 급격히 증가하고 있다. 이런 통계에 포함되지 않으려면, 또는 이런 통계에서 벗어나려면 건강하고 균형 잡힌 삶을 살기 위해서는 정신 건강을 우선순위에 두어야 한다. 일과 삶이란 흑백논리 필자는 기업 임원을 대상으로 한 교육 코치로서 지난 몇 년 동안 다양한 직책과 영역에 있는 다양한 사람들을 만났다. 거의 모든 사람에게 스트레스는 더 잘 관리하고 싶은 문제였다. 그들은 종종 지치고, 집중력이 떨어지고, 짜증이 나고, 에너지가 부족하고, 불만족스럽다고 느낀다. 그리고 이런 사람들 대부분은 "일과 삶의 균형을 개선해야 한다"는 해결책을 이미 가지고 있다. 필자는 많은 대화를 나누면서 '일'을 권력의 어두운 면으로, '삶'을 천국으로 여긴다는 인상을 많이 받았다. 하지만 반적으로 현실과 맞지 않고 스트레스 관리에 도움이 되지 않는 태도이다. 사생활, 현재 짓고 있는 집, 젊은 어머니 또는 아버지로서의 잠못 드는 밤, 가족의 질병, 관계 문제 등에 대해 듣는 것은 드문 일이 아니다. 이런 사람들이 '다른 쪽'에서는 많은 사람에게 영감을 주는 유명 브랜드에서 일하고 있다. 방금 복잡한 문제를 해결하고 고객에게 소프트웨어를 판매했다. 새로운 팀으로 옮겼을 수도 있고, 새로운 팀에 잘 적응하고 기여할 수도 있다. 이런 배경에서 '삶'은 정말 휴식과 에너지만 가져다주고 '일'은 우리의 자원만 소모하는 것인지에 대한 의문이 생긴다. 그리고 많은 사람이 이런 태도를 되돌아보고 균형이나 건강한 비율에 필요한 것이 무엇인지 명확히 하는 것이 도움이 된다는 것을 알게 됐다. 스트레스에 대한 회복력은 매우 개인차가 크다. 성격적 특성, 스트레스에 대처하는 학습된 행동(습관), 현재의 정신 상태에 따라 달라진다. 사람의 성격은 타고난 것이며 궁극적으로 제한된 범위 내에서만 바꿀 수 있다. 하지만 행동을 배우고 자신의 상태에 대해 책임을 질 수 있는 기회도 많다. 자신의 에너지 균형을 파악하는 방법 필자는 고객이 위기 회복력을 강화할 수 있도록 지원하기 위해 코칭할 때 FiRE((Factors improving Resilience Effectiveness) 모델을 사용하는 것을 좋아한다. 이 모델은 다양한 연구를 바탕으로 회복탄력성에 영향을 미치는 다양한 행동 영역을 제시한다. 주요 행동 영역 중 하나는 개인 에너지 관리이다. 에너지를 어떻게 '관리'할 수 있을까? 무엇이 내 '배터리'를 소모하고 무엇이 충전되는지 정확히 어떻게 알 수 있으며, 일상 생활에서 이를 어떻게 고려할 수 있을까? 에너지 관리에서 균형을 찾는 것이 필수적이다. 그렇지 않으면 매번 '예비 에너지'를 사용하게 되고, 그런 상태에서는 탈출구를 찾을 수 없기 때문이다. 정보 과부하, 의미 없는 활동, 업무 과부하, 사회적 관계 부족, 항시 대기 상태 등 우리의 에너지를 고갈시키는 요인은 많다. 코칭을 하다 보면 다음과 같은 말을 자주 듣게 된다. "내 할 일 목록은 아침보다 저녁에 더 꽉 차 있다." "다른 사람의 영향을 너무 강하게 받기 때문에 아무것도 해내지 못한다." "내가 따라야 하는 프로세스 중 일부는 무의미하다." 물론 업무의 균형을 맞추고, 다양한 경험을 하고, 휴식을 취하고, 재충전을 할 수 있는 충분한 '생활' 시간을 갖는 것이 중요하다. 하지만 그것만으로 이 문제를 해결할 수 있을까? 코치들이 토론 후 해법을 제시하는 것은 다음과 같다. 자신의 효율성을 깨닫기 아침에 할 일 목록으로 하루를 시작하고 저녁에 그 중 하나도 해내지 못하면 비효율적이고 불만족스러운 기분이 들고 배터리가 방전된다. 많은 사람들이 여가 시간에 정원에서 일하거나 공예품을 만드는 이유이기도 하다. 자신이 성취한 것을 볼 수 있고 만질 수 있기 때문이다 그런데 저녁에 목록이 거의 변하지 않는 이유는 무엇일까? 근무 중에 계획에 없던 일이 발생하고 우선순위도 높으면, 계획한 일정은 망가진다. 이런 일이 객관적으로 중요하고, 무시하거나 미루거나 다른 사람에게 맡길 수 없다면, 다음과 같은 방법이 도움이 될 것이다. 할 일 목록에 '계획할 수 없는 상황에 대한 유연성' 항목을 포함한다. 이런 일은 실제 업무의 일부이지 업무에 방해가 되는 요소가 아니다. 근무시간이 끝나면 계획에 없던 업무 처리를 "완료"로 표시한다. 이는 효율성과 만족도에 큰 영향을 미친다. 계획에 없던 문제는 더 이상 업무 중단으로 인식되지 않고 완료된 작업의 일부가 된다. 헛되이 에너지를 소모한 것이 아니다. 상황에 대한 통제력 유지하기 계획에 없던 문제가 항상 모든 것을 내려놓고 일상 업무의 일부로 삼아야 할 만큼 중요한 것은 아니다. 다른 사람의 통제 하에 있는 프로젝트를 '탐색'하느라 에너지를 소모하고 집중력을 잃는 것을 방지하는 데는 다음과 같은 방법이 효과가 있다. 일주일이 끝나면 다음 주에 집중해야 할 3~5가지 주제를 간단히 생각해 본다. 이렇게 명확하게 정리하면 집중력을 유지할 가능성이 커진다. 캘린더에서 이런 문제를 다룰 수 있는 시간을 확보한다. 그렇지 않으면 캘린더가 다른 회의와 작업으로 가득 차게 된다. 일관성을 유지하고 집중해야 할 문제의 우선순위를 정하자. 이런 업무를 할 때는 방해 요소를 최소화한다. 예를 들어, 휴대폰을 끄고 회의실로 가거나 메신저의 알림 기능을 끄는 등을 수단을 동원할 수 있다. 방해 요소는 집중력을 떨어뜨리는 주요 요인이다. 집중이 깨지고 다시 이전 수준의 집중력을 회복하는 데는 최대 20분이 걸린다. 매일 시간을 정해 메시지, 이메일, 전화 등을 처리하는 것도 방법이다. 의미 찾기 코칭을 하다 보면 종종 의미와 목적이 불분명해서 우리를 괴롭히는 작업과 프로세스에 대해 이야기하게 된다. 의미는 우리의 만족도와 안정감을 위한 중요한 요소이다. 하지만 이유도 모른 채 정기적으로 업데이트해야 하는 엑셀 스프레드시트는 어떻게 해야 할까? 이런 경우 스스로 다음과 같은 질문을 던져보자. 내가 충분히 불편함을 감수하고 이 프로세스를 최적화하기 위해 주도적으로 노력하고 있는가? 아니면 개선에 나서지 않고 관찰자 역할만 하고 있는 것은 아닌가? 더 나은 프로세스는 어떤 모습이며, 이를 위해 누구를 설득해야 할까? 변화를 시작하기 위해 구체적으로 무엇을 하려고 하는가? 내가 이 프로세스를 통제할 수 없고 영향력을 행사할 수 없는가? 이런 경우, 내가 이 상황에 대한 분노에 얼마나 많은 시간과 에너지를 허비하고 있는지에 대한 의문이 생긴다. 이 시간과 에너지가 문제의 중요도에 비례하는 합리적인 수준인가? 스스로를 조절하고 의식적으로 분노와 좌절감을 줄일 수 있는가? 이미 이 문제에 대해 다시 이야기하고 있는 그룹에서 벗어날 수 있는가? 배터리 충전하기 직장에서 에너지를 고갈시키는 문제에 의식적으로 대처하는 것 외에도 정기적으로 '배터리 재충전'을 하는 것도 마찬가지로 중요하다. 스스로에게 좋은 것이 무엇인지 아는가? 예를 들어, 균형을 유지하려면 매일 어떤 일을 해야 하나요? 이는 타협할 수 없는 활동이며 절대적인 우선순위가 되어야 한다. 필자가 고객들에게 들은 효과적인 비타협적인 사항은 다음과 같다. 하루를 의식으로 시작하고 첫 번째 이메일을 바로 읽지 않는다. 시작 의식은 아침 식사, 스포츠나 운동, 명상 등을 하는 시간이 될 수 있다. 업무 중 잠시 휴식을 취하며 호흡 운동을 한다. 의식적으로 차분하게 숨을 쉬면서 안절부절못하고 바쁘게 돌아가는 마음을 다스린다. 말하자면 하드 드라이브를 잠시 종료하는 셈이다, 빛, 공기, 운동, 적절한 영양 섭취를 위한 시간이다. 휴식 시간을 이용해 책상에서 점심을 먹지 말고 근처를 잠깐 산책한다. 휴식 후 생산성이 얼마나 향상됐는지, 이런 시간이 얼마나 유용했는지 기록한다. 어떤 활동이 자신을 업무에 몰입하게 하고 언제 헌신과 에너지가 넘쳐나는지 파악한다. 이런 활동을 가능한 한 많이 하거나 에너지 관리에 도움이 되는 시간대에 배치하면 좋다. *Oliver Erbe는 공인 비즈니스 코치이자 리더십 및 조직 개발 교육 전문 서비스 회사인 리더십 초이스(Leader Choices)의 파트너이다. editor@itworld.co.kr