오피스ㆍ협업 / 퍼스널 컴퓨팅

“생성부터 변환, 검색까지” PDF 문서 작업의 모든 것

Anders Lundberg | PCWorld 2023.12.26
누구나 쉽게 내용을 확인할 수 있으면서도 문서 형태가 깨지지 않고 잘 보존되는 문서 포맷에 있어서 최강자는 PDF다. PDF 또는 이동가능한 문서 포맷(Portable Document Format)이라 불리는 이 파일 형식은 1990년대 초 어도비가 발신자와 수신자 시스템과 상관없이 서식이 있는 문서를 손쉽게 공유하기 위해 개발했다.
 
ⓒ Foundry

PDF는 어도비가 문서를 중립적인 방식으로 인쇄할 때 사용하려고 개발한 프로그래밍 언어인 포스트스크립트(postscript)를 단순화한 것에서 출발한다. PDF가 텍스트, 이미지, 그래픽 요소를 한 페이지에 표현할 때 코드를 사용하는 것도 이 때문이다. 래스터라이저(rasterizer)가 코드를 화면 위 픽셀이나 프린터의 점으로 바꾼다. 현재 PDF 파일은 다양한 종류의 스캔 문서, 디지털 문서 등 널리 일반적으로 쓰이고 있다. 과학 기사의 표준 포맷이자 디지털 계약서에 사용되고, 나중에 인쇄할 용도로 저장할 때도 역시 PDF 파일을 활용한다.
 

PDF 파일 읽기

윈도우에는 아직 PDF 파일을 열람하고 편집하는 내장 기본 프로그램이 없다. 대신 윈도우에서 PDF 파일을 여는 기본 설정 프로그램은 엣지 브라우저인데, 다른 브라우저처럼 PDF 뷰어를 내장하고 있다. 브라우저라고 해도 읽기 또는 흔히 생각하는 기본 기능은 매우 우수하다. 예를 들어 목차를 보고 원하는 항목을 클릭하면 바로 그 내용이 있는 페이지로 이동하고, 형광펜이나 텍스트 주석 같은 도구로 표시할 수도 있다. 저장과 인쇄도 가능하다.

이보다 더 많은 기능을 원하면 서드파티 프로그램을 설치해야 한다. 고급 편집 기능이 필요하지 않다면 무료 프로그램도 많다. PDF 포맷을 처음 개발한 어도비는 아크로뱃 리더 DC를 내놓았다. PDF 파일을 만든 업체의 제품이므로 더 안전하고, 특히 양식을 채워야 하는 작업을 할 때는 다른 프로그램보다 상대적으로 빠르다. 반면 아크로뱃 리더 DC는 컴퓨팅 자원을 많이 사용한다. 최신 컴퓨터 사용자가 아니라면 사용하기 조금 부담스러울 수 있다.
 
ⓒ Foundry

훨씬 가벼운 무료 프로그램이라면 전자책용 epub 포맷과 다양한 파일 형식을 지원하는 수마트라 PDF(Sumartra PDF)가 있다. 수마트라는 오래된 PC에서도 빠르게 실행되고 다른 무료 프로그램과 다르게 광고로 가득 차 있지도 않으며 유료 기능을 강요하지도 않는다. 이외에도 폭시트(Foxit), PDF 기어(PDF Gear), PDF 익스체인지(PDF-Xchange), 오픈소스 소프트웨어인 오큘라(Okular) 등이 PDF 프로그램으로 유명하다.
 

인쇄 메뉴에서 PDF로 저장하기

윈도우 10과 11은 가상 프린터로 거의 모든 문서를 PDF로 저장하는 기능을 지원한다. 저장하려는 문서의 프로그램에 인쇄 기능이 있다면, PDF 프린터를 선택해 얼마든지 PDF 파일로 변환할 수 있다. ‘Microsoft Printo to PDF’를 선택하기만 하면 된다. 문제는 원하는 부분만 골라서 파일로 만들 수 없다는 점이다. 예를 들어 웹 페이지를 PDF로 저장할 때가 그렇다. 웹 페이지 전체가 PDF로 만들어진다.
 
ⓒ Foundry

반면 워드 프로그램에서는 조금 더 유연하다. ‘다른 이름으로 저장’ 명령으로 이미 PDF 저장 기능을 지원한다. 크롬, 엣지, 파이어폭스 브라우저에도 인쇄 대화상자에서 사용할 수 있는 자체 PDF 저장 기능이 있다. ‘Microsoft Print to PDF’ 대신 ‘PDF로 저장’을 선택하면 사용자가 선택하고 복사하고 검색한 텍스트가 PDF로 저장된다. 다른 프로그램도 있다. 마이크로소프트의 가상 프린터 기능이 작동하지 않으면 큐트 PDF 라이터(Cute PDF Writer) 같은 대안이 있다. 작동 방식은 같다. 인쇄 대화상자에서 마이크로소프트 대신 큐트 PDF를 선택하면 된다.
 

다른 포맷을 PDF로, PDF를 다른 포맷으로 변환하는 방법

인쇄 대화상자에서 PDF로 저장하는 방법 말고도, ‘다른 이름으로 저장’ 명령으로 직접 PDF로 저장할 수 있는 프로그램도 있다. 프로그램마다 작동 방식이 달라서 결과물도 때에 따라 인쇄 방식과 같기도 하고 다르기도 하다. 어떤 방법을 쓰든, 프로그램 안에서 다시 열고 편집할 수 있으려면, 먼저 원래 문서 형식을 저장해 두어야 한다.
 
ⓒ Foundry

포맷이 다른 파일로 PDF를 생성하는 또 다른 방법은 PDF 컨버터다. 컨버터는 모든 가능한 포맷을 입력 받아서 PDF 파일로 바꿔 준다. 일부 파일 포맷은 인쇄 방법과 거의 똑같이 작동하지만, 결과가 완전히 달라지는 포맷도 있다. 어떤 결과가 더 좋은지는 그때그때 다르기 때문에 두 방법을 모두 시도해 보는 것이 좋다. PDF 파일을 다른 포맷으로 변환해 주는 컨버터도 있다. 가장 많이 쓰이는 것은 워드, 엑셀, 파워포인트 같은 마이크로소프트 오피스와 JPEG, PNG 등 이미지지만, PDF를 전자책용 EPUB으로 바꾸는 경우도 있다.

포맷이 다른 단일 파일을 PDF로, 또는 PDF에서 다른 파일로 전환하는 가장 쉬운 방법은 온라인 툴을 사용하는 것이다. 사이트가 매우 많은데, 기능은 약간씩 다르다. 어도비 역시 아크로뱃 온라인(Acrobat online)에서 PDF를 워드, 엑셀, 파워포인트, JPEG 등으로 바꾸거나, 반대로 이들 파일을 PDF로 전환하는 기능을 제공한다. Ilovepdf.com이나 freepdfconver.com 같은 사이트도 있다.
 

PDF 압축하기

내장 기능이나 인쇄 방식으로 문서를 PDF로 저장하고 나니 결과물의 크기가 매우 커질 때가 있다. 고화질 컬러 이미지 때문인데, 인쇄는 해야 하지만 고화질 컬러 이미지까지 필요하지 않다면, 다양한 툴을 적절히 사용해 압축하는 것이 좋다. 테스트를 위해 PCWorld의 기사 하나를 크롬의 내장 인쇄 기능으로 저장했더니 파일 크기가 0.17~1.2MB였다. 하지만 용량이 큰 파일은 수십 MB까지 늘어나므로 PDF 파일이 여러 개라면 압축하는 것만으로 용량을 크게 줄일 수 있다. 압축 작업 역시 온라인 PDF 툴을 사용하는 것이 편리하다. 어도비 온라인 툴은 아크로뱃 유료 버전에서만 압축을 지원한다. Ilovepdf.com에서도 PDF를 압축할 수 있다.
 
ⓒ Foundry
 

비밀번호로 파일 보호하기

PDF 포맷은 기본적으로 암호화와 비밀번호를 통해 파일을 보호한다. AES 암호화를 사용하고 비밀번호가 길수록 안전하다. 대다수 PDF 프로그램은 암호화된 파일을 열고 저장하는 기능을 지원한다. 비밀번호로 보호된 파일을 열 때마다 매번 비밀번호를 입력하는 것이 번거롭다면, 파일을 열고 PDF로 저장하기를 선택해 비밀번호가 없는 새 사본을 만들거나 같은 기능을 지원하는 서드파티 프로그램을 사용하면 된다. 어도비 아크로뱃 프로는 물론 PDF 기어 등이 이를 지원한다.
 

파워토이로 빠르고 스마트한 미리보기를

마이크로소프트 파워토이는 재미있고 실용적인 여러 기능을 묶어 놓은 프로그램이다. 윈도우에 정식 내장하기에는 약간 실험적이거나 지나치게 용도가 제한된 고급 사용자를 위한 툴이다. 파워토이 기능 중 맥OS의 오버뷰와 유사한 키카(Kika)라는 기능은 눈여겨 볼 만하다. 일종의 미리보기인데, 탐색기에서 파일을 하나 선택하고 Ctrl+스페이스 키를 누르면 파일 내용을 미리 볼 수 있다. 키보드로 다른 파일을 선택하고 볼 수도 있다. 다른 키보드 단축키를 선호하면 파워토이 설정에서 키 조합을 바꿀 수도 있다.
 
ⓒ Foundry

키카에서 PDF를 미리보기하면 챕터나 문단으로 연결되는 링크와 목차를 볼 수 있다. 이 상태에서 텍스트를 강조 표시하거나 복사하고 직접 인쇄할 수도 있다. 그래서 대부분의 경우 PDF 프로그램으로 파일을 열지 않고도 원하는 작업을 할 수 있다. 더 많은 파일 유형을 지원하는 서드파티 프로그램을 찾는다면 퀵룩(Quicklook)이 있다. 깃허브에서 무료로 다운로드할 수 있다.
 

스캔한 텍스트로 PDF를 관리하기

PDF 포맷을 가장 흔한 용도는 스캔된 여러 페이지의 문서, 책, 다른 수기 또는 인쇄물을 저장하는 것이다. 이런 문서는 스캔된 것이므로 이미지이지 디지털 텍스트가 아니라서 텍스트를 강조하거나 복사, 검색할 수 없다. 이런 제약이 있음에도 PDF 파일 속 텍스트로 무언가 작업을 하고 싶다면 해결책은 OCR 기능이 있는 소프트웨어다. PDF 기어, PDF-엑스체인지 같은 무료 프로그램이 OCR 기능을 지원한다. 가장 좋은 것은 오픈소스 프로그램 OCRmyPDF지만 명령줄 프로그램이고 설치 과정이 다소 복잡하다. 하지만 스캔된 문서나 책을 자주 다루는 사람이라면 수백, 수천 개의 파일을 자동화된 워크플로우로 처리하기가 쉽기 때문에 도전해 볼 가치가 있다.
 
PDF 검색 기능을 잘 작동하지 않는다. ⓒ Foundry
 

PDF에서 검색하기

PDF는 주로 사용설명서나 강의 교재 같은 대규모 문서용으로 사용되기 때문에 검색할 일이 많다. 하지만 안타깝게도 검색이 워드 문서만큼 간편하지 않다. 이유는 PDF 포맷의 작동 방식에 있다. 텍스트 문서 포맷과 달리 PDF에서는 텍스트가 포맷이 적용되는 비정형 텍스트 덩어리가 아니라, 페이지 위치나 사용된 글꼴 같은 여러 정보와 함께 문자열로 나타난다. 워드나 다른 프로그램에서 직접 저장한 PDF에서는 거의 문제가 되지 않지만 스캔했거나 OCR 읽기 파일은 다르다. 텍스트가 열, 표, 목록, 텍스트 상자로 이루어져 있으면 더 까다롭다. 실제로 아무 PDF 파일에서 텍스트 두 줄을 선택해 보라. 대부분은 선택한 부분이 잘못된 위치에 나타날 것이다.
 
ⓒ Foundry

마찬가지로 검색 기능에서도 문제가 생긴다. 단어가 하이픈으로 연결되어 옆에 다른 문자가 없는 경우가 대표적이다. Text document라는 단어가 text-와 document로 표시돼 있다면 검색 결과에서 완전한 단어로 검색되지 않는다. 그러니 원하는 단어를 찾지 못했다면 단어의 일부분만 검색하고, 하이픈의 전후에 있는 최대한 고유한 글자를 찾아 보는 것이 좋다. 앞선 예시의 경우 text나 document를 따로 검색하거나 다른 단어에는 없는 docu라는 문자 조합으로 검색하는 것이 팁이다.
 

PDF 양식 채우기

PDF 파일이 다른 파일 포맷과 다른 점 하나는 상호작용이 가능하다는 것이다. 많은 기업이 빈 칸을 채울 수 있는 문서를 PDF로 전송한다. 이름, 주소, 체크 상자 심지어는 여러 개를 고를 수 있는 메뉴 등의 텍스트 입력 상자를 넣을 수 있다. 이런 양식이 어도비 아크로뱃(리더 DC 포함) 외에 다른 PDF 프로그램에서 얼마나 잘 호환되는지는 각기 다르다. 일부는 대다수 프로그램에서 잘 작동하지만 아닌 것도 있다. 그러므로 PDF 파일을 여는 기본 프로그램이 아직 없다면 아크로뱃 리더 DC를 설치하는 것이 좋다. 프리셋 입력 칸이 잘 작동하지 않으면 마크업 도구로 텍스트를 직접 입력하는 방법도 있다. 텍스트 필드가 전혀 없는 양식에서도 잘 작동한다.
 
ⓒ Foundry
 

PDF 문서에 사인하기

특별한 PDF 양식으로는 디지털 사인을 요구하는 문서가 있다. 여기에서는 2가지의 각기 다른 사인을 구분하는 것이 중요하다. 수기로 쓴 사인과 최대한 비슷해 보이는 이미지나 벡터 그래픽 요소('전자 사인'으로도 알려져 있다), 그리고 완전히 디지털화된 사인이다.

전자는 개인간, 또는 기업과 개인간에 사용되는 많은 종류의 문서에 쓰인다. 예를 들면 문서로 소통해서 양방간 동의가 이루어졌음을 증명하는 임대계약서가 있다. 아크로뱃 리더 DC는 이 기능을 내장하고 있으며 사용자가 사인을 스캔한 이미지를 쓰거나 컴퓨터로 직접 사인 또는 이름을 쓸 수 있다. PDF 파일을 열고 우클릭해서 ‘직접 사인하기(Sign yourself)’를 선택한다. 후자는 보안 등급이 더 높고, 사인한 사람의 신원을 증명해야 한다. EU는 유효한 디지털 서명에 대한 일반 규정을 개발하고 있다.
editor@itworld.co.kr
 Tags PDF
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.