PDF 기초
PDF를 압축하기 전에 PDF 파일의 기본 구조를 이해하고 압축 목적을 결정하는 것이 매우 중요합니다. 이는 가장 적절한 압축 전략을 선택하는 데 도움이 됩니다.
다양한 유형의 PDF는 다양한 압축 방법이 필요합니다
흑백 텍스트 스캔: JBIG2 압축 알고리즘은 텍스트가 선명하고 읽기 쉬운 상태를 유지하면서 파일 크기를 95-98% 줄일 수 있습니다
컬러 텍스트 스캔: MRC 압축 기술은 컬러를 보존하면서 파일 크기를 70-85% 줄일 수 있습니다
텍스트 기반 PDF: 원본 텍스트 내용은 이미 고도로 최적화되어 있습니다; 압축은 주로 내장된 이미지를 최적화하여 이루어지며, 일반적으로 파일 크기를 10-30% 줄입니다
벡터 그래픽 문서: CAD 도면과 같은 문서는 비트맵으로 래스터화한 다음 흑백 또는 그레이스케일 인코딩을 적용하여 파일 크기를 60-80% 줄일 수 있습니다
올바른 압축 방법을 선택하는 것은 파일 크기 감소와 문서 품질 보존을 모두 보장하는 핵심입니다.
텍스트 기반 PDF와 이미지 기반 PDF의 차이
PDF 파일은 주로 텍스트, 이미지, 벡터 그래픽과 같은 다양한 요소를 포함합니다. 때로는 텍스트처럼 보이는 내용이 실제로는 이미지나 벡터 그래픽일 수 있습니다.
PDF 유형을 식별하기 위한 빠른 팁
Chrome이나 Edge 브라우저를 사용하여 PDF를 열어보세요; 선택하고 강조 표시할 수 있는 내용은 실제 텍스트 요소입니다.
텍스트 기반 PDF: 내용이 선택 및 검색이 가능한 실제 텍스트 요소로 구성됩니다
이미지 기반 PDF: 내용이 스캔된 문서나 이미지/벡터로 표현된 텍스트와 같은 이미지로 존재합니다
압축에 적합한 PDF 요소
PDF의 다양한 요소는 압축 가능성이 다양합니다:
- 텍스트 요소: PDF 형식은 이미 초기에 이를 압축하였으며, 추가 압축 공간이 제한적입니다(일반적으로 5-10% 감소에 불과)
- 반복되는 객체, 첨부 파일 및 폰트: 대부분의 압축 도구는 이를 효과적으로 처리할 수 있지만, 압축 공간이 제한적입니다(일반적으로 10-20% 감소)
- 이미지 및 벡터: PDF 압축의 핵심 객체로, 가장 큰 압축 잠재력을 제공합니다(일반적으로 50-90% 볼륨 감소)
압축 전략
텍스트 기반 PDF 압축
주로 텍스트로 구성된 PDF의 경우:
- 중복 데이터 정리: 주석, 양식 필드, 반복 객체 제거
- 폰트 최적화: 서브셋 폰트 또는 표준 폰트 사용
- 이미지 품질 조정: 문서 내 이미지 품질을 적절히 감소
추천 도구: PDF 압축 도구
텍스트 기반 PDF는 일반적으로 생성 중에 이미 최적화되어 있으며, 추가 압축 공간은 주로 문서 내 이미지 및 벡터 요소에서 비롯됩니다.
벡터 그래픽 압축
벡터 그래픽은 확대해도 선명하게 유지되며 본질적으로 그래픽을 설명하는 일련의 데이터 지침입니다.
CAD 도면은 대량의 벡터를 포함하는 전형적인 예입니다. 벡터 자체는 압축하기 어렵지만, 비트맵(특히 흑백 이미지)으로 변환하여 상당한 압축을 달성할 수 있습니다. 흑백 비트맵으로 변환하면 일반적으로 원본 파일이 60-85% 감소하며, 그레이스케일로 변환하면 50-70% 감소할 수 있습니다.
작업 단계:
CAD 도면 변환 고려사항
PDF의 복잡한 벡터는 형식 변환 결과에 영향을 미칠 수 있습니다.
CAD 도면을 포함하는 PDF는 CAD 도면의 많은 벡터가 변환 과정을 방해하기 때문에 Office 형식으로 변환할 때 오류가 발생하기 쉽습니다.
해결책은 먼저 CAD가 포함된 페이지를 이미지로 래스터화한 다음 형식 변환을 수행하는 것입니다.
이미지 압축 기술
PDF는 여러 이미지 압축 알고리즘을 지원합니다; 다양한 시나리오에 따라 적절한 알고리즘을 선택하세요.
흑백 문서 압축
흑백으로 표현할 수 있는 문서(예: 순수 텍스트 스캔)에 적합하며, JBIG2 알고리즘은 색상 정보를 저장하지 않고 98% 이상의 압축률을 달성할 수 있습니다.
최적 용도: 텍스트 스캔, 라인 드로잉
압축률: 원본 파일 크기의 2-5%(95-98% 감소)
처리 단계:
흑백 변환 압축 처리그레이스케일 문서 압축
주로 흑백 또는 그레이스케일 인쇄에 사용되는 문서에 적합하며, 색상 정보를 포기함으로써 압축이 달성됩니다.
최적 용도: 인쇄용 문서, 색상 보존이 필요 없는 콘텐츠
압축률: 원본 파일 크기의 15-30%(70-85% 감소)
처리 단계:
그레이스케일 변환 압축 처리컬러 문서 압축
색상을 보존해야 하는 디지털 문서의 경우, 혼합 래스터 콘텐츠(MRC) 기술이 최선의 선택입니다. MRC는 이미지를 세 계층으로 나누어 처리합니다:
- 전경 계층: 텍스트와 선을, 고해상도로 처리
- 배경 계층: 사진이나 이미지 배경을, 더 낮은 해상도로 처리
- 마스크 계층: 전경과 배경 사이의 경계 영역을 정의
MRC는 유사한 픽셀 영역을 병합하여 이미지 정보를 단순화하며, 특히 컬러 스캔에 적합하여 선명도를 유지하면서 파일 크기를 크게 줄입니다. 전통적인 압축 방법과 비교하여, MRC 기술은 일반적으로 컬러 문서에 대해 30-50% 더 나은 압축 결과를 제공합니다.
최적 용도: 컬러 스캔, 텍스트와 이미지를 포함하는 혼합 문서
압축률: 원본 파일 크기의 15-40%(60-85% 감소)
추천 도구: 강력한 압축 (MRC 기술을 활성화하려면 "강력한 압축" 레벨 선택)
압축 효과 비교
다음 표는 다양한 문서 유형에 대한 다양한 압축 방법의 예상 효과를 요약합니다:
문서 유형 | 권장 압축 방법 | 예상 압축률 | 품질 영향 | 적용 가능한 시나리오 |
---|---|---|---|---|
순수 텍스트 PDF | 표준 압축 | 원본 크기의 90-95% | 거의 영향 없음 | 주로 텍스트를 포함하는 전자 문서 |
소수의 이미지가 있는 텍스트 PDF | 표준 압축 | 원본 크기의 70-90% | 약간의 영향 | 보고서, 기사 |
흑백 텍스트 스캔 | JBIG2 알고리즘 | 원본 크기의 2-5% | 텍스트 가장자리가 약간 흐려질 수 있음 | 스캔된 문서, 계약서 |
그레이스케일 문서 | 그레이스케일 변환 + 압축 | 원본 크기의 15-30% | 색상 정보 손실 | 인쇄용 문서 |
컬러 스캔 문서 | MRC 기술 | 원본 크기의 15-40% | 세부 사항 약간 손실 | 스캔된 잡지, 컬러 보고서 |
CAD 도면 | 래스터화 + 흑백 변환 | 원본 크기의 15-40% | 벡터 속성 손실, 편집 불가 | 보기 전용 엔지니어링 도면 |
주로 사진이 있는 PDF | 표준 이미지 압축 | 원본 크기의 30-60% | 압축 수준에 따라 다름 | 사진 컬렉션, 제품 카탈로그 |
최적의 솔루션 선택
PDF 문서 특성과 목적에 따라, 최적의 솔루션을 선택하기 위해 다음 결정 흐름을 따르세요:
- 주로 텍스트를 포함하는 문서: 표준 압축 사용, 필요한 경우 이미지 해상도와 압축 방법 수동 조정
- 다수의 CAD 벡터를 포함하는 문서: 먼저 벡터 페이지를 래스터화한 다음 흑백 또는 그레이스케일로 변환
- 흑백 스캔 문서: JBIG2 알고리즘 적용
- 그레이스케일 인쇄용 문서: 그레이스케일 이미지로 변환
- 색상 보존이 필요한 문서: MRC 기술 사용(강력한 압축)
압축 고려사항
중요 위험 공지
압축과 품질의 트레이드오프: 더 높은 압축률은 일반적으로 더 낮은 이미지 품질을 의미합니다; 파일 크기와 품질 사이의 균형을 찾으세요
원본 파일 백업: 높은 압축률을 적용하기 전에 원본 파일을 보관하는 것이 좋습니다
목적에 따른 전략 선택: 문서의 최종 목적(화면 읽기, 인쇄 또는 보관)에 따라 다른 압축 전략을 선택하세요
요약
PDF 압축은 문서 유형과 목적에 따라 최적의 압축 방법을 선택해야 하는 균형의 예술입니다. PDF의 기본 구성과 다양한 압축 알고리즘의 특성을 이해함으로써, 적절한 선명도를 유지하면서 파일 크기 감소를 최대화할 수 있습니다.
권장 전략:
- 텍스트 기반 PDF: 표준 압축 사용
- 흑백 스캔: JBIG2 알고리즘 적용
- 중요한 컬러 문서: MRC 기술 사용
실용적인 도구
PDF 벡터 래스터화 도구
복잡한 벡터 그래픽을 비트맵 형식으로 변환하여 CAD 변환 문제 해결
PDF 흑백/그레이스케일 변환 도구
컬러 PDF를 파일 크기를 줄이기 위해 흑백 또는 그레이스케일 형식으로 변환
PDF 스마트 압축 도구
문서 유형을 자동으로 감지하고 최적의 압축 알고리즘 적용