Logo
Kompletny przewodnik po kompresji PDF
Blog

Kompletny przewodnik po kompresji PDF

Wybierz najlepsze rozwiązanie kompresji w zależności od typu dokumentu PDF i scenariusza użycia

Polski

Podstawy PDF

Przed kompresją PDF ważne jest zrozumienie podstawowej struktury plików PDF i określenie celu kompresji, co pomoże nam wybrać najbardziej odpowiednią strategię kompresji.

Różne typy PDF wymagają różnych metod kompresji

Czarno-białe skany tekstu: Algorytm kompresji JBIG2 może zmniejszyć rozmiar pliku o 95-98%, zachowując czytelność i wyrazistość tekstu

Kolorowe skany tekstu: Technologia kompresji MRC może zmniejszyć rozmiar pliku o 70-85%, zachowując kolory

PDF oparte na tekście: Oryginalny tekst jest już wysoce zoptymalizowany; kompresja jest osiągana głównie poprzez optymalizację osadzonych obrazów, zazwyczaj zmniejszając rozmiar pliku o 10-30%

Dokumenty z grafiką wektorową: Takie jak rysunki CAD, mogą być kompresowane poprzez rasteryzację do bitmap, a następnie zastosowanie kodowania czarno-białego lub w skali szarości, zmniejszając rozmiar pliku o 60-80%

Wybór właściwej metody kompresji jest kluczem do zapewnienia zarówno zmniejszonego rozmiaru pliku, jak i zachowania jakości dokumentu.

Różnica między PDF opartym na tekście a opartym na obrazie

Pliki PDF zawierają różne elementy, głównie tekst, obrazy i grafikę wektorową. Czasami treść, która wygląda jak tekst, może w rzeczywistości być obrazem lub grafiką wektorową.

Szybkie wskazówki do identyfikacji typów PDF

Użyj przeglądarki Chrome lub Edge do otwarcia PDF; treść, którą można zaznaczyć i podświetlić, to rzeczywiste elementy tekstowe.

PDF oparte na tekście: Treść składa się z rzeczywistych elementów tekstowych, które można zaznaczyć i przeszukiwać

PDF oparte na obrazie: Treść istnieje jako obrazy, takie jak zeskanowane dokumenty lub tekst przedstawiony jako obrazy/wektory

Elementy PDF odpowiednie do kompresji

Różne elementy w PDF mają różny potencjał kompresji:

  • Elementy tekstowe: Format PDF już je początkowo skompresował, z ograniczoną przestrzenią na dodatkową kompresję (zazwyczaj tylko 5-10% redukcji)
  • Powtarzające się obiekty, załączniki i czcionki: Większość narzędzi do kompresji może je efektywnie obsłużyć, ale przestrzeń kompresji jest ograniczona (zazwyczaj 10-20% redukcji)
  • Obrazy i wektory: Kluczowe obiekty do kompresji PDF, oferujące największy potencjał kompresji (zazwyczaj 50-90% redukcji objętości)

Strategie kompresji

Kompresja PDF opartego na tekście

Dla PDF głównie zawierających tekst:

  1. Wyczyść zbędne dane: Usuń komentarze, pola formularzy, powtarzające się obiekty
  2. Optymalizacja czcionek: Użyj podzbiorów czcionek lub standardowych czcionek
  3. Dostosowanie jakości obrazów: Odpowiednio zmniejsz jakość obrazów w dokumencie

Zalecane narzędzie: Narzędzie kompresji PDF

Zauważ, że PDF oparte na tekście są zazwyczaj już zoptymalizowane podczas tworzenia, z dodatkową przestrzenią kompresji pochodzącą głównie z obrazów i elementów wektorowych w dokumencie.

Kompresja grafiki wektorowej

Grafika wektorowa pozostaje wyraźna nawet po powiększeniu i zasadniczo jest serią instrukcji danych opisujących grafikę.

Rysunki CAD to typowe przykłady zawierające dużą liczbę wektorów. Chociaż same wektory są trudne do skompresowania, znaczącą kompresję można osiągnąć przekształcając je w bitmapy (szczególnie obrazy czarno-białe). Konwersja do czarno-białych bitmap zazwyczaj zmniejsza oryginalny plik o 60-85%, podczas gdy konwersja do skali szarości może zmniejszyć go o 50-70%.

Kroki operacji:

Uwagi dotyczące konwersji rysunków CAD

Złożone wektory w PDF mogą wpływać na wyniki konwersji formatu.

Pliki PDF zawierające rysunki CAD są podatne na błędy podczas konwersji do formatów Office, ponieważ duża liczba wektorów w rysunkach CAD zakłóca proces konwersji.

Rozwiązaniem jest najpierw rasteryzacja stron zawierających CAD do obrazów, a następnie wykonanie konwersji formatu.

Techniki kompresji obrazów

PDF obsługuje wiele algorytmów kompresji obrazów; wybierz odpowiedni algorytm w oparciu o różne scenariusze.

Kompresja dokumentów czarno-białych

Odpowiednia dla dokumentów, które można przedstawić w czerni i bieli (jak czyste skany tekstu), algorytm JBIG2 nie przechowuje informacji o kolorach i może osiągnąć stopnie kompresji powyżej 98%.

Najlepsze dla: Skanów tekstu, rysunków liniowych
Współczynnik kompresji: 2-5% oryginalnego rozmiaru pliku (redukcja o 95-98%)

Kroki przetwarzania:

Konwersja na czarno-biały Przetwarzanie kompresji

Kompresja dokumentów w skali szarości

Odpowiednia dla dokumentów używanych głównie do druku czarno-białego lub w skali szarości, kompresja jest osiągana poprzez rezygnację z informacji o kolorze.

Najlepsze dla: Dokumentów do druku, treści niewymagających zachowania kolorów
Współczynnik kompresji: 15-30% oryginalnego rozmiaru pliku (redukcja o 70-85%)

Kroki przetwarzania:

Konwersja na skalę szarości Przetwarzanie kompresji

Kompresja dokumentów kolorowych

Dla dokumentów cyfrowych wymagających zachowania kolorów najlepszym wyborem jest technologia Mixed Raster Content (MRC). MRC przetwarza obrazy dzieląc je na trzy warstwy:

  • Warstwa pierwszego planu: Zawiera tekst i linie, przetwarzane w wysokiej rozdzielczości
  • Warstwa tła: Zawiera zdjęcia lub tła obrazów, przetwarzane w niższej rozdzielczości
  • Warstwa maski: Definiuje obszary graniczne między pierwszym planem a tłem

MRC upraszcza informacje o obrazie poprzez łączenie podobnych obszarów pikseli, szczególnie odpowiednie dla kolorowych skanów, znacząco zmniejszając rozmiar pliku przy zachowaniu wyrazistości. W porównaniu do tradycyjnych metod kompresji, technologia MRC zazwyczaj daje o 30-50% lepsze wyniki kompresji dla dokumentów kolorowych.

Najlepsze dla: Kolorowych skanów, mieszanych dokumentów zawierających tekst i obrazy
Współczynnik kompresji: 15-40% oryginalnego rozmiaru pliku (redukcja o 60-85%)

Zalecane narzędzie: Potężna kompresja (Wybierz poziom "Potężna kompresja", aby aktywować technologię MRC)

Porównanie efektów kompresji

Poniższa tabela podsumowuje oczekiwane efekty różnych metod kompresji dla różnych typów dokumentów:

Typ dokumentuZalecana metoda kompresjiOczekiwany współczynnik kompresjiWpływ na jakośćOdpowiednie scenariusze
Czysty tekst PDFStandardowa kompresja90-95% oryginalnego rozmiaruPrawie brak wpływuDokumenty elektroniczne zawierające głównie tekst
PDF z tekstem i kilkoma obrazamiStandardowa kompresja70-90% oryginalnego rozmiaruNiewielki wpływRaporty, artykuły
Czarno-białe skany tekstuAlgorytm JBIG22-5% oryginalnego rozmiaruKrawędzie tekstu mogą być nieco rozmyteSkanowane dokumenty, umowy
Dokumenty w skali szarościKonwersja na skalę szarości + kompresja15-30% oryginalnego rozmiaruUtrata informacji o kolorzeDokumenty do druku
Kolorowe skanowane dokumentyTechnologia MRC15-40% oryginalnego rozmiaruNieznaczna utrata szczegółówSkanowane czasopisma, kolorowe raporty
Rysunki CADRasteryzacja + konwersja na czarno-biały15-40% oryginalnego rozmiaruUtrata właściwości wektorowych, nie można edytowaćRysunki inżynieryjne tylko do przeglądania
PDF głównie ze zdjęciamiStandardowa kompresja obrazów30-60% oryginalnego rozmiaruZależy od poziomu kompresjiKolekcje zdjęć, katalogi produktów

Wybór najlepszego rozwiązania

W oparciu o charakterystykę i cel dokumentu PDF, podążaj za tym przepływem decyzyjnym, aby wybrać najlepsze rozwiązanie:

  • Dokumenty zawierające głównie tekst: Użyj standardowej kompresji, ręcznie dostosuj rozdzielczość obrazu i metodę kompresji, jeśli to konieczne
  • Dokumenty zawierające wiele wektorów CAD: Najpierw rasteryzuj strony wektorowe, następnie przekonwertuj na czarno-białe lub skalę szarości
  • Czarno-białe skanowane dokumenty: Zastosuj algorytm JBIG2
  • Dokumenty do druku w skali szarości: Przekonwertuj na obrazy w skali szarości
  • Dokumenty wymagające zachowania koloru: Użyj technologii MRC (potężna kompresja)

Uwagi dotyczące kompresji

Ważne informacje o ryzyku

Kompromis między kompresją a jakością: Wyższe stopnie kompresji zazwyczaj oznaczają niższą jakość obrazu; znajdź równowagę między rozmiarem pliku a jakością

Kopia zapasowa oryginalnych plików: Zaleca się zachowanie oryginalnych plików przed zastosowaniem wysokich stopni kompresji

Wybierz strategię opartą na celu: Wybierz różne strategie kompresji w oparciu o ostateczny cel dokumentu (czytanie na ekranie, drukowanie lub archiwizacja)

Podsumowanie

Kompresja PDF to sztuka równowagi, wymagająca wyboru najlepszej metody kompresji w oparciu o typ i cel dokumentu. Rozumiejąc podstawowy skład PDF i charakterystykę różnych algorytmów kompresji, możemy maksymalizować redukcję rozmiaru pliku przy jednoczesnym zachowaniu odpowiedniej wyrazistości.

Zalecane strategie:

  • PDF oparte na tekście: Użyj standardowej kompresji
  • Czarno-białe skany: Zastosuj algorytm JBIG2
  • Ważne dokumenty kolorowe: Użyj technologii MRC

Praktyczne narzędzia