Пълно ръководство за компресиране на PDF
Блог

Пълно ръководство за компресиране на PDF

Изберете най-доброто решение за компресиране според типа на PDF документа и сценария на използване

Български

Основи на PDF

Преди да компресирате PDF, е важно да разберете основната структура на PDF файловете и да определите целта на компресирането, което ще ни помогне да изберем най-подходящата стратегия за компресиране.

Различните видове PDF изискват различни методи на компресиране

Черно-бели сканирания на текст: JBIG2 алгоритъмът за компресиране може да намали размера на файла с 95-98%, като същевременно запазва текста ясен и четлив

Цветни сканирания на текст: MRC технологията за компресиране може да намали размера на файла със 70-85%, като същевременно запазва цветовете

PDF файлове, базирани на текст: Естественото текстово съдържание вече е силно оптимизирано; компресирането се постига главно чрез оптимизиране на вградените изображения, като обикновено намалява размера на файла с 10-30%

Документи с векторна графика: Като например CAD чертежи, могат да бъдат компресирани чрез растеризиране до битмап, след което прилагане на черно-бяло или сиво кодиране, намалявайки размера на файла с 60-80%

Изборът на правилния метод за компресиране е ключът към осигуряването както на намален размер на файла, така и на запазено качество на документа.

Разлика между PDF файлове, базирани на текст и на изображения

PDF файловете съдържат различни елементи, главно текст, изображения и векторни графики. Понякога съдържание, което изглежда като текст, всъщност може да бъде изображение или векторна графика.

Бързи съвети за идентифициране на типовете PDF

Използвайте Chrome или Edge браузър, за да отворите PDF; съдържанието, което може да бъде избрано и маркирано, са действителни текстови елементи.

PDF файлове, базирани на текст: Съдържанието се състои от действителни текстови елементи, които могат да бъдат избрани и търсени

PDF файлове, базирани на изображения: Съдържанието съществува като изображения, като например сканирани документи или текст, представен като изображения/вектори

PDF елементи, подходящи за компресиране

Различните елементи в PDF файловете имат различен потенциал за компресиране:

  • Текстови елементи: PDF форматът вече ги е компресирал първоначално, с ограничено допълнително пространство за компресиране (обикновено само 5-10% намаление)
  • Повтарящи се обекти, прикачени файлове и шрифтове: Повечето инструменти за компресиране могат да се справят с тях ефективно, но пространството за компресиране е ограничено (обикновено 10-20% намаление)
  • Изображения и вектори: Основни обекти за PDF компресиране, предлагащи най-голям потенциал за компресиране (обикновено 50-90% намаление на обема)

Стратегии за компресиране

Компресиране на PDF, базирано на текст

За PDF файлове, които са предимно текст:

  1. Почистете излишните данни: Премахнете коментари, полета на формуляри, повтарящи се обекти
  2. Оптимизация на шрифтовете: Използвайте подмножества на шрифтове или стандартни шрифтове
  3. Регулиране на качеството на изображенията: Подходящо намалете качеството на изображенията в документа

Препоръчан инструмент: Инструмент за компресиране на PDF

Имайте предвид, че PDF файловете, базирани на текст, обикновено вече са оптимизирани по време на създаването им, като допълнителното пространство за компресиране идва главно от изображенията и векторните елементи в документа.

Компресиране на векторни графики

Векторните графики остават ясни дори когато се увеличават и по същество представляват серия от данни, описващи графиките.

CAD чертежите са типични примери, съдържащи голямо количество вектори. Въпреки че самите вектори са трудни за компресиране, значително компресиране може да бъде постигнато чрез конвертирането им в битмапи (особено черно-бели изображения). Конвертирането в черно-бели битмапи обикновено намалява оригиналния файл с 60-85%, докато конвертирането в сиво може да го намали с 50-70%.

Стъпки на операцията:

Съображения при конвертиране на CAD чертежи

Сложните вектори в PDF файловете могат да повлияят на резултатите от конвертирането на формата.

PDF файловете, съдържащи CAD чертежи, са склонни към грешки при конвертиране в Office формати, защото големият брой вектори в CAD чертежите пречат на процеса на конвертиране.

Решението е първо да се растеризират страниците, съдържащи CAD, в изображения, а след това да се извърши конвертиране на формата.

Техники за компресиране на изображения

PDF поддържа множество алгоритми за компресиране на изображения; изберете подходящия алгоритъм според различните сценарии.

Компресиране на черно-бели документи

Подходящо за документи, които могат да бъдат представени в черно-бяло (като например чисти текстови сканирания), JBIG2 алгоритъмът не съхранява информация за цветовете и може да постигне коефициенти на компресиране над 98%.

Най-добро за: Текстови сканирания, линейни рисунки
Коефициент на компресиране: 2-5% от оригиналния размер на файла (95-98% намаление)

Стъпки на обработка:

Черно-бяло конвертиране Обработка на компресиране

Компресиране на документи в сиво

Подходящо за документи, предимно използвани за черно-бяло или сиво отпечатване, компресирането се постига чрез изоставяне на информация за цветовете.

Най-добро за: Документи за печат, съдържание, което не се нуждае от запазване на цветовете
Коефициент на компресиране: 15-30% от оригиналния размер на файла (70-85% намаление)

Стъпки на обработка:

Конвертиране в сиво Обработка на компресиране

Компресиране на цветни документи

За дигитални документи, които трябва да запазят цветовете, технологията за смесено растерно съдържание (MRC) е най-добрият избор. MRC обработва изображенията, като ги разделя на три слоя:

  • Преден план: Съдържа текст и линии, обработен с висока резолюция
  • Фон: Съдържа снимки или фонове на изображения, обработен с по-ниска резолюция
  • Маска: Определя граничните области между предния план и фона

MRC опростява информацията за изображението чрез обединяване на подобни пикселни области, особено подходящ за цветни сканирания, значително намалявайки размера на файла, като същевременно поддържа яснота. В сравнение с традиционните методи за компресиране, MRC технологията обикновено произвежда 30-50% по-добри резултати от компресирането за цветни документи.

Най-добро за: Цветни сканирания, смесени документи, съдържащи текст и изображения
Коефициент на компресиране: 15-40% от оригиналния размер на файла (60-85% намаление)

Препоръчан инструмент: Мощно компресиране (Изберете ниво "Мощно компресиране", за да активирате MRC технологията)

Сравнение на ефекта от компресиране

Следната таблица обобщава очакваните ефекти от различните методи за компресиране за различни типове документи:

Тип документПрепоръчан метод на компресиранеОчакван коефициент на компресиранеВъздействие върху качествотоПриложими сценарии
Чист текстов PDFСтандартно компресиране90-95% от оригиналния размерПочти никакво въздействиеЕлектронни документи, предимно съдържащи текст
Текстов PDF с малко изображенияСтандартно компресиране70-90% от оригиналния размерЛеко въздействиеДоклади, статии
Черно-бели текстови сканиранияJBIG2 алгоритъм2-5% от оригиналния размерРъбовете на текста може леко да се замъглятСканирани документи, договори
Документи в сивоКонвертиране в сиво + компресиране15-30% от оригиналния размерЗагуба на информация за цветоветеДокументи за печат
Цветни сканирани документиMRC технология15-40% от оригиналния размерЛеко загуба на детайлиСканирани списания, цветни доклади
CAD чертежиРастеризиране + черно-бяло конвертиране15-40% от оригиналния размерЗагуба на векторни свойства, не може да се редактираИнженерни чертежи само за преглед
PDF с предимно снимкиСтандартно компресиране на изображения30-60% от оригиналния размерЗависи от нивото на компресиранеКолекции от снимки, продуктови каталози

Избор на най-доброто решение

Въз основа на характеристиките и целта на PDF документа, следвайте този поток на решение, за да изберете най-доброто решение:

  • Документи, съдържащи предимно текст: Използвайте стандартно компресиране, ръчно регулирайте резолюцията на изображението и метода на компресиране, ако е необходимо
  • Документи, съдържащи множество CAD вектори: Първо растеризирайте векторните страници, след това конвертирайте в черно-бяло или сиво
  • Черно-бели сканирани документи: Приложете JBIG2 алгоритъм
  • Документи за сив печат: Конвертирайте в сиви изображения
  • Документи, изискващи запазване на цветовете: Използвайте MRC технология (мощно компресиране)

Съображения при компресиране

Важно известие за риск

Баланс между компресиране и качество: По-високите коефициенти на компресиране обикновено означават по-ниско качество на изображението; намерете баланс между размер на файла и качество

Архивирайте оригиналните файлове: Препоръчително е да запазите оригиналните файлове преди прилагане на високи коефициенти на компресиране

Изберете стратегия според целта: Изберете различни стратегии за компресиране според крайната цел на документа (четене на екран, отпечатване или архивиране)

Обобщение

Компресирането на PDF е изкуство на баланса, изискващо избора на най-добрия метод за компресиране въз основа на типа и целта на документа. Разбирайки основния състав на PDF файловете и характеристиките на различните алгоритми за компресиране, можем да максимизираме намаляването на размера на файла, като същевременно запазваме подходяща яснота.

Препоръчани стратегии:

  • PDF файлове, базирани на текст: Използвайте стандартно компресиране
  • Черно-бели сканирания: Приложете JBIG2 алгоритъм
  • Важни цветни документи: Използвайте MRC технология

Практически инструменти