Logo
Повне керівництво зі стиснення PDF
Блог

Повне керівництво зі стиснення PDF

Оберіть найкраще рішення для стиснення на основі типу PDF документа та сценарію використання

Українська

Основи PDF

Перед стисненням PDF важливо розуміти базову структуру PDF-файлів і визначити мету стиснення, що допоможе нам вибрати найбільш відповідну стратегію стиснення.

Різні типи PDF вимагають різних методів стиснення

Чорно-білі скановані тексти: Алгоритм стиснення JBIG2 може зменшити розмір файлу на 95-98%, зберігаючи текст чітким і читабельним

Кольорові скановані тексти: Технологія стиснення MRC може зменшити розмір файлу на 70-85%, зберігаючи кольори

PDF на основі тексту: Вихідний текстовий вміст уже високо оптимізований; стиснення досягається головним чином шляхом оптимізації вбудованих зображень, зазвичай зменшуючи розмір файлу на 10-30%

Документи з векторною графікою: Наприклад, креслення CAD, можуть бути стиснуті шляхом растеризації в растрове зображення з подальшим застосуванням чорно-білого або сірого кодування, зменшуючи розмір файлу на 60-80%

Вибір правильного методу стиснення є ключем до забезпечення як зменшеного розміру файлу, так і збереженої якості документа.

Різниця між PDF на основі тексту та на основі зображень

PDF-файли містять різні елементи, переважно текст, зображення та векторну графіку. Іноді вміст, який виглядає як текст, насправді може бути зображенням або векторною графікою.

Швидкі поради для визначення типів PDF

Використовуйте браузер Chrome або Edge для відкриття PDF; вміст, який можна виділити та підсвітити, є справжніми текстовими елементами.

PDF на основі тексту: Вміст складається з справжніх текстових елементів, які можна вибрати та шукати

PDF на основі зображень: Вміст існує як зображення, наприклад, скановані документи або текст, представлений як зображення/вектори

Елементи PDF, придатні для стиснення

Різні елементи в PDF мають різний потенціал стиснення:

  • Текстові елементи: Формат PDF вже стиснув їх початково, з обмеженим додатковим простором для стиснення (зазвичай лише 5-10% зменшення)
  • Повторювані об'єкти, вкладення та шрифти: Більшість інструментів стиснення можуть ефективно обробляти їх, але простір для стиснення обмежений (зазвичай 10-20% зменшення)
  • Зображення та вектори: Основні об'єкти для стиснення PDF, що пропонують найбільший потенціал стиснення (зазвичай 50-90% зменшення обсягу)

Стратегії стиснення

Стиснення PDF на основі тексту

Для PDF, які переважно складаються з тексту:

  1. Очистити надлишкові дані: Видалити коментарі, поля форм, повторювані об'єкти
  2. Оптимізація шрифтів: Використовувати підмножини шрифтів або стандартні шрифти
  3. Регулювання якості зображення: Відповідно зменшити якість зображень у документі

Рекомендований інструмент: Інструмент стиснення PDF

Зауважте, що PDF на основі тексту зазвичай уже оптимізовані під час створення, з додатковим простором для стиснення, що походить переважно від зображень та векторних елементів у документі.

Стиснення векторної графіки

Векторна графіка залишається чіткою навіть при збільшенні і по суті являє собою серію даних інструкцій, що описують графіку.

Креслення CAD є типовими прикладами, що містять велику кількість векторів. Хоча самі вектори важко стиснути, значне стиснення можна досягти, перетворивши їх на растрові зображення (особливо чорно-білі). Перетворення на чорно-білі растрові зображення зазвичай зменшує оригінальний файл на 60-85%, тоді як перетворення на сірий відтінок може зменшити його на 50-70%.

Кроки операції:

Особливості перетворення креслень CAD

Складні вектори в PDF можуть впливати на результати перетворення формату.

PDF-файли, що містять креслення CAD, схильні до помилок при перетворенні в формати Office, оскільки велика кількість векторів в кресленнях CAD перешкоджає процесу перетворення.

Рішення полягає в тому, щоб спочатку растеризувати сторінки з CAD у зображення, а потім виконати перетворення формату.

Техніки стиснення зображень

PDF підтримує кілька алгоритмів стиснення зображень; оберіть відповідний алгоритм на основі різних сценаріїв.

Стиснення чорно-білих документів

Підходить для документів, які можна представити в чорно-білому форматі (наприклад, чисті текстові сканування), алгоритм JBIG2 не зберігає інформацію про колір і може досягти ступеня стиснення понад 98%.

Найкраще для: Сканування тексту, лінійних малюнків
Коефіцієнт стиснення: 2-5% від оригінального розміру файлу (зменшення на 95-98%)

Кроки обробки:

Чорно-біле перетворення Обробка стиснення

Стиснення документів у відтінках сірого

Підходить для документів, які використовуються переважно для чорно-білого або сірого друку, стиснення досягається шляхом відмови від інформації про колір.

Найкраще для: Документів для друку, вмісту, який не потребує збереження кольорів
Коефіцієнт стиснення: 15-30% від оригінального розміру файлу (зменшення на 70-85%)

Кроки обробки:

Перетворення в сірий Обробка стиснення

Стиснення кольорових документів

Для цифрових документів, які потребують збереження кольорів, технологія Mixed Raster Content (MRC) є найкращим вибором. MRC обробляє зображення, розділяючи їх на три шари:

  • Передній план: Містить текст і лінії, оброблені з високою роздільною здатністю
  • Фон: Містить фотографії або фони зображень, оброблені з нижчою роздільною здатністю
  • Маска: Визначає граничні області між переднім планом і фоном

MRC спрощує інформацію про зображення, об'єднуючи подібні піксельні області, особливо підходить для кольорових сканувань, значно зменшуючи розмір файлу, зберігаючи чіткість. Порівняно з традиційними методами стиснення, технологія MRC зазвичай дає на 30-50% кращі результати стиснення для кольорових документів.

Найкраще для: Кольорові сканування, змішані документи, що містять текст і зображення
Коефіцієнт стиснення: 15-40% від оригінального розміру файлу (зменшення на 60-85%)

Рекомендований інструмент: Потужне стиснення (Оберіть рівень "Потужне стиснення", щоб увімкнути технологію MRC)

Порівняння ефекту стиснення

Наступна таблиця підсумовує очікувані ефекти різних методів стиснення для різних типів документів:

Тип документаРекомендований метод стисненняОчікуваний коефіцієнт стисненняВплив на якістьПридатні сценарії
Чистий текстовий PDFСтандартне стиснення90-95% від оригінального розміруМайже немає впливуЕлектронні документи, які містять переважно текст
Текстовий PDF з кількома зображеннямиСтандартне стиснення70-90% від оригінального розміруНезначний впливЗвіти, статті
Чорно-білі скановані текстиАлгоритм JBIG22-5% від оригінального розміруКраї тексту можуть бути трохи розмитіСкановані документи, контракти
Документи в сіромуПеретворення в сірий + стиснення15-30% від оригінального розміруВтрата інформації про колірДокументи для друку
Кольорові скановані документиТехнологія MRC15-40% від оригінального розміруНезначна втрата деталейСкановані журнали, кольорові звіти
Креслення CADРастеризація + чорно-біле перетворення15-40% від оригінального розміруВтрата векторних властивостей, неможливо редагуватиІнженерні креслення лише для перегляду
PDF переважно з фотографіямиСтандартне стиснення зображень30-60% від оригінального розміруЗалежить від рівня стисненняКолекції фотографій, каталоги продукції

Вибір найкращого рішення

На основі характеристик і мети PDF-документа дотримуйтесь цього потоку рішень для вибору найкращого рішення:

  • Документи, що переважно містять текст: Використовуйте стандартне стиснення, вручну налаштуйте роздільну здатність зображення та метод стиснення за необхідності
  • Документи, що містять численні вектори CAD: Спочатку растеризуйте векторні сторінки, потім перетворіть на чорно-білий або сірий
  • Чорно-білі скановані документи: Застосуйте алгоритм JBIG2
  • Документи для сірого друку: Перетворіть на сірі зображення
  • Документи, що потребують збереження кольору: Використовуйте технологію MRC (потужне стиснення)

Міркування щодо стиснення

Важливе повідомлення про ризик

Компроміс між стисненням і якістю: Вищі коефіцієнти стиснення зазвичай означають нижчу якість зображення; знайдіть баланс між розміром файлу та якістю

Резервне копіювання оригінальних файлів: Рекомендується зберігати оригінальні файли перед застосуванням високих коефіцієнтів стиснення

Вибирайте стратегію на основі мети: Обирайте різні стратегії стиснення на основі кінцевої мети документа (читання на екрані, друк або архівування)

Підсумок

Стиснення PDF — це мистецтво балансу, що вимагає вибору найкращого методу стиснення на основі типу та мети документа. Розуміючи основний склад PDF та характеристики різних алгоритмів стиснення, ми можемо максимізувати зменшення розміру файлу, зберігаючи відповідну чіткість.

Рекомендовані стратегії:

  • PDF на основі тексту: Використовуйте стандартне стиснення
  • Чорно-білі сканування: Застосуйте алгоритм JBIG2
  • Важливі кольорові документи: Використовуйте технологію MRC

Практичні інструменти