Извлечение изображений

Плагин Documentize PDF Extractor for .NET позволяет без усилий извлекать изображения из PDF‑документов. Он сканирует ваши PDF‑файлы, определяет встроенные изображения и извлекает их, сохраняя исходное качество и формат. Этот инструмент повышает доступность визуального контента и упрощает процесс получения изображений из PDF‑файлов.

Как извлечь изображения из PDF

Чтобы извлечь изображения из PDF‑файла, выполните следующие шаги:

  1. Создайте экземпляр класса ExtractImagesOptions.
  2. Добавьте путь к входному файлу в параметры с помощью метода AddInput.
  3. Укажите путь к каталогу вывода для изображений с помощью метода AddOutput.
  4. Выполните процесс извлечения изображений с помощью плагина.
  5. Получите извлечённые изображения из контейнера результатов.
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Извлечение изображений из PDF‑файла в потоки без папки

Плагин PdfExtractor поддерживает сохранение в потоки, что позволяет извлекать изображения из PDF‑файлов непосредственно в потоки без использования временных папок.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Ключевые возможности:

  • Извлечение встроенных изображений: Определение и извлечение изображений из PDF‑документов.
  • Сохранение качества изображений: Гарантирует, что извлечённые изображения сохранят оригинальное качество.
  • Гибкий вывод: Сохранение извлечённых изображений в желаемом формате или месте.
 Русский