PDF Image Extractor

Плагин Documentize PDF Image Extractor для .NET позволяет вам легко извлекать изображения из PDF-документов. Он сканирует ваши PDF-файлы, определяет встроенные изображения и извлекает их, сохраняя оригинальное качество и формат. Этот инструмент улучшает доступность визуального контента и упрощает процесс извлечения изображений из PDF.

Как извлечь изображения из PDF

Чтобы извлечь изображения из PDF-файла, выполните следующие шаги:

  1. Создайте экземпляр класса ImageExtractor.
  2. Создайте экземпляр класса ImageExtractorOptions.
  3. Добавьте путь к входному файлу в параметры.
  4. Обработайте извлечение изображения с помощью плагина.
  5. Извлеките изображения из контейнера результата.
 1using var plugin = new ImageExtractor();
 2
 3// Создайте экземпляр класса ImageExtractorOptions
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// Добавьте путь к входному файлу
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Получите извлеченное изображение и сохраните его в файл
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

Извлечение изображений из нескольких PDF-файлов

Плагин ImageExtractor поддерживает пакетную обработку, позволяя извлекать изображения из нескольких PDF-файлов одновременно. Эта функция особенно полезна, когда у вас есть коллекция PDF-файлов, и необходимо извлечь все изображения за один раз.

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// Добавьте несколько входных PDF-файлов
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(options);
11
12// Сохраните извлеченные изображения из всех файлов
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

Ключевые особенности:

  • Извлечение встроенных изображений: Определяйте и извлекайте изображения из PDF-документов.
  • Сохранение качества изображения: Обеспечивает сохранение оригинального качества извлеченных изображений.
  • Пакетная обработка: Извлекайте изображения из нескольких PDF-документов за одну операцию.
  • Гибкий вывод: Сохраняйте извлеченные изображения в вашем предпочтительном формате или месте.
 Русский