Извлечение изображений

The Documentize PDF Extractor for .NET plugin enables you to effortlessly extract images from PDF documents. It scans your PDF files, identifies embedded images, and extracts them while maintaining their original quality and format. This tool enhances the accessibility of visual content and streamlines the process of retrieving images from PDFs.

Как извлечь изображения из PDF

Чтобы извлечь изображения из PDF‑файла, выполните следующие шаги:

Создайте экземпляр класса ExtractImagesOptions.
Добавьте путь к входному файлу в параметры с помощью метода AddInput.
Укажите путь к каталогу вывода для изображений с помощью метода AddOutput.
Выполните процесс извлечения изображений с помощью плагина.
Получите извлечённые изображения из контейнера результата.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Извлечение изображений из PDF‑файла в потоки без папки

The PdfExtractor plugin supports saving to streams, which allows you to extract images from PDF files into streams without using temporary folders.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Ключевые особенности:

Извлечение встроенных изображений: определение и извлечение изображений из PDF‑документов.
Сохранение качества изображений: обеспечивает сохранение оригинального качества извлечённых изображений.
Гибкий вывод: сохранение извлечённых изображений в желаемом формате или месте.