Extract Images

Плагин Documentize PDF Extractor for .NET позволяет вам без труда извлекать изображения из PDF-документов. Он сканирует ваши PDF-файлы, идентифицирует встроенные изображения и извлекает их, сохраняя их оригинальное качество и формат. Этот инструмент повышает доступность визуального контента и упрощает процесс извлечения изображений из PDF-файлов.

Как извлечь изображения из PDF

Чтобы извлечь изображения из PDF-файла, выполните следующие шаги:

  1. Создайте экземпляр класса ExtractImagesOptions.
  2. Добавьте путь к входному файлу в параметры с помощью метода AddInput.
  3. Установите путь к выходному каталогу для изображений с помощью метода AddOutput.
  4. Обработайте извлечение изображений с помощью плагина.
  5. Получите извлеченные изображения из контейнера результатов.
 1// Создайте ExtractImagesOptions для установки инструкций
 2var options = new ExtractImagesOptions();
 3// Добавьте путь к входному файлу
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Установите путь к выходному каталогу
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Выполните процесс
 8var results = PdfExtractor.ExtractImages(options);
 9// Получите путь к результату изображения
10var imageExtracted = results.ResultCollection[0].ToFile();

Извлечение изображений из PDF-файла в потоки без папки

Плагин PdfExtractor поддерживает сохранение в потоки, что позволяет извлекать изображения из PDF-файлов в потоки без использования временных папок.

 1// Создайте ExtractImagesOptions для установки инструкций
 2var options = new ExtractImagesOptions();
 3// Добавьте путь к входному файлу
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Не задавайте выходные параметры - это будет записывать результаты в потоки
 6// Выполните процесс
 7var results = PdfExtractor.ExtractImages(options);
 8// Получите поток
 9var ms = results.ResultCollection[0].ToStream();
10// Скопируйте данные в файл для демонстрации
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Ключевые особенности:

  • Извлечение встроенных изображений: Идентификация и извлечение изображений из PDF-документов.
  • Сохранение качества изображений: Обеспечивает сохранение оригинального качества извлеченных изображений.
  • Гибкий вывод: Сохраняйте извлеченные изображения в предпочтительном формате или местоположении.
 Русский