Извлечение изображений
Плагин Documentize PDF Extractor for .NET позволяет без усилий извлекать изображения из PDF‑документов. Он сканирует ваши PDF‑файлы, определяет встроенные изображения и извлекает их, сохраняя исходное качество и формат. Этот инструмент повышает доступность визуального контента и упрощает процесс получения изображений из PDF‑файлов.
Как извлечь изображения из PDF
Чтобы извлечь изображения из PDF‑файла, выполните следующие шаги:
- Создайте экземпляр класса
ExtractImagesOptions. - Добавьте путь к входному файлу в параметры с помощью метода
AddInput. - Укажите путь к каталогу вывода для изображений с помощью метода
AddOutput. - Выполните процесс извлечения изображений с помощью плагина.
- Получите извлечённые изображения из контейнера результатов.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();Извлечение изображений из PDF‑файла в потоки без папки
Плагин PdfExtractor поддерживает сохранение в потоки, что позволяет извлекать изображения из PDF‑файлов непосредственно в потоки без использования временных папок.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}Ключевые возможности:
- Извлечение встроенных изображений: Определение и извлечение изображений из PDF‑документов.
- Сохранение качества изображений: Гарантирует, что извлечённые изображения сохранят оригинальное качество.
- Гибкий вывод: Сохранение извлечённых изображений в желаемом формате или месте.