Extract Images
Плагин Documentize PDF Extractor for .NET позволяет вам без труда извлекать изображения из PDF-документов. Он сканирует ваши PDF-файлы, идентифицирует встроенные изображения и извлекает их, сохраняя их оригинальное качество и формат. Этот инструмент повышает доступность визуального контента и упрощает процесс извлечения изображений из PDF-файлов.
Как извлечь изображения из PDF
Чтобы извлечь изображения из PDF-файла, выполните следующие шаги:
- Создайте экземпляр класса
ExtractImagesOptions
. - Добавьте путь к входному файлу в параметры с помощью метода
AddInput
. - Установите путь к выходному каталогу для изображений с помощью метода
AddOutput
. - Обработайте извлечение изображений с помощью плагина.
- Получите извлеченные изображения из контейнера результатов.
1// Создайте ExtractImagesOptions для установки инструкций
2var options = new ExtractImagesOptions();
3// Добавьте путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Установите путь к выходному каталогу
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Выполните процесс
8var results = PdfExtractor.ExtractImages(options);
9// Получите путь к результату изображения
10var imageExtracted = results.ResultCollection[0].ToFile();
Извлечение изображений из PDF-файла в потоки без папки
Плагин PdfExtractor поддерживает сохранение в потоки, что позволяет извлекать изображения из PDF-файлов в потоки без использования временных папок.
1// Создайте ExtractImagesOptions для установки инструкций
2var options = new ExtractImagesOptions();
3// Добавьте путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Не задавайте выходные параметры - это будет записывать результаты в потоки
6// Выполните процесс
7var results = PdfExtractor.ExtractImages(options);
8// Получите поток
9var ms = results.ResultCollection[0].ToStream();
10// Скопируйте данные в файл для демонстрации
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Ключевые особенности:
- Извлечение встроенных изображений: Идентификация и извлечение изображений из PDF-документов.
- Сохранение качества изображений: Обеспечивает сохранение оригинального качества извлеченных изображений.
- Гибкий вывод: Сохраняйте извлеченные изображения в предпочтительном формате или местоположении.