PDF Image Extractor
Плагин Documentize PDF Image Extractor для .NET позволяет вам легко извлекать изображения из PDF-документов. Он сканирует ваши PDF-файлы, определяет встроенные изображения и извлекает их, сохраняя оригинальное качество и формат. Этот инструмент улучшает доступность визуального контента и упрощает процесс извлечения изображений из PDF.
Как извлечь изображения из PDF
Чтобы извлечь изображения из PDF-файла, выполните следующие шаги:
- Создайте экземпляр класса
ImageExtractor
. - Создайте экземпляр класса
ImageExtractorOptions
. - Добавьте путь к входному файлу в параметры.
- Обработайте извлечение изображения с помощью плагина.
- Извлеките изображения из контейнера результата.
1using var plugin = new ImageExtractor();
2
3// Создайте экземпляр класса ImageExtractorOptions
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// Добавьте путь к входному файлу
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Получите извлеченное изображение и сохраните его в файл
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
Извлечение изображений из нескольких PDF-файлов
Плагин ImageExtractor поддерживает пакетную обработку, позволяя извлекать изображения из нескольких PDF-файлов одновременно. Эта функция особенно полезна, когда у вас есть коллекция PDF-файлов, и необходимо извлечь все изображения за один раз.
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// Добавьте несколько входных PDF-файлов
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(options);
11
12// Сохраните извлеченные изображения из всех файлов
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
Ключевые особенности:
- Извлечение встроенных изображений: Определяйте и извлекайте изображения из PDF-документов.
- Сохранение качества изображения: Обеспечивает сохранение оригинального качества извлеченных изображений.
- Пакетная обработка: Извлекайте изображения из нескольких PDF-документов за одну операцию.
- Гибкий вывод: Сохраняйте извлеченные изображения в вашем предпочтительном формате или месте.