PDF Image Extractor
O plugin Documentize PDF Image Extractor for .NET permite extrair imagens de documentos PDF de forma simples. Ele examina seus arquivos PDF, identifica imagens incorporadas e as extrai mantendo sua qualidade e formato originais. Esta ferramenta melhora a acessibilidade do conteúdo visual e simplifica o processo de recuperação de imagens de PDFs.
Como Extrair Imagens de um PDF
Para extrair imagens de um arquivo PDF, siga estes passos:
- Crie uma instância da classe
ImageExtractor
. - Crie uma instância da classe
ImageExtractorOptions
. - Adicione o caminho do arquivo de entrada às opções.
- Processe a extração de imagens usando o plugin.
- Recupere as imagens extraídas do recipiente de resultados.
1using var plugin = new ImageExtractor();
2
3// Crie uma instância da classe ImageExtractorOptions
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// Adicione o caminho do arquivo de entrada
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// Processe a extração de imagens
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Obtenha a imagem extraída e salve-a em um arquivo
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
Extraindo Imagens de Vários Arquivos PDF
O plugin ImageExtractor suporta processamento em lote, permitindo que você extraia imagens de vários PDFs ao mesmo tempo. Este recurso é especialmente útil quando você tem uma coleção de arquivos PDF e precisa recuperar todas as imagens de uma vez.
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// Adicione vários arquivos PDF de entrada
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// Processe a extração de imagens
10var resultContainer = plugin.Process(options);
11
12// Salve as imagens extraídas de todos os arquivos
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
Principais Recursos:
- Extrair Imagens Incorporadas: Identifique e extraia imagens de documentos PDF.
- Preservar a Qualidade da Imagem: Garante que as imagens extraídas mantenham sua qualidade original.
- Processamento em Lote: Extraia imagens de vários documentos PDF em uma única operação.
- Saída Flexível: Salve as imagens extraídas no formato ou local de sua preferência.