PDF Image Extractor

O plugin Documentize PDF Image Extractor for .NET permite extrair imagens de documentos PDF de forma simples. Ele examina seus arquivos PDF, identifica imagens incorporadas e as extrai mantendo sua qualidade e formato originais. Esta ferramenta melhora a acessibilidade do conteúdo visual e simplifica o processo de recuperação de imagens de PDFs.

Como Extrair Imagens de um PDF

Para extrair imagens de um arquivo PDF, siga estes passos:

  1. Crie uma instância da classe ImageExtractor.
  2. Crie uma instância da classe ImageExtractorOptions.
  3. Adicione o caminho do arquivo de entrada às opções.
  4. Processe a extração de imagens usando o plugin.
  5. Recupere as imagens extraídas do recipiente de resultados.
 1using var plugin = new ImageExtractor();
 2
 3// Crie uma instância da classe ImageExtractorOptions
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// Adicione o caminho do arquivo de entrada
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// Processe a extração de imagens
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Obtenha a imagem extraída e salve-a em um arquivo
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

Extraindo Imagens de Vários Arquivos PDF

O plugin ImageExtractor suporta processamento em lote, permitindo que você extraia imagens de vários PDFs ao mesmo tempo. Este recurso é especialmente útil quando você tem uma coleção de arquivos PDF e precisa recuperar todas as imagens de uma vez.

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// Adicione vários arquivos PDF de entrada
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// Processe a extração de imagens
10var resultContainer = plugin.Process(options);
11
12// Salve as imagens extraídas de todos os arquivos
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

Principais Recursos:

  • Extrair Imagens Incorporadas: Identifique e extraia imagens de documentos PDF.
  • Preservar a Qualidade da Imagem: Garante que as imagens extraídas mantenham sua qualidade original.
  • Processamento em Lote: Extraia imagens de vários documentos PDF em uma única operação.
  • Saída Flexível: Salve as imagens extraídas no formato ou local de sua preferência.
 Português