Extract Images

O plugin Documentize PDF Extractor for .NET permite extrair imagens de documentos PDF de forma simples. Ele analisa seus arquivos PDF, identifica as imagens incorporadas e as extrai mantendo a qualidade e o formato originais. Esta ferramenta melhora a acessibilidade do conteúdo visual e simplifica o processo de recuperação de imagens de PDFs.

Como Extrair Imagens de um PDF

Para extrair imagens de um arquivo PDF, siga estas etapas:

  1. Crie uma instância da classe ExtractImagesOptions.
  2. Adicione o caminho do arquivo de entrada às opções usando o método AddInput.
  3. Defina o caminho do diretório de saída para as imagens usando o método AddOutput.
  4. Processar a extração de imagens usando o plugin.
  5. Recupere as imagens extraídas do contêiner de resultados.
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Extraindo Imagens de Arquivo PDF para Streams sem Pasta

O plugin PdfExtractor oferece suporte a gravação em streams, permitindo extrair imagens de arquivos PDF diretamente para streams sem a necessidade de pastas temporárias.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Principais Recursos:

  • Extrair Imagens Incorporadas: Identifica e extrai imagens de documentos PDF.
  • Preservar a Qualidade da Imagem: Garante que as imagens extraídas mantenham a qualidade original.
  • Saída Flexível: Salve as imagens extraídas no formato ou local de sua preferência.
 Português