PDF Image Extractor
O Documentize PDF Image Extractor for .NET permite que você extraia imagens de documentos PDF sem esforço. Ele escaneia seus arquivos PDF, identifica imagens incorporadas e as extrai mantendo sua qualidade e formato originais. Esta ferramenta aprimora a acessibilidade do conteúdo visual e simplifica o processo de recuperação de imagens de PDFs.
Como Extrair Imagens de um PDF
Para extrair imagens de um arquivo PDF, siga estas etapas:
- Crie uma instância da classe
ImageExtractorOptions
. - Adicione o caminho do arquivo de entrada às opções usando o método
AddInput
. - Defina o caminho do diretório de saída para as imagens usando o método
AddOutput
. - Processe a extração da imagem usando o plugin.
- Recupere as imagens extraídas do contêiner de resultados.
1// Crie ImageExtractorOptions para definir instruções
2var options = new ImageExtractorOptions();
3// Adicione o caminho do arquivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Defina o caminho do diretório de saída
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Realize o processo
8var results = ImageExtractor.Process(options);
9// Obtenha o caminho do resultado da imagem
10var imageExtracted = results.ResultCollection[0].ToFile();
Extraindo Imagens de Arquivo PDF para Streams sem pasta
O ImageExtractor suporta a gravação em streams, o que permite extrair imagens de arquivos PDF para streams sem usar pastas temporárias.
1// Crie ImageExtractorOptions para definir instruções
2var options = new ImageExtractorOptions();
3// Adicione o caminho do arquivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Nenhum saída definida - os resultados serão gravados em streams
6// Realize o processo
7var results = ImageExtractor.Process(options);
8// Obtenha o Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copie os dados para um arquivo para demonstração
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Principais Recursos:
- Extrair Imagens Incorporadas: Identifique e extraia imagens de documentos PDF.
- Preservar a Qualidade da Imagem: Garante que as imagens extraídas mantenham sua qualidade original.
- Saída Flexível: Salve as imagens extraídas em seu formato ou local preferido.