PDF Image Extractor

El Documentize PDF Image Extractor para .NET permite extraer imágenes de documentos PDF sin esfuerzo. Escanea tus archivos PDF, identifica imágenes incrustadas y las extrae manteniendo su calidad y formato original. Esta herramienta mejora la accesibilidad del contenido visual y agiliza el proceso de recuperación de imágenes de los PDFs.

Cómo Extraer Imágenes de un PDF

Para extraer imágenes de un archivo PDF, sigue estos pasos:

  1. Crea una instancia de la clase ImageExtractor.
  2. Crea una instancia de la clase ImageExtractorOptions.
  3. Agrega la ruta del archivo de entrada a las opciones.
  4. Procesa la extracción de imágenes utilizando el plugin.
  5. Recupera las imágenes extraídas del contenedor de resultados.
 1using var plugin = new ImageExtractor();
 2
 3// Crea una instancia de la clase ImageExtractorOptions
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// Agrega la ruta del archivo de entrada
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// Procesa la extracción de imágenes
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Obtén la imagen extraída y guárdala en un archivo
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

Extrayendo Imágenes de Múltiples Archivos PDF

El plugin ImageExtractor soporta procesamiento por lotes, permitiéndote extraer imágenes de múltiples PDFs simultáneamente. Esta función es especialmente útil cuando tienes una colección de archivos PDF y necesitas recuperar todas las imágenes de una vez.

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// Agrega múltiples archivos PDF de entrada
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// Procesa la extracción de imágenes
10var resultContainer = plugin.Process(options);
11
12// Guarda las imágenes extraídas de todos los archivos
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

Características Clave:

  • Extraer Imágenes Incrustadas: Identifica y extrae imágenes de documentos PDF.
  • Preservar la Calidad de Imagen: Asegura que las imágenes extraídas mantengan su calidad original.
  • Procesamiento por Lotes: Extrae imágenes de múltiples documentos PDF en una sola operación.
  • Salida Flexible: Guarda las imágenes extraídas en el formato o ubicación que prefieras.
 Español