PDF Image Extractor

El Documentize PDF Image Extractor para .NET permite extraer imágenes de documentos PDF sin esfuerzo. Escanea tus archivos PDF, identifica imágenes incrustadas y las extrae mientras mantiene su calidad y formato originales. Esta herramienta mejora la accesibilidad del contenido visual y simplifica el proceso de recuperación de imágenes de los PDFs.

Cómo Extraer Imágenes de un PDF

Para extraer imágenes de un archivo PDF, sigue estos pasos:

  1. Crea una instancia de la clase ImageExtractorOptions.
  2. Agrega la ruta del archivo de entrada a las opciones utilizando el método AddInput.
  3. Establece la ruta del directorio de salida para las imágenes utilizando el método AddOutput.
  4. Procesa la extracción de imágenes utilizando el plugin.
  5. Recupera las imágenes extraídas del contenedor de resultados.
 1// Crear ImageExtractorOptions para establecer instrucciones
 2var options = new ImageExtractorOptions();
 3// Agregar ruta del archivo de entrada
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Establecer ruta del directorio de salida
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Realizar el proceso
 8var results = ImageExtractor.Process(options);
 9// Obtener ruta del resultado de la imagen
10var imageExtracted = results.ResultCollection[0].ToFile();

Extrayendo Imágenes de un Archivo PDF a Streams sin carpeta

El plugin ImageExtractor admite la opción de guardar en streams, lo que te permite extraer imágenes de archivos PDF en streams sin usar carpetas temporales.

 1// Crear ImageExtractorOptions para establecer instrucciones
 2var options = new ImageExtractorOptions();
 3// Agregar ruta del archivo de entrada
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// No establecer salida - escribirá resultados en streams
 6// Realizar el proceso
 7var results = ImageExtractor.Process(options);
 8// Obtener Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copiar datos a archivo para demostración
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Características Clave:

  • Extraer Imágenes Incrustadas: Identifica y extrae imágenes de documentos PDF.
  • Preservar la Calidad de la Imagen: Asegura que las imágenes extraídas mantengan su calidad original.
  • Salida Flexible: Guarda las imágenes extraídas en el formato o ubicación que prefieras.
 Español