Extract Images

El Documentize PDF Extractor for .NET permite extraer imágenes de documentos PDF sin esfuerzo. Escanea tus archivos PDF, identifica las imágenes incrustadas y las extrae manteniendo su calidad y formato originales. Esta herramienta mejora la accesibilidad del contenido visual y agiliza el proceso de recuperación de imágenes de los PDFs.

Cómo Extraer Imágenes de un PDF

Para extraer imágenes de un archivo PDF, sigue estos pasos:

  1. Crea una instancia de la clase ExtractImagesOptions.
  2. Agrega la ruta del archivo de entrada a las opciones utilizando el método AddInput.
  3. Establece la ruta del directorio de salida para las imágenes utilizando el método AddOutput.
  4. Procesa la extracción de imágenes utilizando el plugin.
  5. Recupera las imágenes extraídas del contenedor de resultados.
 1// Crea ExtractImagesOptions para establecer instrucciones
 2var options = new ExtractImagesOptions();
 3// Agrega la ruta del archivo de entrada
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Establece la ruta del directorio de salida
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Realiza el proceso
 8var results = PdfExtractor.ExtractImages(options);
 9// Obtén la ruta de la imagen resultante
10var imageExtracted = results.ResultCollection[0].ToFile();

Extrayendo Imágenes de un Archivo PDF a Streams sin Carpeta

El PdfExtractor admite guardar en streams, lo que te permite extraer imágenes de archivos PDF en streams sin utilizar carpetas temporales.

 1// Crea ExtractImagesOptions para establecer instrucciones
 2var options = new ExtractImagesOptions();
 3// Agrega la ruta del archivo de entrada
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// No establece la salida - escribirá resultados en streams
 6// Realiza el proceso
 7var results = PdfExtractor.ExtractImages(options);
 8// Obtén Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copia datos a archivo para demostración
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Características Clave:

  • Extraer Imágenes Incrustadas: Identifica y extrae imágenes de documentos PDF.
  • Preservar Calidad de Imagen: Asegura que las imágenes extraídas mantengan su calidad original.
  • Salida Flexible: Guarda imágenes extraídas en el formato o ubicación que prefieras.
 Español