Extract Images
El Documentize PDF Extractor for .NET permite extraer imágenes de documentos PDF sin esfuerzo. Escanea tus archivos PDF, identifica las imágenes incrustadas y las extrae manteniendo su calidad y formato originales. Esta herramienta mejora la accesibilidad del contenido visual y agiliza el proceso de recuperación de imágenes de los PDFs.
Cómo Extraer Imágenes de un PDF
Para extraer imágenes de un archivo PDF, sigue estos pasos:
- Crea una instancia de la clase
ExtractImagesOptions
. - Agrega la ruta del archivo de entrada a las opciones utilizando el método
AddInput
. - Establece la ruta del directorio de salida para las imágenes utilizando el método
AddOutput
. - Procesa la extracción de imágenes utilizando el plugin.
- Recupera las imágenes extraídas del contenedor de resultados.
1// Crea ExtractImagesOptions para establecer instrucciones
2var options = new ExtractImagesOptions();
3// Agrega la ruta del archivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Establece la ruta del directorio de salida
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Realiza el proceso
8var results = PdfExtractor.ExtractImages(options);
9// Obtén la ruta de la imagen resultante
10var imageExtracted = results.ResultCollection[0].ToFile();
Extrayendo Imágenes de un Archivo PDF a Streams sin Carpeta
El PdfExtractor admite guardar en streams, lo que te permite extraer imágenes de archivos PDF en streams sin utilizar carpetas temporales.
1// Crea ExtractImagesOptions para establecer instrucciones
2var options = new ExtractImagesOptions();
3// Agrega la ruta del archivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// No establece la salida - escribirá resultados en streams
6// Realiza el proceso
7var results = PdfExtractor.ExtractImages(options);
8// Obtén Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copia datos a archivo para demostración
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Características Clave:
- Extraer Imágenes Incrustadas: Identifica y extrae imágenes de documentos PDF.
- Preservar Calidad de Imagen: Asegura que las imágenes extraídas mantengan su calidad original.
- Salida Flexible: Guarda imágenes extraídas en el formato o ubicación que prefieras.