PDF Image Extractor
El Documentize PDF Image Extractor para .NET permite extraer imágenes de documentos PDF sin esfuerzo. Escanea tus archivos PDF, identifica imágenes incrustadas y las extrae mientras mantiene su calidad y formato originales. Esta herramienta mejora la accesibilidad del contenido visual y simplifica el proceso de recuperación de imágenes de los PDFs.
Cómo Extraer Imágenes de un PDF
Para extraer imágenes de un archivo PDF, sigue estos pasos:
- Crea una instancia de la clase
ImageExtractorOptions
. - Agrega la ruta del archivo de entrada a las opciones utilizando el método
AddInput
. - Establece la ruta del directorio de salida para las imágenes utilizando el método
AddOutput
. - Procesa la extracción de imágenes utilizando el plugin.
- Recupera las imágenes extraídas del contenedor de resultados.
1// Crear ImageExtractorOptions para establecer instrucciones
2var options = new ImageExtractorOptions();
3// Agregar ruta del archivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Establecer ruta del directorio de salida
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Realizar el proceso
8var results = ImageExtractor.Process(options);
9// Obtener ruta del resultado de la imagen
10var imageExtracted = results.ResultCollection[0].ToFile();
Extrayendo Imágenes de un Archivo PDF a Streams sin carpeta
El plugin ImageExtractor admite la opción de guardar en streams, lo que te permite extraer imágenes de archivos PDF en streams sin usar carpetas temporales.
1// Crear ImageExtractorOptions para establecer instrucciones
2var options = new ImageExtractorOptions();
3// Agregar ruta del archivo de entrada
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// No establecer salida - escribirá resultados en streams
6// Realizar el proceso
7var results = ImageExtractor.Process(options);
8// Obtener Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copiar datos a archivo para demostración
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Características Clave:
- Extraer Imágenes Incrustadas: Identifica y extrae imágenes de documentos PDF.
- Preservar la Calidad de la Imagen: Asegura que las imágenes extraídas mantengan su calidad original.
- Salida Flexible: Guarda las imágenes extraídas en el formato o ubicación que prefieras.