Extraer Imágenes
El complemento Documentize PDF Extractor for .NET le permite extraer imágenes de documentos PDF de forma sencilla. Escanea sus archivos PDF, identifica las imágenes incrustadas y las extrae manteniendo su calidad y formato original. Esta herramienta mejora la accesibilidad del contenido visual y simplifica el proceso de obtención de imágenes de los PDFs.
Cómo extraer imágenes de un PDF
Para extraer imágenes de un archivo PDF, siga estos pasos:
- Cree una instancia de la clase
ExtractImagesOptions. - Añada la ruta del archivo de entrada a las opciones mediante el método
AddInput. - Establezca la ruta del directorio de salida para las imágenes mediante el método
AddOutput. - Procese la extracción de imágenes usando el complemento.
- Recupere las imágenes extraídas del contenedor de resultados.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();Extracción de imágenes de un archivo PDF a Streams sin carpeta
El complemento PdfExtractor admite la guardia en streams, lo que permite extraer imágenes de archivos PDF directamente a streams sin usar carpetas temporales.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}Características clave:
- Extraer imágenes incrustadas: Identifica y extrae imágenes de documentos PDF.
- Preservar la calidad de la imagen: Garantiza que las imágenes extraídas mantengan su calidad original.
- Salida flexible: Guarda las imágenes extraídas en el formato o ubicación que prefiera.