Extraire des images
Le plugin Documentize PDF Extractor for .NET vous permet d’extraire facilement des images de documents PDF. Il analyse vos fichiers PDF, identifie les images incorporées et les extrait tout en conservant leur qualité et leur format d’origine. Cet outil améliore l’accessibilité du contenu visuel et simplifie le processus de récupération des images à partir de PDF.
Comment extraire des images d’un PDF
Pour extraire des images d’un fichier PDF, suivez ces étapes :
- Créez une instance de la classe
ExtractImagesOptions. - Ajoutez le chemin du fichier d’entrée aux options à l’aide de la méthode
AddInput. - Définissez le chemin du répertoire de sortie pour les images avec la méthode
AddOutput. - Lancez le processus d’extraction d’images avec le plugin.
- Récupérez les images extraites depuis le conteneur de résultats.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();Extraction d’images d’un fichier PDF vers des flux sans dossier
Le plugin PdfExtractor prend en charge la sauvegarde vers des flux, ce qui vous permet d’extraire des images de fichiers PDF directement dans des flux sans utiliser de dossiers temporaires.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}Principales fonctionnalités :
- Extraction d’images incorporées : Identifie et extrait les images des documents PDF.
- Préservation de la qualité des images : Garantit que les images extraites conservent leur qualité originale.
- Sortie flexible : Enregistrez les images extraites dans le format ou l’emplacement de votre choix.