PDF Image Extractor
Le Documentize PDF Image Extractor for .NET plugin vous permet d’extraire des images des documents PDF sans effort. Il analyse vos fichiers PDF, identifie les images intégrées et les extrait tout en maintenant leur qualité et format d’origine. Cet outil améliore l’accessibilité du contenu visuel et simplifie le processus de récupération des images à partir des PDF.
Comment extraire des images d’un PDF
Pour extraire des images d’un fichier PDF, suivez ces étapes :
- Créez une instance de la classe
ImageExtractorOptions
. - Ajoutez le chemin du fichier d’entrée aux options en utilisant la méthode
AddInput
. - Définissez le chemin du répertoire de sortie pour les images en utilisant la méthode
AddOutput
. - Traitez l’extraction d’images à l’aide du plugin.
- Récupérez les images extraites du conteneur de résultats.
1// Créez ImageExtractorOptions pour définir les instructions
2var options = new ImageExtractorOptions();
3// Ajoutez le chemin du fichier d'entrée
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Définissez le chemin du répertoire de sortie
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Effectuez le traitement
8var results = ImageExtractor.Process(options);
9// Obtenez le chemin du résultat d'image
10var imageExtracted = results.ResultCollection[0].ToFile();
Extraction d’images d’un fichier PDF vers des flux sans dossier
Le plugin ImageExtractor prend en charge l’enregistrement dans des flux, ce qui vous permet d’extraire des images de fichiers PDF dans des flux sans utiliser de dossiers temporaires.
1// Créez ImageExtractorOptions pour définir les instructions
2var options = new ImageExtractorOptions();
3// Ajoutez le chemin du fichier d'entrée
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Non défini de sortie - il écrira les résultats dans des flux
6// Effectuez le traitement
7var results = ImageExtractor.Process(options);
8// Obtenez le flux
9var ms = results.ResultCollection[0].ToStream();
10// Copiez les données dans un fichier pour la démonstration
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Fonctionnalités principales :
- Extraire des images intégrées : Identifier et extraire des images des documents PDF.
- Préserver la qualité de l’image : Assure que les images extraites conservent leur qualité d’origine.
- Sortie flexible : Enregistrez les images extraites dans le format ou l’emplacement de votre choix.