Extraire des Images
Le plugin Documentize PDF Extractor for .NET vous permet d’extraire facilement des images des documents PDF. Il scanne vos fichiers PDF, identifie les images intégrées et les extrait tout en préservant leur qualité et leur format d’origine. Cet outil améliore l’accessibilité du contenu visuel et rationalise le processus de récupération des images dans les PDF.
Comment Extraire des Images d’un PDF
Pour extraire des images d’un fichier PDF, suivez ces étapes :
- Créez une instance de la classe
ExtractImagesOptions
. - Ajoutez le chemin du fichier d’entrée aux options en utilisant la méthode
AddInput
. - Définissez le chemin du répertoire de sortie pour les images avec la méthode
AddOutput
. - Traitez l’extraction d’image en utilisant le plugin.
- Récupérez les images extraites du conteneur de résultats.
1
2// Créer ExtractImagesOptions pour définir les instructions
3var options = new ExtractImagesOptions();
4// Ajouter le chemin du fichier d'entrée
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// Définir le chemin du répertoire de sortie
7options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
8// Effectuer le processus
9var results = PdfExtractor.ExtractImages(options);
10// Obtenir le chemin du résultat d'image
11var imageExtracted = results.ResultCollection[0].ToFile();
Extraction d’Images d’un Fichier PDF vers des Flux sans Dossier
Le plugin PdfExtractor prend en charge l’enregistrement vers des flux, ce qui vous permet d’extraire des images de fichiers PDF vers des flux sans utiliser de dossiers temporaires.
1
2// Créer ExtractImagesOptions pour définir les instructions
3var options = new ExtractImagesOptions();
4// Ajouter le chemin du fichier d'entrée
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// Pas de sortie définie - il écrira les résultats vers des flux
7// Effectuer le processus
8var results = PdfExtractor.ExtractImages(options);
9// Obtenir le flux
10var ms = results.ResultCollection[0].ToStream();
11// Copier les données dans un fichier pour la démo
12ms.Seek(0, SeekOrigin.Begin);
13using (var fs = File.Create("test_file.png"))
14{
15 ms.CopyTo(fs);
16}
Caractéristiques Principales :
- Extraire des Images Intégrées : Identifier et extraire des images des documents PDF.
- Préserver la Qualité des Images : Assure que les images extraites conservent leur qualité d’origine.
- Sortie Flexible : Enregistrez les images extraites dans votre format ou emplacement préféré.