Extraire des Images

Le plugin Documentize PDF Extractor for .NET vous permet d’extraire facilement des images des documents PDF. Il scanne vos fichiers PDF, identifie les images intégrées et les extrait tout en préservant leur qualité et leur format d’origine. Cet outil améliore l’accessibilité du contenu visuel et rationalise le processus de récupération des images dans les PDF.

Comment Extraire des Images d’un PDF

Pour extraire des images d’un fichier PDF, suivez ces étapes :

  1. Créez une instance de la classe ExtractImagesOptions.
  2. Ajoutez le chemin du fichier d’entrée aux options en utilisant la méthode AddInput.
  3. Définissez le chemin du répertoire de sortie pour les images avec la méthode AddOutput.
  4. Traitez l’extraction d’image en utilisant le plugin.
  5. Récupérez les images extraites du conteneur de résultats.
 1  
 2// Créer ExtractImagesOptions pour définir les instructions  
 3var options = new ExtractImagesOptions();  
 4// Ajouter le chemin du fichier d'entrée  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 6// Définir le chemin du répertoire de sortie  
 7options.AddOutput(new DirectoryDataSource("path_to_results_directory"));  
 8// Effectuer le processus  
 9var results = PdfExtractor.ExtractImages(options);  
10// Obtenir le chemin du résultat d'image  
11var imageExtracted = results.ResultCollection[0].ToFile();  

Extraction d’Images d’un Fichier PDF vers des Flux sans Dossier

Le plugin PdfExtractor prend en charge l’enregistrement vers des flux, ce qui vous permet d’extraire des images de fichiers PDF vers des flux sans utiliser de dossiers temporaires.

 1  
 2// Créer ExtractImagesOptions pour définir les instructions  
 3var options = new ExtractImagesOptions();  
 4// Ajouter le chemin du fichier d'entrée  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 6// Pas de sortie définie - il écrira les résultats vers des flux  
 7// Effectuer le processus  
 8var results = PdfExtractor.ExtractImages(options);  
 9// Obtenir le flux  
10var ms = results.ResultCollection[0].ToStream();  
11// Copier les données dans un fichier pour la démo  
12ms.Seek(0, SeekOrigin.Begin);  
13using (var fs = File.Create("test_file.png"))  
14{  
15    ms.CopyTo(fs);  
16}  

Caractéristiques Principales :

  • Extraire des Images Intégrées : Identifier et extraire des images des documents PDF.
  • Préserver la Qualité des Images : Assure que les images extraites conservent leur qualité d’origine.
  • Sortie Flexible : Enregistrez les images extraites dans votre format ou emplacement préféré.
 Français