PDF Image Extractor

Le Documentize PDF Image Extractor for .NET plugin vous permet d’extraire des images des documents PDF sans effort. Il analyse vos fichiers PDF, identifie les images intégrées et les extrait tout en maintenant leur qualité et format d’origine. Cet outil améliore l’accessibilité du contenu visuel et simplifie le processus de récupération des images à partir des PDF.

Comment extraire des images d’un PDF

Pour extraire des images d’un fichier PDF, suivez ces étapes :

  1. Créez une instance de la classe ImageExtractorOptions.
  2. Ajoutez le chemin du fichier d’entrée aux options en utilisant la méthode AddInput.
  3. Définissez le chemin du répertoire de sortie pour les images en utilisant la méthode AddOutput.
  4. Traitez l’extraction d’images à l’aide du plugin.
  5. Récupérez les images extraites du conteneur de résultats.
 1// Créez ImageExtractorOptions pour définir les instructions
 2var options = new ImageExtractorOptions();
 3// Ajoutez le chemin du fichier d'entrée
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Définissez le chemin du répertoire de sortie
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Effectuez le traitement
 8var results = ImageExtractor.Process(options);
 9// Obtenez le chemin du résultat d'image
10var imageExtracted = results.ResultCollection[0].ToFile();

Extraction d’images d’un fichier PDF vers des flux sans dossier

Le plugin ImageExtractor prend en charge l’enregistrement dans des flux, ce qui vous permet d’extraire des images de fichiers PDF dans des flux sans utiliser de dossiers temporaires.

 1// Créez ImageExtractorOptions pour définir les instructions
 2var options = new ImageExtractorOptions();
 3// Ajoutez le chemin du fichier d'entrée
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Non défini de sortie - il écrira les résultats dans des flux
 6// Effectuez le traitement
 7var results = ImageExtractor.Process(options);
 8// Obtenez le flux
 9var ms = results.ResultCollection[0].ToStream();
10// Copiez les données dans un fichier pour la démonstration
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Fonctionnalités principales :

  • Extraire des images intégrées : Identifier et extraire des images des documents PDF.
  • Préserver la qualité de l’image : Assure que les images extraites conservent leur qualité d’origine.
  • Sortie flexible : Enregistrez les images extraites dans le format ou l’emplacement de votre choix.
 Français