PDF Image Extractor

Le plugin Documentize PDF Image Extractor pour .NET vous permet d’extraire des images des documents PDF sans effort. Il analyse vos fichiers PDF, identifie les images intégrées et les extrait tout en maintenant leur qualité et leur format d’origine. Cet outil améliore l’accessibilité du contenu visuel et simplifie le processus de récupération des images dans les PDFs.

Comment extraire des images d’un PDF

Pour extraire des images d’un fichier PDF, suivez ces étapes :

  1. Créez une instance de la classe ImageExtractor.
  2. Créez une instance de la classe ImageExtractorOptions.
  3. Ajoutez le chemin du fichier d’entrée aux options.
  4. Traitez l’extraction d’images en utilisant le plugin.
  5. Récupérez les images extraites du conteneur de résultat.
 1using var plugin = new ImageExtractor();
 2
 3// Créez une instance de la classe ImageExtractorOptions
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// Ajoutez le chemin du fichier d'entrée
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// Traitez l'extraction d'images
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Récupérez l'image extraite et enregistrez-la dans un fichier
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

Extraction d’images de plusieurs fichiers PDF

Le plugin ImageExtractor prend en charge le traitement par lot, vous permettant d’extraire des images de plusieurs PDFs simultanément. Cette fonctionnalité est particulièrement utile lorsque vous avez une collection de fichiers PDF et que vous devez récupérer toutes les images en une seule fois.

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// Ajoutez plusieurs fichiers PDF d'entrée
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// Traitez l'extraction d'images
10var resultContainer = plugin.Process(options);
11
12// Enregistrez les images extraites de tous les fichiers
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

Fonctionnalités clés :

  • Extraire des images intégrées : Identifier et extraire des images des documents PDF.
  • Préserver la qualité des images : Garantit que les images extraites conservent leur qualité d’origine.
  • Traitement par lot : Extraire des images de plusieurs documents PDF en une seule opération.
  • Sortie flexible : Enregistrez les images extraites dans le format ou l’emplacement de votre choix.
 Français