PDF Image Extractor

Documentize PDF Image Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。このプラグインは PDF ファイルをスキャンし、埋め込まれた画像を特定して抽出し、元の品質と形式を維持します。このツールは、視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。

PDF から画像を抽出する方法

PDF ファイルから画像を抽出するには、次の手順に従います。

  1. ImageExtractor クラスのインスタンスを作成します。
  2. ImageExtractorOptions クラスのインスタンスを作成します。
  3. オプションに入力ファイルパスを追加します。
  4. プラグインを使用して画像抽出を処理します。
  5. 結果コンテナから抽出された画像を取得します。
 1using var plugin = new ImageExtractor();
 2
 3// ImageExtractorOptions クラスのインスタンスを作成
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// 入力ファイルパスを追加
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// 画像抽出を処理
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// 抽出した画像を取得してファイルに保存
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

複数の PDF ファイルから画像を抽出する

ImageExtractor プラグインはバッチ処理をサポートしており、複数の PDF から同時に画像を抽出できます。この機能は、一連の PDF ファイルがあり、すべての画像を一度に取得する必要がある場合に特に便利です。

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// 複数の入力 PDF ファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// 画像抽出を処理
10var resultContainer = plugin.Process(options);
11
12// すべてのファイルから抽出された画像を保存
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

主な機能:

  • 埋め込まれた画像の抽出: PDF ドキュメントから画像を特定して抽出します。
  • 画像の品質を保持: 抽出された画像が元の品質を維持することを保証します。
  • バッチ処理: 単一の操作で複数の PDF ドキュメントから画像を抽出します。
  • 柔軟な出力: 抽出された画像を好みの形式または場所に保存します。
 日本語