PDF Image Extractor
Documentize PDF Image Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。このプラグインは PDF ファイルをスキャンし、埋め込まれた画像を特定して抽出し、元の品質と形式を維持します。このツールは、視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。
PDF から画像を抽出する方法
PDF ファイルから画像を抽出するには、次の手順に従います。
ImageExtractor
クラスのインスタンスを作成します。ImageExtractorOptions
クラスのインスタンスを作成します。- オプションに入力ファイルパスを追加します。
- プラグインを使用して画像抽出を処理します。
- 結果コンテナから抽出された画像を取得します。
1using var plugin = new ImageExtractor();
2
3// ImageExtractorOptions クラスのインスタンスを作成
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// 入力ファイルパスを追加
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// 画像抽出を処理
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// 抽出した画像を取得してファイルに保存
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
複数の PDF ファイルから画像を抽出する
ImageExtractor プラグインはバッチ処理をサポートしており、複数の PDF から同時に画像を抽出できます。この機能は、一連の PDF ファイルがあり、すべての画像を一度に取得する必要がある場合に特に便利です。
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// 複数の入力 PDF ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 画像抽出を処理
10var resultContainer = plugin.Process(options);
11
12// すべてのファイルから抽出された画像を保存
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
主な機能:
- 埋め込まれた画像の抽出: PDF ドキュメントから画像を特定して抽出します。
- 画像の品質を保持: 抽出された画像が元の品質を維持することを保証します。
- バッチ処理: 単一の操作で複数の PDF ドキュメントから画像を抽出します。
- 柔軟な出力: 抽出された画像を好みの形式または場所に保存します。