画像を抽出

The Documentize PDF Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。PDF ファイルをスキャンし、埋め込まれた画像を特定して、元の品質と形式を保ったまま抽出します。このツールはビジュアルコンテンツへのアクセス性を向上させ、PDF から画像を取得するプロセスを効率化します。

PDF から画像を抽出する方法

PDF ファイルから画像を抽出するには、次の手順に従ってください。

ExtractImagesOptions クラスのインスタンスを作成します。
AddInput メソッドを使用して入力ファイルパスをオプションに追加します。
AddOutput メソッドで画像の出力ディレクトリパスを設定します。
プラグインで画像抽出処理を実行します。
結果コンテナから抽出された画像を取得します。

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

フォルダを使用せずにストリームへ画像を抽出する方法

PdfExtractor プラグインはストリームへの保存をサポートしており、テンポラリフォルダを使用せずに PDF ファイルから画像をストリームへ抽出できます。

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

主な機能

埋め込み画像の抽出: PDF ドキュメントから画像を特定し抽出します。
画像品質の維持: 抽出された画像は元の品質を保ちます。
柔軟な出力: 好みの形式や場所に抽出画像を保存できます。