PDF Image Extractor

Documentize PDF Image Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。PDF ファイルをスキャンし、埋め込まれた画像を特定し、元の品質と形式を維持しながら抽出します。このツールは視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。

PDF から画像を抽出する方法

PDF ファイルから画像を抽出するには、以下の手順に従ってください:

  1. ImageExtractorOptions クラスのインスタンスを作成します。
  2. AddInput メソッドを使用してオプションに入力ファイルパスを追加します。
  3. AddOutput メソッドを使用して画像の出力ディレクトリパスを設定します。
  4. プラグインを使用して画像抽出を処理します。
  5. 結果コンテナから抽出された画像を取得します。
 1// ImageExtractorOptions を作成して指示を設定
 2var options = new ImageExtractorOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ディレクトリパスを設定
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// 処理を実行
 8var results = ImageExtractor.Process(options);
 9// 画像結果へのパスを取得
10var imageExtracted = results.ResultCollection[0].ToFile();

フォルダを使わずに PDF ファイルからストリームに画像を抽出する

ImageExtractor プラグインは、ストリームに保存する機能をサポートしており、一時フォルダを使用せずに PDF ファイルからストリームに画像を抽出できます。

 1// ImageExtractorOptions を作成して指示を設定
 2var options = new ImageExtractorOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力を設定しない - 結果をストリームに書き込みます
 6// 処理を実行
 7var results = ImageExtractor.Process(options);
 8// ストリームを取得
 9var ms = results.ResultCollection[0].ToStream();
10// デモのためにファイルにデータをコピー
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

主な機能:

  • 埋め込まれた画像の抽出: PDF ドキュメントから画像を特定して抽出します。
  • 画像品質の保持: 抽出された画像が元の品質を保持することを保証します。
  • 柔軟な出力: 抽出された画像を好みの形式や場所に保存します。
 日本語