Extract Images
Documentize PDF Extractor for .NET プラグインを使用することで、PDF ドキュメントから画像を簡単に抽出できます。PDF ファイルをスキャンし、埋め込まれた画像を特定して、それらの元の品質とフォーマットを維持しつつ抽出します。このツールは視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。
PDF から画像を抽出する方法
PDF ファイルから画像を抽出するには、以下の手順に従ってください。
ExtractImagesOptions
クラスのインスタンスを作成します。AddInput
メソッドを使用してオプションに入力ファイルパスを追加します。AddOutput
メソッドを使用して画像の出力ディレクトリパスを設定します。- プラグインを使用して画像抽出を処理します。
- 結果コンテナから抽出した画像を取得します。
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.ExtractImages(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();
フォルダーなしで PDF ファイルからストリームに画像を抽出する
PdfExtractor プラグインはストリームへの保存をサポートしており、一時フォルダーを使用せずに PDF ファイルからストリームに画像を抽出することができます。
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.ExtractImages(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
主な機能:
- 埋め込まれた画像の抽出: PDF ドキュメントから画像を特定して抽出します。
- 画像品質の保持: 抽出した画像が元の品質を保持することを保証します。
- 柔軟な出力: お好みのフォーマットや場所に抽出した画像を保存します。