開発者ガイド

PDF ChatGPT

ChatGPT API を .NET PDF アプリケーションに統合

PDF マージ

C# .NET を使用して複数の PDF ドキュメントを 1 つのファイルに統合します

PDF オプティマイザー

ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントをリサイズします

PDF タイムスタンプアダー

C# .NETを使用してPDFドキュメントにセキュアなタイムスタンプを追加します

PDF/A コンバータ

.NET プラグインは PDF ドキュメントを PDF/A 形式に変換し、コンテンツが長期保存基準に準拠することを保証します。

PDFからDOCへの変換ツール

.NETツールはPDFドキュメントをDOCまたはDOCX形式に変換することができます

PDFからXLSコンバータ

.NETプラグインは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)にシームレスに変換します

PDFセキュリティ

C# .NETを使用してPDF文書を暗号化および復号化します

PDFテキスト抽出ツール

.NETプラグインは、フォーマットを保持するか、ニーズに応じて省略しながら、効率的にテキストを抽出することを可能にします

PDF署名

.NETプラグインは、署名を追加するための簡素化されたプロセスを提供し、真正性を確保し、PDFコンテンツを保護します

PDF分割ツール

.NETツールで、大きなPDFドキュメントを小さく、管理しやすいファイルに分割するプロセスを簡素化します

2024/10/10

開発者ガイドのサブセクション

PDF ChatGPT

Documentize ChatGPT for .NET プラグインは、ChatGPT API を PDF アプリケーションに統合するために設計された強力なツールです。このプラグインを使用することで、開発者は入力メッセージに基づいてチャットの応答を生成し、その出力を PDF 形式で保存できます。これにより、PDF ドキュメント内での対話型インターフェースや分析レポートの作成に適しています。

主な機能:

  • チャット完了: カスタム入力に基づいて ChatGPT API を使用して応答を生成します。
  • システムおよびユーザーメッセージ: システムコンテキストとユーザー入力の両方を提供し、動的な会話を作成します。
  • PDF 出力: 生成されたチャットの完了を構造化された PDF ファイルに保存し、さらに使用できるようにします。
  • 非同期処理: チャットの完了を非同期に処理することで、応答性の高いアプリケーションを実現します。

チャット応答の生成

ChatGPT プラグインを使用してチャット応答を生成し、それを PDF ファイルに保存するには、次の手順に従います:

  1. PdfChatGptRequestOptions クラスのインスタンスを作成し、リクエストオプションを設定します。
  2. 入力および出力の PDF ファイルを追加します。
  3. API キーを設定し、最大トークン数や ChatGPT モデルへのクエリなどのパラメータを指定します。
  4. ProcessAsync メソッドを実行してチャットの完了を生成します。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // API キーを設定  
 4options.MaxTokens = 1000;  // 最大トークン数を設定  
 5options.Query = "このテキストの主要テーマを分析してください。";  
 6
 7// 入力 PDF ファイルを追加  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// チャット応答を含む出力 PDF の保存先を指定  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// PdfChatGpt プラグインのインスタンスを作成  
14var plugin = new PdfChatGpt();  
15
16// プロセスを非同期に実行  
17var result = await plugin.ProcessAsync(options);  

システムおよびユーザーメッセージの追加

よりインタラクティブな会話を作成するには、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは、会話のコンテキストを形成するのに役立ちます。

  1. ChatGPT のコンテキストを設定するシステムメッセージを追加します。
  2. 会話のためのユーザーの入力を表すユーザーメッセージを追加します。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // API キーを設定  
 4
 5// コンテキスト用のシステムメッセージを追加  
 6options.AddSystemMessage("あなたはテキストを要約するように訓練された AI です。");  
 7
 8// ChatGPT モデルにクエリを送信するためのユーザーメッセージを追加  
 9options.AddUserMessage("添付された文書を要約してください。");  
10
11// 入力および出力 PDF を追加  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// リクエストを非同期に処理  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDF マージ

Documentize PDF Merger for .NET は、複数の PDF ドキュメントを 1 つのファイルに統合するために設計された多目的ツールです。PDF ファイルの統合を簡素化し、ドキュメントが効率的に統合され、一貫性が保たれることを确保します。このプラグインは、マージされたドキュメントを最適化するために、フォントや画像などの内部リソースを処理します。

主な機能:

  • 複数の PDF をマージ: 複数の PDF ファイルを簡単に 1 つに結合します。
  • リソース最適化: マージ中に重複するフォントと画像を削除します。
  • バッチ処理: 大量の PDF ドキュメントを一度にマージします。
  • 安全なマージ: データ損失や内容の破損なしで文書の整合性を確保します。

PDF ドキュメントをマージする方法

複数の PDF ドキュメントを 1 つのファイルにマージするには、以下の手順に従ってください:

  1. Merger クラスのインスタンスを作成します。
  2. マージプロセスを構成するために MergeOptions のインスタンスを作成します。
  3. AddInput メソッドを使用して入力 PDF ファイルを追加します。
  4. AddOutput を使用して出力ファイルのパスを設定します。
  5. Process メソッドを使用してマージを実行します。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// マージする入力 PDF ファイルを追加
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// 出力ファイルのパスを指定
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// PDF をマージします
13merger.Process(mergeOptions);

ページ範囲で PDF をマージする方法

MergeOptions クラスを使用して、入力 PDF ファイルの特定のページ範囲をマージすることもできます。これにより、選択したページを最終出力ドキュメントに結合できます。

  1. Merger クラスのインスタンスを作成します。
  2. MergeOptions を使用してページ範囲を設定します。
  3. 指定されたページ範囲を持つ入力ファイルを追加します。
  4. 出力パスを設定します。
  5. Process メソッドを呼び出します。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 入力 PDF から特定のページをマージします
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 出力ファイルのパスを指定
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// PDF をマージします
12merger.Process(mergeOptions);

バッチマージを処理する方法

PDF Merger プラグインは、大量の PDF ドキュメントを処理するために最適化されています。バッチ処理機能を活用することで、数百の PDF を一度の操作でマージし、効率的で迅速なドキュメント管理を実現できます。

  1. Merger クラスのインスタンスを作成します。
  2. すべての入力 PDF ファイルを MergeOptions クラスに追加します。
  3. 出力パスを指定します。
  4. Process メソッドを呼び出してバッチ内のすべてのファイルをマージします。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// マージのために大量の PDF を追加します
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 出力ファイルのパスを指定
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// バッチマージを処理します
14merger.Process(mergeOptions);

PDF オプティマイザー

Documentize PDF オプティマイザーは、PDFドキュメントを高度な最適化技術によって強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントをリサイズするのに役立つように設計されています。これらの操作は、PDFファイルの品質と管理性を向上させ、保存、共有、閲覧を容易にします。

主な機能:

  • 最適化: 品質を損なうことなくPDFファイルサイズを減少させます。
  • 回転: PDFページの向きを調整します。
  • トリミング: ドキュメントから不要な余白やコンテンツを削除します。
  • リサイズ: 特定のサイズ(例:A4、レター)にページをリサイズします。

PDF ドキュメントの最適化

以下の手順では、品質を維持しながらPDFドキュメントのファイルサイズを削減する方法を示します。

  1. Optimizerクラスのインスタンスを作成します。
  2. 最適化設定を構成するためにOptimizeOptionsオブジェクトを作成します。
  3. 入力PDFファイルを追加し、最適化されたファイルの出力場所を設定します。
  4. Processメソッドを実行して最適化を行います。
1  
2var optimizer = new Optimizer();  
3var optimizeOptions = new OptimizeOptions();  
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));  
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));  
6optimizer.Process(optimizeOptions);  

PDF ドキュメントのリサイズ

PDFドキュメントをリサイズするために、ResizeOptionsクラスを使用して新しいページサイズを指定します。

  1. Optimizerクラスのインスタンスを作成します。
  2. ページサイズを定義するためにResizeOptionsオブジェクトを作成します。
  3. 入力ファイルを追加し、希望する出力場所を設定します。
  4. SetPageSizeメソッドを使用して新しいサイズ(例:A4)を指定します。
  5. 変更を適用するためにProcessメソッドを呼び出します。
1  
2var optimizer = new Optimizer();  
3var resizeOptions = new ResizeOptions();  
4resizeOptions.AddInput(new FileDataSource("input.pdf"));  
5resizeOptions.SetPageSize(PageSize.A4);  
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(resizeOptions);  

PDF ページの回転

RotateOptionsクラスを使用してPDFファイルのページの向きを調整します。

  1. Optimizerクラスのインスタンスを作成します。
  2. RotateOptionsオブジェクトを作成し、回転角度を設定します。
  3. 入力PDFファイルを追加し、出力ファイルの場所を指定します。
  4. SetRotationメソッドを使用して回転角度(例:90度)を設定します。
  5. Processメソッドを使用して回転を実行します。
1  
2var optimizer = new Optimizer();  
3var rotateOptions = new RotateOptions();  
4rotateOptions.AddInput(new FileDataSource("input.pdf"));  
5rotateOptions.SetRotation(90);  
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(rotateOptions);  

PDF ドキュメントのトリミング

トリミングは、PDFドキュメントから不要なコンテンツや余白を削除します。CropOptionsクラスを使用してトリミング領域を定義できます。

  1. Optimizerクラスのインスタンスを作成します。
  2. CropOptionsオブジェクトでトリミング領域を定義します。
  3. 入力ファイルを追加し、出力ファイルの場所を指定します。
  4. SetCropBoxメソッドを使用してトリミング領域を定義します。
  5. Processメソッドを使用してトリミングを実行します。
1  
2var optimizer = new Optimizer();  
3var cropOptions = new CropOptions();  
4cropOptions.AddInput(new FileDataSource("input.pdf"));  
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // トリミング領域を定義  
6cropOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(cropOptions);  

PDF タイムスタンプアダー

Documentize PDF タイムスタンプアダー for .NETは、PDFドキュメントにセキュアなタイムスタンプを追加するために設計された強力なツールです。これは、信頼できる時間参照を提供することによってドキュメントの整合性と真正性を向上させ、デジタル署名の基準への準拠を保証します。

主な機能:

  • セキュアなタイムスタンプの追加: 簡単にPDFドキュメントにセキュアなタイムスタンプを追加します。
  • カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLと認証情報を使用します。
  • 自動化: タイムスタンプ処理を.NETアプリケーションに統合して、自動化されたワークフローを実現します。
  • 準拠: あなたのドキュメントがデジタル署名およびタイムスタンプに関する業界標準を満たすことを確認します。

PDFドキュメントにタイムスタンプを追加する方法

PDFドキュメントにセキュアなタイムスタンプを追加するには、以下の手順に従います:

  1. Timestampクラスのインスタンスを作成します。
  2. タイムスタンプ処理の設定を行うためにAddTimestampOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputを使用して出力ファイルのパスを設定します。
  5. Processメソッドを使用してタイムスタンプ処理を実行します。
 1// タイムスタンププラグインをインスタンス化
 2var plugin = new Timestamp();
 3
 4// タイムスタンプオプションを設定
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
 6
 7// 入力PDFファイルを追加
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 出力PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行
14plugin.Process(opt);

タイムスタンプサーバーでカスタム認証を使用する方法

タイムスタンプサーバーに接続する際に基本認証情報を提供することができます。これにより、ユーザー名とパスワードが必要なサーバーに対して認証が可能になります。

  1. Timestampクラスのインスタンスを作成します。
  2. serverBasicAuthCredentialsを含むAddTimestampOptionsのインスタンスを作成します。
  3. 入力ファイルと出力ファイルのパスを追加します。
  4. Processメソッドを呼び出します。
 1// タイムスタンププラグインをインスタンス化
 2var plugin = new Timestamp();
 3
 4// 認証を含むタイムスタンプオプションを設定
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
 6
 7// 入力PDFファイルを追加
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 出力PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行
14plugin.Process(opt);

PFXファイルとパスワードの取り扱い

AddTimestampOptionsクラスを使用すると、デジタル署名用にPFXファイルとパスワードを使用することができます。

  • PFXストリームまたはファイルパス: PFXファイルに対してストリームまたはファイルパスを提供できます。
  • パスワード保護: PFXファイルのパスワードを安全に管理してください。

PDF/A コンバータ

Documentize PDF/A コンバータ for .NET は、PDF ドキュメントを PDF/A 形式に変換するために設計された強力なツールであり、コンテンツが長期保存基準に準拠していることを保証します。このプラグインは、PDF/A 準拠のために既存の PDF ドキュメントの検証もサポートしており、変換と検証の機能を単一のソリューションで提供します。

主な機能:

  • PDF/A への変換: PDF ファイルを PDF/A 形式(PDF/A-1a、PDF/A-2b、PDF/A-3b など)にシームレスに変換し、保存基準に準拠します。
  • PDF/A 準拠の検証: 既存の PDF ドキュメントが PDF/A 基準に準拠しているかをチェックし、準拠していない場合は問題を特定します。
  • バッチ処理: 複数のファイルを一度に処理して、変換または検証を行います。
  • 効率的なワークフロー: 高速で信頼性のある変換プロセスにより、時間と労力を最小限に抑えます。

PDF を PDF/A に変換する方法

PDF ドキュメントを PDF/A 形式に変換するには、以下の手順に従ってください:

  1. PdfAConverter クラスのインスタンスを作成します。
  2. 変換を構成するために PdfAConvertOptions のインスタンスを作成します。
  3. 希望する PDF/A バージョンを指定します(例: PDF/A-3B)。
  4. AddInput メソッドを使用して、入力 PDF ファイルを追加します。
  5. AddOutput メソッドを使用して、結果の PDF/A の出力ファイルを追加します。
  6. 変換を実行するために Process メソッドを呼び出します。
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 入力 PDF ファイルを追加  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 出力 PDF/A ファイルを指定  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13
14// 変換を処理  
15pdfAConverter.Process(pdfAOptions);  

PDF/A 準拠の検証

PdfAValidateOptions クラスを使用して、既存の PDF ファイルの PDF/A 準拠を検証できます。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7
 8// 検証する PDF ファイルを追加  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 検証プロセスを実行  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13
14// 検証結果を確認  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A 検証合格: " + validationResult.IsValid);  

PDF/A 変換のためのバッチ処理

このプラグインはバッチ処理をサポートしており、複数の PDF ファイルを一度に PDF/A 準拠のために変換または検証できます。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 複数の入力 PDF を追加  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// 変換された PDF/A の出力ファイルを指定  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15
16// バッチ変換を処理  
17pdfAConverter.Process(pdfAOptions);  

PDFからDOCへの変換ツール

Documentize PDFからDOCへの変換ツール for .NETは、PDFドキュメントをDOCまたはDOCX形式に変換するために設計された強力なツールです。このプラグインはPDFページを編集可能なMicrosoft Wordドキュメントにシームレスに変換し、複数のプラットフォームでコンテンツを再利用、編集、共有することを容易にします。

主な機能:

  • DOC/DOCX変換: PDFドキュメントを編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
  • フォーマット維持: 変換プロセス中に元のレイアウト、テキスト、フォーマットを保持します。
  • バッチ処理: 複数のPDFファイルを一度に変換します。
  • カスタム変換オプション: より良いレイアウトのために、Enhanced Flowなどの異なるモードを使用して変換プロセスを微調整します。

PDFをDOC/DOCXに変換する方法

PDFドキュメントをDOC/DOCX形式に変換するには、次の手順に従ってください。

  1. PdfDocクラスのインスタンスを作成します。
  2. 変換プロセスを設定するためにPdfToDocOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して生成されるDOC/DOCXファイルの出力ファイルパスを追加します。
  5. Processメソッドを実行して変換を行います。
 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX,       // 出力形式をDOCXに設定  
 6    ConversionMode = ConversionMode.EnhancedFlow // レイアウトとフォーマットを最適化  
 7};  
 8
 9// 入力PDFファイルを追加  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// 出力Wordドキュメントのパスを追加  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));  
14
15// 変換を実行  
16pdfToWord.Process(options);  

カスタムオプションを使用したPDFからDOCへの変換

PDFからDOCへの変換ツールプラグインは、変換プロセスをカスタマイズするためのいくつかのオプションを提供します。変換中にPDFのレイアウトや構造の取り扱いを制御するために、異なるモードの中から選ぶことができます。

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.Doc,        // 出力形式をDOCに設定  
 6    ConversionMode = ConversionMode.Precise // 元のPDFレイアウトを可能な限り維持  
 7};  
 8
 9// 入力PDFファイルを追加  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// 出力Wordドキュメントのパスを追加  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));  
14
15// 変換を実行  
16pdfToWord.Process(options);  

PDFからDOC/DOCXのバッチ処理

PDFからDOCへの変換ツールはバッチ処理をサポートしており、複数のPDFファイルを一度に変換することができます。バッチ変換の例は次の通りです。

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX  
 6};  
 7
 8// 複数の入力PDFファイルを追加  
 9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// 生成されるDOCXファイルの出力ファイルパスを追加  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));  
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));  
15
16// バッチ変換を実行  
17pdfToWord.Process(options);  

PDFからXLSコンバータ

.NET用Documentize PDFからXLSコンバータは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)にシームレスに変換する強力なツールです。このプラグインはPDFコンテンツのアクセシビリティと使いやすさを向上させ、スプレッドシート形式でデータを操作・分析しやすくします。

主な機能:

  • PDFをExcelに変換: PDFファイルをXLS/XLSXスプレッドシートに変換してデータを簡単に管理。
  • カスタム出力オプション: 出力形式、ページ範囲、ワークシート名などの設定を構成できます。
  • 高忠実度変換: 変換中にレイアウト、フォーマット、および内容の正確さを保持します。
  • バッチ処理: 大規模な操作のために複数のPDFファイルを一度に変換できます。

PDFをXLSに変換する方法

PDFドキュメントをExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。

  1. PdfXlsクラスのインスタンスを作成します。
  2. 変換設定を構成するためにPdfToXlsOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して出力Excelファイルを指定します。
  5. Processメソッドを実行して変換を開始します。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換プロセスを実行
9pdfXlsConverter.Process(options);

PDFからExcelへの変換のカスタマイズ

PdfToXlsOptionsクラスを修正することによって変換設定をカスタマイズできます。たとえば、PDFをXLSX形式に変換し、空の列を挿入し、ワークシート名を設定するには、次のコードを使用します。

 1var options = new PdfToXlsOptions();
 2
 3// 出力形式をXLSXに設定
 4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
 5
 6// 最初の位置に空の列を挿入
 7options.InsertBlankColumnAtFirst = true;
 8
 9// ワークシート名を設定
10options.WorksheetName = "MySheet";
11
12// 入力および出力ファイルを追加
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 変換を処理
17pdfXlsConverter.Process(options);

変換結果の処理

処理後、Processメソッドは変換の結果を保持するResultContainerオブジェクトを返します。変換されたファイルパスやその他の出力詳細を取得できます。

1var resultContainer = pdfXlsConverter.Process(options);
2
3// 結果ファイルパスにアクセスして表示
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);

PDFからXLSへのバッチ処理

PDFからXLSコンバータプラグインは、複数のPDFファイルを一度に変換できるバッチ処理もサポートしています。

 1var pdfXlsConverter = new PdfXls();
 2var options = new PdfToXlsOptions();
 3
 4// 複数の入力PDFを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 出力Excelファイルを追加
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を処理
13pdfXlsConverter.Process(options);

PDFセキュリティ

Documentize PDFセキュリティ for .NETは、PDF文書のセキュリティを強化するために設計された強力なツールで、暗号化および復号化機能を提供します。これにより、機密情報が機密であり、無許可のアクセスから保護されることが保証されます。

主な機能:

  • PDF文書の暗号化: ユーザーパスワードとオーナーパスワードを追加してPDFファイルを保護します。
  • PDF文書の復号化: 必要に応じてPDFから暗号化を解除します。
  • 権限の設定: 印刷、コピー、コンテンツの変更などの権限を制御します。
  • 自動化: 自動化ワークフローのために、暗号化および復号化を.NETアプリケーションに統合します。
  • コンプライアンス: 文書が文書セキュリティに関する業界標準を満たしていることを確認します。

PDF文書を暗号化する方法

PDF文書を暗号化するには、以下の手順に従います:

  1. Securityクラスのインスタンスを作成します。
  2. 必要なユーザーおよびオーナーパスワードを使用してEncryptionOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputを使用して出力ファイルパスを設定します。
  5. Processメソッドを使用して暗号化を実行します。
 1  
 2// Securityプラグインをインスタンス化   
 3var plugin = new Security();  
 4
 5// 暗号化オプションを構成   
 6var opt = new EncryptionOptions("user_password", "owner_password");  
 7
 8// 入力PDFファイルを追加   
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 出力暗号化PDFファイルを指定   
12opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));  
13
14// 暗号化プロセスを実行   
15plugin.Process(opt);  

PDF文書を復号化する方法

PDF文書を復号化するには、以下の手順に従います:

  1. Securityクラスのインスタンスを作成します。
  2. 必要なパスワードを使用してDecryptionOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して暗号化されたPDFファイルを追加します。
  4. AddOutputを使用して出力ファイルパスを設定します。
  5. Processメソッドを使用して復号化を実行します。
 1  
 2// Securityプラグインをインスタンス化   
 3var plugin = new Security();  
 4
 5// 復号化オプションを構成   
 6var opt = new DecryptionOptions("user_password");  
 7
 8// 入力暗号化PDFファイルを追加   
 9opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));  
10
11// 出力復号化PDFファイルを指定   
12opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));  
13
14// 復号化プロセスを実行   
15plugin.Process(opt);  

PDF文書の権限設定

PDFを暗号化する際に、文書の使用方法を制御するためにさまざまな権限を設定できます。

  • 印刷: 文書の印刷を許可または禁止します。
  • コピー: コンテンツのコピーを許可または禁止します。
  • 変更: 文書の変更を許可または禁止します。

権限を設定するには、EncryptionOptionsを適宜構成できます。

PDFテキスト抽出ツール

Documentize PDFテキスト抽出ツール for .NETは、PDFドキュメントからテキストを抽出するのを簡素化します。純粋なテキスト、未加工のテキスト、またはプレーンテキストが必要な場合、このプラグインはフォーマットを保持するか、ニーズに応じて省略しながら効率的にテキストを抽出することを可能にします。

主な機能:

  • 純粋モード:元のフォーマットを保持しながらテキストを抽出します。
  • 生モード:フォーマットなしでテキストを抽出します。
  • プレーンモード:特殊文字やフォーマットなしでテキストを抽出します。
  • バッチ処理:複数のPDFから一度にテキストを抽出します。

PDFドキュメントからテキストを抽出する方法

PDFドキュメントからテキストを抽出するには、次の手順に従ってください:

  1. TextExtractorクラスのインスタンスを作成します。
  2. 抽出オプションを構成するためにTextExtractorOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. テキストを抽出するためにProcessメソッドを実行します。
  5. 抽出されたテキストにResultContainer.ResultCollectionを使用してアクセスします。
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// テキスト抽出を処理
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// 抽出されたテキストを表示
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

複数のPDFからのテキスト抽出

このプラグインを使用すると、複数のPDFから同時にテキストを抽出でき、迅速かつ効率的な処理が可能です。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 複数の入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// 抽出を処理
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを出力
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

テキスト抽出モード

TextExtractorプラグインは、ニーズに応じて柔軟性を提供する3つの抽出モードを提供します。

  1. 純粋モード:元のフォーマットを保持し、スペースや配置を含みます。
  2. 生モード:フォーマットなしでテキストを抽出します。生データ処理に役立ちます。
  3. プレーンモード:特殊文字や追加フォーマットなしでテキストを抽出します。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 純粋モードに設定
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 処理と出力
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

バッチ処理の扱い方

大規模なドキュメントセットの場合、バッチ処理を活用して、複数のPDFから一度にテキストを抽出することができます。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 複数の入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// 各ファイルの出力を定義
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを処理
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

PDF署名

Documentize PDF署名 for .NETプラグインは、ユーザーがPDF文書にデジタル署名を行うことを可能にします。このプラグインは、署名の追加、真正性の確保、PDFコンテンツの保護のための簡素化されたプロセスを提供します。プラグインは、表示された署名と非表示の署名の両方をサポートし、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。

主要機能:

  • PDF文書にデジタル署名: 表示されたまたは非表示のデジタル署名で文書を保護します。
  • PFXサポート: PFX証明書を使用してPDFファイルに署名します。
  • カスタマイズ可能なオプション: 理由、場所、連絡先の詳細など、署名設定を構成します。
  • 表示および非表示の署名: 署名が文書に表示されるかどうかを選択します。

PDF文書に署名する方法

PFXファイルを使用してPDF文書に署名するには、次の手順に従います。

  1. Signatureクラスのインスタンスを作成します。
  2. PFXファイルパスとパスワードを指定してSignOptionsクラスのインスタンスを作成します。
  3. 入力PDFと出力ファイルをオプションに追加します。
  4. 署名を適用するためにProcessメソッドを実行します。
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// 入力PDFを追加し、出力ファイルを指定します
 5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 7
 8// 署名オプションを構成します
 9signOptions.Reason = "契約合意";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "ニューヨーク";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 文書に署名を適用します
17signature.Process(signOptions);

PFXファイルのストリームを使用する方法

ファイルパスの代わりにストリームとして提供されるPFX証明書を使用してPDFに署名することもできます。これにより、証明書のストレージ管理がより柔軟になります。

  1. Signatureクラスのインスタンスを作成します。
  2. PFXとパスワードを含むストリームでSignOptionsをインスタンス化します。
  3. 入力ファイルと出力ファイルを追加します。
  4. 署名を適用するためにProcessメソッドを実行します。
 1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
 2var signature = new Signature();
 3var signOptions = new SignOptions(pfxStream, "pfxPassword");
 4
 5// 入力ファイルと出力ファイルを追加します
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 8
 9// 署名を適用します
10signature.Process(signOptions);

非表示署名を適用する方法

文書に署名を表示せずに文書を保護する非表示署名を追加するには、単にVisibleプロパティをfalseに設定します。

  1. SignOptionsのインスタンスを作成します。
  2. Visiblefalseに設定します。
  3. 入力ファイルと出力ファイルを追加します。
  4. 非表示署名を適用するためにProcessを呼び出します。
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// 非表示署名を構成します
 5signOptions.Visible = false;
 6
 7// 入力ファイルと出力ファイルを追加します
 8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 署名を処理します
12signature.Process(signOptions);

PDF分割ツール

Documentize PDF分割ツール for .NET は、大きなPDFドキュメントを小さく、管理しやすいファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合や、文書を特定のセクションに分割する必要がある場合でも、このプラグインを使用すれば、効率的かつ最小限の労力で実現できます。

主な機能:

  • ページごとのPDF分割: PDFドキュメントを個々のページに分解します。
  • バッチ処理: 大量のPDFを一度に分割します。
  • カスタム分割オプション: 要件に基づいて分割プロセスを構成します。
  • 整理された出力: 各分割ページまたはセクションの出力ファイルを簡単に管理します。

PDFドキュメントの分割方法

PDFドキュメントを個々のページに分割するには、次の手順に従います:

  1. Splitterクラスのインスタンスを作成します。
  2. 分割オプションを構成するためにSplitOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して各分割ページの出力ファイルを追加します。
  5. 文書を分割するためにProcessメソッドを実行します。
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4  
 5// 入力PDFファイルを追加  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7  
 8// 各ページの出力ファイルを指定  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12  
13// 分割操作を処理  
14splitter.Process(splitOptions);  

ページ範囲でのPDF分割

ページ範囲を指定してPDFを分割することもできます。これにより、PDFから特定のセクションや複数ページを別の文書に抽出できます。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4  
 5// 入力PDFを追加  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7  
 8// ページ範囲の出力を定義(例: ページ1-3)  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10  
11// 分割を処理  
12splitter.Process(splitOptions);  

バッチ分割の取り扱い方法

PDF分割ツールプラグインは、大量のPDFドキュメントを処理するように最適化されています。バッチ処理を活用することで、数百のPDFを個々のページやセクションに分割できます。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4  
 5// バッチで入力PDFファイルを追加  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8  
 9// 各ファイルの出力を定義  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12  
13// バッチ分割を処理  
14splitter.Process(splitOptions);  
 日本語