開発者ガイド
ChatGPT API を .NET PDF アプリケーションに統合
C# .NET を使用して複数の PDF ドキュメントを 1 つのファイルに統合します
ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントをリサイズします
C# .NETを使用してPDFドキュメントにセキュアなタイムスタンプを追加します
.NET プラグインは PDF ドキュメントを PDF/A 形式に変換し、コンテンツが長期保存基準に準拠することを保証します。
.NETツールはPDFドキュメントをDOCまたはDOCX形式に変換することができます
.NETプラグインは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)にシームレスに変換します
C# .NETを使用してPDF文書を暗号化および復号化します
.NETプラグインは、フォーマットを保持するか、ニーズに応じて省略しながら、効率的にテキストを抽出することを可能にします
.NETプラグインは、署名を追加するための簡素化されたプロセスを提供し、真正性を確保し、PDFコンテンツを保護します
.NETツールで、大きなPDFドキュメントを小さく、管理しやすいファイルに分割するプロセスを簡素化します
開発者ガイドのサブセクション
PDF ChatGPT
Documentize ChatGPT for .NET プラグインは、ChatGPT API を PDF アプリケーションに統合するために設計された強力なツールです。このプラグインを使用することで、開発者は入力メッセージに基づいてチャットの応答を生成し、その出力を PDF 形式で保存できます。これにより、PDF ドキュメント内での対話型インターフェースや分析レポートの作成に適しています。
主な機能:
- チャット完了: カスタム入力に基づいて ChatGPT API を使用して応答を生成します。
- システムおよびユーザーメッセージ: システムコンテキストとユーザー入力の両方を提供し、動的な会話を作成します。
- PDF 出力: 生成されたチャットの完了を構造化された PDF ファイルに保存し、さらに使用できるようにします。
- 非同期処理: チャットの完了を非同期に処理することで、応答性の高いアプリケーションを実現します。
チャット応答の生成
ChatGPT プラグインを使用してチャット応答を生成し、それを PDF ファイルに保存するには、次の手順に従います:
PdfChatGptRequestOptions
クラスのインスタンスを作成し、リクエストオプションを設定します。- 入力および出力の PDF ファイルを追加します。
- API キーを設定し、最大トークン数や ChatGPT モデルへのクエリなどのパラメータを指定します。
ProcessAsync
メソッドを実行してチャットの完了を生成します。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // API キーを設定
4options.MaxTokens = 1000; // 最大トークン数を設定
5options.Query = "このテキストの主要テーマを分析してください。";
6
7// 入力 PDF ファイルを追加
8options.AddInput(new FileDataSource("input.pdf"));
9
10// チャット応答を含む出力 PDF の保存先を指定
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// PdfChatGpt プラグインのインスタンスを作成
14var plugin = new PdfChatGpt();
15
16// プロセスを非同期に実行
17var result = await plugin.ProcessAsync(options);
システムおよびユーザーメッセージの追加
よりインタラクティブな会話を作成するには、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは、会話のコンテキストを形成するのに役立ちます。
- ChatGPT のコンテキストを設定するシステムメッセージを追加します。
- 会話のためのユーザーの入力を表すユーザーメッセージを追加します。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // API キーを設定
4
5// コンテキスト用のシステムメッセージを追加
6options.AddSystemMessage("あなたはテキストを要約するように訓練された AI です。");
7
8// ChatGPT モデルにクエリを送信するためのユーザーメッセージを追加
9options.AddUserMessage("添付された文書を要約してください。");
10
11// 入力および出力 PDF を追加
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// リクエストを非同期に処理
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
PDF マージ
Documentize PDF Merger for .NET は、複数の PDF ドキュメントを 1 つのファイルに統合するために設計された多目的ツールです。PDF ファイルの統合を簡素化し、ドキュメントが効率的に統合され、一貫性が保たれることを确保します。このプラグインは、マージされたドキュメントを最適化するために、フォントや画像などの内部リソースを処理します。
主な機能:
- 複数の PDF をマージ: 複数の PDF ファイルを簡単に 1 つに結合します。
- リソース最適化: マージ中に重複するフォントと画像を削除します。
- バッチ処理: 大量の PDF ドキュメントを一度にマージします。
- 安全なマージ: データ損失や内容の破損なしで文書の整合性を確保します。
PDF ドキュメントをマージする方法
複数の PDF ドキュメントを 1 つのファイルにマージするには、以下の手順に従ってください:
Merger
クラスのインスタンスを作成します。- マージプロセスを構成するために
MergeOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力 PDF ファイルを追加します。AddOutput
を使用して出力ファイルのパスを設定します。Process
メソッドを使用してマージを実行します。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// マージする入力 PDF ファイルを追加
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 出力ファイルのパスを指定
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// PDF をマージします
13merger.Process(mergeOptions);
ページ範囲で PDF をマージする方法
MergeOptions
クラスを使用して、入力 PDF ファイルの特定のページ範囲をマージすることもできます。これにより、選択したページを最終出力ドキュメントに結合できます。
Merger
クラスのインスタンスを作成します。MergeOptions
を使用してページ範囲を設定します。- 指定されたページ範囲を持つ入力ファイルを追加します。
- 出力パスを設定します。
Process
メソッドを呼び出します。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 入力 PDF から特定のページをマージします
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 出力ファイルのパスを指定
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// PDF をマージします
12merger.Process(mergeOptions);
バッチマージを処理する方法
PDF Merger プラグインは、大量の PDF ドキュメントを処理するために最適化されています。バッチ処理機能を活用することで、数百の PDF を一度の操作でマージし、効率的で迅速なドキュメント管理を実現できます。
Merger
クラスのインスタンスを作成します。- すべての入力 PDF ファイルを
MergeOptions
クラスに追加します。 - 出力パスを指定します。
Process
メソッドを呼び出してバッチ内のすべてのファイルをマージします。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// マージのために大量の PDF を追加します
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 出力ファイルのパスを指定
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// バッチマージを処理します
14merger.Process(mergeOptions);
PDF オプティマイザー
Documentize PDF オプティマイザーは、PDFドキュメントを高度な最適化技術によって強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントをリサイズするのに役立つように設計されています。これらの操作は、PDFファイルの品質と管理性を向上させ、保存、共有、閲覧を容易にします。
主な機能:
- 最適化: 品質を損なうことなくPDFファイルサイズを減少させます。
- 回転: PDFページの向きを調整します。
- トリミング: ドキュメントから不要な余白やコンテンツを削除します。
- リサイズ: 特定のサイズ(例:A4、レター)にページをリサイズします。
PDF ドキュメントの最適化
以下の手順では、品質を維持しながらPDFドキュメントのファイルサイズを削減する方法を示します。
- Optimizerクラスのインスタンスを作成します。
- 最適化設定を構成するためにOptimizeOptionsオブジェクトを作成します。
- 入力PDFファイルを追加し、最適化されたファイルの出力場所を設定します。
- Processメソッドを実行して最適化を行います。
1
2var optimizer = new Optimizer();
3var optimizeOptions = new OptimizeOptions();
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(optimizeOptions);
PDF ドキュメントのリサイズ
PDFドキュメントをリサイズするために、ResizeOptionsクラスを使用して新しいページサイズを指定します。
- Optimizerクラスのインスタンスを作成します。
- ページサイズを定義するためにResizeOptionsオブジェクトを作成します。
- 入力ファイルを追加し、希望する出力場所を設定します。
- SetPageSizeメソッドを使用して新しいサイズ(例:A4)を指定します。
- 変更を適用するためにProcessメソッドを呼び出します。
1
2var optimizer = new Optimizer();
3var resizeOptions = new ResizeOptions();
4resizeOptions.AddInput(new FileDataSource("input.pdf"));
5resizeOptions.SetPageSize(PageSize.A4);
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(resizeOptions);
PDF ページの回転
RotateOptionsクラスを使用してPDFファイルのページの向きを調整します。
- Optimizerクラスのインスタンスを作成します。
- RotateOptionsオブジェクトを作成し、回転角度を設定します。
- 入力PDFファイルを追加し、出力ファイルの場所を指定します。
- SetRotationメソッドを使用して回転角度(例:90度)を設定します。
- Processメソッドを使用して回転を実行します。
1
2var optimizer = new Optimizer();
3var rotateOptions = new RotateOptions();
4rotateOptions.AddInput(new FileDataSource("input.pdf"));
5rotateOptions.SetRotation(90);
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(rotateOptions);
PDF ドキュメントのトリミング
トリミングは、PDFドキュメントから不要なコンテンツや余白を削除します。CropOptionsクラスを使用してトリミング領域を定義できます。
- Optimizerクラスのインスタンスを作成します。
- CropOptionsオブジェクトでトリミング領域を定義します。
- 入力ファイルを追加し、出力ファイルの場所を指定します。
- SetCropBoxメソッドを使用してトリミング領域を定義します。
- Processメソッドを使用してトリミングを実行します。
1
2var optimizer = new Optimizer();
3var cropOptions = new CropOptions();
4cropOptions.AddInput(new FileDataSource("input.pdf"));
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // トリミング領域を定義
6cropOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(cropOptions);
PDF タイムスタンプアダー
Documentize PDF タイムスタンプアダー for .NETは、PDFドキュメントにセキュアなタイムスタンプを追加するために設計された強力なツールです。これは、信頼できる時間参照を提供することによってドキュメントの整合性と真正性を向上させ、デジタル署名の基準への準拠を保証します。
主な機能:
- セキュアなタイムスタンプの追加: 簡単にPDFドキュメントにセキュアなタイムスタンプを追加します。
- カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLと認証情報を使用します。
- 自動化: タイムスタンプ処理を.NETアプリケーションに統合して、自動化されたワークフローを実現します。
- 準拠: あなたのドキュメントがデジタル署名およびタイムスタンプに関する業界標準を満たすことを確認します。
PDFドキュメントにタイムスタンプを追加する方法
PDFドキュメントにセキュアなタイムスタンプを追加するには、以下の手順に従います:
Timestamp
クラスのインスタンスを作成します。- タイムスタンプ処理の設定を行うために
AddTimestampOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
を使用して出力ファイルのパスを設定します。Process
メソッドを使用してタイムスタンプ処理を実行します。
1// タイムスタンププラグインをインスタンス化
2var plugin = new Timestamp();
3
4// タイムスタンプオプションを設定
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
6
7// 入力PDFファイルを追加
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 出力PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行
14plugin.Process(opt);
タイムスタンプサーバーでカスタム認証を使用する方法
タイムスタンプサーバーに接続する際に基本認証情報を提供することができます。これにより、ユーザー名とパスワードが必要なサーバーに対して認証が可能になります。
Timestamp
クラスのインスタンスを作成します。serverBasicAuthCredentials
を含むAddTimestampOptions
のインスタンスを作成します。- 入力ファイルと出力ファイルのパスを追加します。
Process
メソッドを呼び出します。
1// タイムスタンププラグインをインスタンス化
2var plugin = new Timestamp();
3
4// 認証を含むタイムスタンプオプションを設定
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
6
7// 入力PDFファイルを追加
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 出力PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行
14plugin.Process(opt);
PFXファイルとパスワードの取り扱い
AddTimestampOptions
クラスを使用すると、デジタル署名用にPFXファイルとパスワードを使用することができます。
- PFXストリームまたはファイルパス: PFXファイルに対してストリームまたはファイルパスを提供できます。
- パスワード保護: PFXファイルのパスワードを安全に管理してください。
PDF/A コンバータ
Documentize PDF/A コンバータ for .NET は、PDF ドキュメントを PDF/A 形式に変換するために設計された強力なツールであり、コンテンツが長期保存基準に準拠していることを保証します。このプラグインは、PDF/A 準拠のために既存の PDF ドキュメントの検証もサポートしており、変換と検証の機能を単一のソリューションで提供します。
主な機能:
- PDF/A への変換: PDF ファイルを PDF/A 形式(PDF/A-1a、PDF/A-2b、PDF/A-3b など)にシームレスに変換し、保存基準に準拠します。
- PDF/A 準拠の検証: 既存の PDF ドキュメントが PDF/A 基準に準拠しているかをチェックし、準拠していない場合は問題を特定します。
- バッチ処理: 複数のファイルを一度に処理して、変換または検証を行います。
- 効率的なワークフロー: 高速で信頼性のある変換プロセスにより、時間と労力を最小限に抑えます。
PDF を PDF/A に変換する方法
PDF ドキュメントを PDF/A 形式に変換するには、以下の手順に従ってください:
PdfAConverter
クラスのインスタンスを作成します。- 変換を構成するために
PdfAConvertOptions
のインスタンスを作成します。 - 希望する PDF/A バージョンを指定します(例: PDF/A-3B)。
AddInput
メソッドを使用して、入力 PDF ファイルを追加します。AddOutput
メソッドを使用して、結果の PDF/A の出力ファイルを追加します。- 変換を実行するために
Process
メソッドを呼び出します。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 入力 PDF ファイルを追加
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力 PDF/A ファイルを指定
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// 変換を処理
15pdfAConverter.Process(pdfAOptions);
PDF/A 準拠の検証
PdfAValidateOptions
クラスを使用して、既存の PDF ファイルの PDF/A 準拠を検証できます。
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// 検証する PDF ファイルを追加
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 検証プロセスを実行
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// 検証結果を確認
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A 検証合格: " + validationResult.IsValid);
PDF/A 変換のためのバッチ処理
このプラグインはバッチ処理をサポートしており、複数の PDF ファイルを一度に PDF/A 準拠のために変換または検証できます。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 複数の入力 PDF を追加
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 変換された PDF/A の出力ファイルを指定
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// バッチ変換を処理
17pdfAConverter.Process(pdfAOptions);
PDFからDOCへの変換ツール
Documentize PDFからDOCへの変換ツール for .NETは、PDFドキュメントをDOCまたはDOCX形式に変換するために設計された強力なツールです。このプラグインはPDFページを編集可能なMicrosoft Wordドキュメントにシームレスに変換し、複数のプラットフォームでコンテンツを再利用、編集、共有することを容易にします。
主な機能:
- DOC/DOCX変換: PDFドキュメントを編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
- フォーマット維持: 変換プロセス中に元のレイアウト、テキスト、フォーマットを保持します。
- バッチ処理: 複数のPDFファイルを一度に変換します。
- カスタム変換オプション: より良いレイアウトのために、Enhanced Flowなどの異なるモードを使用して変換プロセスを微調整します。
PDFをDOC/DOCXに変換する方法
PDFドキュメントをDOC/DOCX形式に変換するには、次の手順に従ってください。
PdfDoc
クラスのインスタンスを作成します。- 変換プロセスを設定するために
PdfToDocOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して生成されるDOC/DOCXファイルの出力ファイルパスを追加します。Process
メソッドを実行して変換を行います。
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX, // 出力形式をDOCXに設定
6 ConversionMode = ConversionMode.EnhancedFlow // レイアウトとフォーマットを最適化
7};
8
9// 入力PDFファイルを追加
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// 出力Wordドキュメントのパスを追加
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
14
15// 変換を実行
16pdfToWord.Process(options);
カスタムオプションを使用したPDFからDOCへの変換
PDFからDOCへの変換ツールプラグインは、変換プロセスをカスタマイズするためのいくつかのオプションを提供します。変換中にPDFのレイアウトや構造の取り扱いを制御するために、異なるモードの中から選ぶことができます。
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.Doc, // 出力形式をDOCに設定
6 ConversionMode = ConversionMode.Precise // 元のPDFレイアウトを可能な限り維持
7};
8
9// 入力PDFファイルを追加
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// 出力Wordドキュメントのパスを追加
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
14
15// 変換を実行
16pdfToWord.Process(options);
PDFからDOC/DOCXのバッチ処理
PDFからDOCへの変換ツールはバッチ処理をサポートしており、複数のPDFファイルを一度に変換することができます。バッチ変換の例は次の通りです。
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX
6};
7
8// 複数の入力PDFファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 生成されるDOCXファイルの出力ファイルパスを追加
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
15
16// バッチ変換を実行
17pdfToWord.Process(options);
PDFからXLSコンバータ
.NET用Documentize PDFからXLSコンバータは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)にシームレスに変換する強力なツールです。このプラグインはPDFコンテンツのアクセシビリティと使いやすさを向上させ、スプレッドシート形式でデータを操作・分析しやすくします。
主な機能:
- PDFをExcelに変換: PDFファイルをXLS/XLSXスプレッドシートに変換してデータを簡単に管理。
- カスタム出力オプション: 出力形式、ページ範囲、ワークシート名などの設定を構成できます。
- 高忠実度変換: 変換中にレイアウト、フォーマット、および内容の正確さを保持します。
- バッチ処理: 大規模な操作のために複数のPDFファイルを一度に変換できます。
PDFをXLSに変換する方法
PDFドキュメントをExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。
PdfXls
クラスのインスタンスを作成します。- 変換設定を構成するために
PdfToXlsOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力Excelファイルを指定します。Process
メソッドを実行して変換を開始します。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換プロセスを実行
9pdfXlsConverter.Process(options);
PDFからExcelへの変換のカスタマイズ
PdfToXlsOptions
クラスを修正することによって変換設定をカスタマイズできます。たとえば、PDFをXLSX形式に変換し、空の列を挿入し、ワークシート名を設定するには、次のコードを使用します。
1var options = new PdfToXlsOptions();
2
3// 出力形式をXLSXに設定
4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
5
6// 最初の位置に空の列を挿入
7options.InsertBlankColumnAtFirst = true;
8
9// ワークシート名を設定
10options.WorksheetName = "MySheet";
11
12// 入力および出力ファイルを追加
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 変換を処理
17pdfXlsConverter.Process(options);
変換結果の処理
処理後、Processメソッドは変換の結果を保持するResultContainer
オブジェクトを返します。変換されたファイルパスやその他の出力詳細を取得できます。
1var resultContainer = pdfXlsConverter.Process(options);
2
3// 結果ファイルパスにアクセスして表示
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
PDFからXLSへのバッチ処理
PDFからXLSコンバータプラグインは、複数のPDFファイルを一度に変換できるバッチ処理もサポートしています。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 複数の入力PDFを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 出力Excelファイルを追加
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を処理
13pdfXlsConverter.Process(options);
PDFセキュリティ
Documentize PDFセキュリティ for .NETは、PDF文書のセキュリティを強化するために設計された強力なツールで、暗号化および復号化機能を提供します。これにより、機密情報が機密であり、無許可のアクセスから保護されることが保証されます。
主な機能:
- PDF文書の暗号化: ユーザーパスワードとオーナーパスワードを追加してPDFファイルを保護します。
- PDF文書の復号化: 必要に応じてPDFから暗号化を解除します。
- 権限の設定: 印刷、コピー、コンテンツの変更などの権限を制御します。
- 自動化: 自動化ワークフローのために、暗号化および復号化を.NETアプリケーションに統合します。
- コンプライアンス: 文書が文書セキュリティに関する業界標準を満たしていることを確認します。
PDF文書を暗号化する方法
PDF文書を暗号化するには、以下の手順に従います:
Security
クラスのインスタンスを作成します。- 必要なユーザーおよびオーナーパスワードを使用して
EncryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
を使用して出力ファイルパスを設定します。Process
メソッドを使用して暗号化を実行します。
1
2// Securityプラグインをインスタンス化
3var plugin = new Security();
4
5// 暗号化オプションを構成
6var opt = new EncryptionOptions("user_password", "owner_password");
7
8// 入力PDFファイルを追加
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 出力暗号化PDFファイルを指定
12opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
13
14// 暗号化プロセスを実行
15plugin.Process(opt);
PDF文書を復号化する方法
PDF文書を復号化するには、以下の手順に従います:
Security
クラスのインスタンスを作成します。- 必要なパスワードを使用して
DecryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して暗号化されたPDFファイルを追加します。AddOutput
を使用して出力ファイルパスを設定します。Process
メソッドを使用して復号化を実行します。
1
2// Securityプラグインをインスタンス化
3var plugin = new Security();
4
5// 復号化オプションを構成
6var opt = new DecryptionOptions("user_password");
7
8// 入力暗号化PDFファイルを追加
9opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
10
11// 出力復号化PDFファイルを指定
12opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
13
14// 復号化プロセスを実行
15plugin.Process(opt);
PDF文書の権限設定
PDFを暗号化する際に、文書の使用方法を制御するためにさまざまな権限を設定できます。
- 印刷: 文書の印刷を許可または禁止します。
- コピー: コンテンツのコピーを許可または禁止します。
- 変更: 文書の変更を許可または禁止します。
権限を設定するには、EncryptionOptions
を適宜構成できます。
PDFテキスト抽出ツール
Documentize PDFテキスト抽出ツール for .NETは、PDFドキュメントからテキストを抽出するのを簡素化します。純粋なテキスト、未加工のテキスト、またはプレーンテキストが必要な場合、このプラグインはフォーマットを保持するか、ニーズに応じて省略しながら効率的にテキストを抽出することを可能にします。
主な機能:
- 純粋モード:元のフォーマットを保持しながらテキストを抽出します。
- 生モード:フォーマットなしでテキストを抽出します。
- プレーンモード:特殊文字やフォーマットなしでテキストを抽出します。
- バッチ処理:複数のPDFから一度にテキストを抽出します。
PDFドキュメントからテキストを抽出する方法
PDFドキュメントからテキストを抽出するには、次の手順に従ってください:
TextExtractor
クラスのインスタンスを作成します。- 抽出オプションを構成するために
TextExtractorOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。- テキストを抽出するために
Process
メソッドを実行します。 - 抽出されたテキストに
ResultContainer.ResultCollection
を使用してアクセスします。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// テキスト抽出を処理
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// 抽出されたテキストを表示
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
複数のPDFからのテキスト抽出
このプラグインを使用すると、複数のPDFから同時にテキストを抽出でき、迅速かつ効率的な処理が可能です。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 複数の入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// 抽出を処理
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを出力
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
テキスト抽出モード
TextExtractorプラグインは、ニーズに応じて柔軟性を提供する3つの抽出モードを提供します。
- 純粋モード:元のフォーマットを保持し、スペースや配置を含みます。
- 生モード:フォーマットなしでテキストを抽出します。生データ処理に役立ちます。
- プレーンモード:特殊文字や追加フォーマットなしでテキストを抽出します。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 純粋モードに設定
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 処理と出力
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
バッチ処理の扱い方
大規模なドキュメントセットの場合、バッチ処理を活用して、複数のPDFから一度にテキストを抽出することができます。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 複数の入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// 各ファイルの出力を定義
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを処理
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
PDF署名
Documentize PDF署名 for .NETプラグインは、ユーザーがPDF文書にデジタル署名を行うことを可能にします。このプラグインは、署名の追加、真正性の確保、PDFコンテンツの保護のための簡素化されたプロセスを提供します。プラグインは、表示された署名と非表示の署名の両方をサポートし、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。
主要機能:
- PDF文書にデジタル署名: 表示されたまたは非表示のデジタル署名で文書を保護します。
- PFXサポート: PFX証明書を使用してPDFファイルに署名します。
- カスタマイズ可能なオプション: 理由、場所、連絡先の詳細など、署名設定を構成します。
- 表示および非表示の署名: 署名が文書に表示されるかどうかを選択します。
PDF文書に署名する方法
PFXファイルを使用してPDF文書に署名するには、次の手順に従います。
Signature
クラスのインスタンスを作成します。- PFXファイルパスとパスワードを指定して
SignOptions
クラスのインスタンスを作成します。 - 入力PDFと出力ファイルをオプションに追加します。
- 署名を適用するために
Process
メソッドを実行します。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 入力PDFを追加し、出力ファイルを指定します
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// 署名オプションを構成します
9signOptions.Reason = "契約合意";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "ニューヨーク";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 文書に署名を適用します
17signature.Process(signOptions);
PFXファイルのストリームを使用する方法
ファイルパスの代わりにストリームとして提供されるPFX証明書を使用してPDFに署名することもできます。これにより、証明書のストレージ管理がより柔軟になります。
Signature
クラスのインスタンスを作成します。- PFXとパスワードを含むストリームで
SignOptions
をインスタンス化します。 - 入力ファイルと出力ファイルを追加します。
- 署名を適用するために
Process
メソッドを実行します。
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// 入力ファイルと出力ファイルを追加します
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 署名を適用します
10signature.Process(signOptions);
非表示署名を適用する方法
文書に署名を表示せずに文書を保護する非表示署名を追加するには、単にVisible
プロパティをfalse
に設定します。
SignOptions
のインスタンスを作成します。Visible
をfalse
に設定します。- 入力ファイルと出力ファイルを追加します。
- 非表示署名を適用するために
Process
を呼び出します。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 非表示署名を構成します
5signOptions.Visible = false;
6
7// 入力ファイルと出力ファイルを追加します
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 署名を処理します
12signature.Process(signOptions);
PDF分割ツール
Documentize PDF分割ツール for .NET は、大きなPDFドキュメントを小さく、管理しやすいファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合や、文書を特定のセクションに分割する必要がある場合でも、このプラグインを使用すれば、効率的かつ最小限の労力で実現できます。
主な機能:
- ページごとのPDF分割: PDFドキュメントを個々のページに分解します。
- バッチ処理: 大量のPDFを一度に分割します。
- カスタム分割オプション: 要件に基づいて分割プロセスを構成します。
- 整理された出力: 各分割ページまたはセクションの出力ファイルを簡単に管理します。
PDFドキュメントの分割方法
PDFドキュメントを個々のページに分割するには、次の手順に従います:
Splitter
クラスのインスタンスを作成します。- 分割オプションを構成するために
SplitOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して各分割ページの出力ファイルを追加します。- 文書を分割するために
Process
メソッドを実行します。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 入力PDFファイルを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 各ページの出力ファイルを指定
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
12
13// 分割操作を処理
14splitter.Process(splitOptions);
ページ範囲でのPDF分割
ページ範囲を指定してPDFを分割することもできます。これにより、PDFから特定のセクションや複数ページを別の文書に抽出できます。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 入力PDFを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// ページ範囲の出力を定義(例: ページ1-3)
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
10
11// 分割を処理
12splitter.Process(splitOptions);
バッチ分割の取り扱い方法
PDF分割ツールプラグインは、大量のPDFドキュメントを処理するように最適化されています。バッチ処理を活用することで、数百のPDFを個々のページやセクションに分割できます。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// バッチで入力PDFファイルを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 各ファイルの出力を定義
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
12
13// バッチ分割を処理
14splitter.Process(splitOptions);