開発者ガイドのサブセクション
PDFセキュリティ
Documentize PDFセキュリティ for .NETは、PDF文書のセキュリティを強化するために設計された強力なツールで、暗号化と復号化の機能を提供します。これにより、機密情報が非公開であり、無断アクセスから保護されることを保証します。
主な機能:
- PDF文書の暗号化: ユーザーとオーナーのパスワードを追加してPDFファイルを保護します。
- PDF文書の復号化: 必要に応じてPDFから暗号を削除します。
- 権限の設定: 印刷、コピー、コンテンツの変更などの権限を制御します。
- 自動化: .NETアプリケーションに暗号化と復号化を統合し、自動化されたワークフローを実現します。
- コンプライアンス: 文書が業界標準の文書セキュリティ要件を満たすことを保証します。
PDF文書を暗号化する方法
PDF文書を暗号化するには、次の手順に従います:
Security
クラスのインスタンスを作成します。- 望ましいユーザーとオーナーのパスワードで
EncryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
を使用して出力ファイルのパスを設定します。Process
メソッドを使用して暗号化を実行します。
1// Securityプラグインのインスタンスを作成
2var plugin = new Security();
3
4// 暗号化オプションを設定
5var opt = new EncryptionOptions("user_password", "owner_password");
6
7// 入力PDFファイルを追加
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 出力暗号化PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// 暗号化プロセスを実行
14plugin.Process(opt);
PDF文書を復号化する方法
PDF文書を復号化するには、次の手順に従います:
Security
クラスのインスタンスを作成します。- 必要なパスワードで
DecryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して暗号化されたPDFファイルを追加します。AddOutput
を使用して出力ファイルのパスを設定します。Process
メソッドを使用して復号化を実行します。
1// Securityプラグインのインスタンスを作成
2var plugin = new Security();
3
4// 復号化オプションを設定
5var opt = new DecryptionOptions("user_password");
6
7// 入力暗号化PDFファイルを追加
8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
9
10// 出力復号化PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// 復号化プロセスを実行
14plugin.Process(opt);
PDF文書に権限を設定する
PDFを暗号化するとき、文書の使用方法を制御するためのさまざまな権限を設定できます。
- 印刷: 文書の印刷を許可または不許可にします。
- コピー: コンテンツのコピーを許可または不許可にします。
- 変更: 文書の変更を許可または不許可にします。
権限を設定するには、適切にEncryptionOptions
を構成できます。
PDFテーブルジェネレーター
.NET用ドキュメンタイズテーブルジェネレーターは、PDF文書へのテーブルの統合をスムーズにするために設計された多目的プラグインです。データを整理する場合、フォームをデザインする場合、または文書の可読性を向上させる場合でも、このプラグインはプロセスを簡素化し、精密さと効率を保ちます。その直感的なAPIは、単一の文書とバッチ処理ワークフローの両方をサポートしており、構造化データを扱う開発者にとって不可欠なツールです。
主な特徴:
- 動的テーブル作成: PDF文書に構造化されたテーブルを簡単に生成します。
- リッチコンテンツサポート: テーブルにテキスト、HTML、画像、LaTeXコンテンツを埋め込みます。
- ページ配置: PDF内の特定の位置にテーブルを正確に挿入します。
- カスタマイズ可能なレイアウト: テーブル構造、セルの配置、スタイルを調整します。
- バッチ処理: 複数の文書を同時に処理して最大限の効率を実現します。
テーブルを含むPDFの作成
TableGenerator
クラスを使用してPDF内に構造化されたテーブルを作成する手順は次のとおりです。
TableGenerator
クラスをインスタンス化します。TableOptions
オブジェクトを設定してテーブルの構造、コンテンツ、入出力ファイルを定義します。- PDFにテーブル、行、およびセルを追加します。
Process
メソッドを使用してテーブル生成プロセスを完了します。
以下は例です。
1
2var generator = new TableGenerator();
3var options = new TableOptions();
4
5// 入力と出力のPDFファイルを指定
6options.AddInput(new FileDataSource("input.pdf"));
7options.AddOutput(new FileDataSource("output.pdf"));
8
9// 行とセルを持つテーブルを定義
10options
11 .InsertPageAfter(1) // 最初のページの後にテーブルを追加
12 .AddTable()
13 .AddRow()
14 .AddCell().AddParagraph(new TextFragment("セル 1"))
15 .AddCell().AddParagraph(new TextFragment("セル 2"))
16 .AddCell().AddParagraph(new TextFragment("セル 3"));
17
18// 文書内でテーブルを生成
19generator.Process(options);
テーブルにリッチコンテンツを追加
PDF文書のテーブルには、その機能性と外観を向上させるためにさまざまなコンテンツタイプを含めることができます。以下は、HTMLコンテンツをテーブルセルに追加する例です。
1
2options
3 .AddTable()
4 .AddRow()
5 .AddCell().AddParagraph(new HtmlFragment("<h1>ヘッダー 1</h1>"))
6 .AddCell().AddParagraph(new HtmlFragment("<h2>ヘッダー 2</h2>"))
7 .AddCell().AddParagraph(new HtmlFragment("<h3>ヘッダー 3</h3>"));
テーブルでサポートされているコンテンツタイプ
PDFテーブルジェネレーターは、さまざまなコンテンツタイプをサポートしており、開発者が幅広いユースケースに対応できるようにテーブルをカスタマイズできます。
- HtmlFragment: ヘッダー、リスト、フォーマットされたテキストなどのHTMLベースのコンテンツを追加します。
- TeXFragment: 数学的な方程式や科学的表記のためのLaTeXベースのコンテンツを含めます。
- TextFragment: プレーンまたはフォーマットされたテキストを挿入します。
- Image: テーブルセルに直接画像を埋め込みます。
テーブルのレイアウトと構造のカスタマイズ
このプラグインは、行の高さ、列の幅、セルの配置など、テーブル構造を調整する柔軟性を提供します。これらのカスタマイズオプションを使用して、文書のレイアウトとスタイルのニーズに合ったテーブルをデザインできます。
テーブル生成の処理
すべてのコンテンツを追加し、テーブル構造をカスタマイズした後、Process
メソッドを呼び出してプロセスを完了します。このメソッドは、テーブルを生成しPDF文書を更新します。結果を処理する方法は以下の通りです。
1
2var resultContainer = generator.Process(options);
3
4// 生成した結果の数を出力
5Console.WriteLine("生成された結果の数: " + resultContainer.ResultCollection.Count);
PDFテーブルジェネレーターのユースケース
- データレポーティング: 分析、財務報告、または調査結果を明確で整理された形式で提示します。
- フォームデザイン: 構造化されたテーブルレイアウトを持つインタラクティブなフォームを作成します。
- 文書の強化: ユーザーマニュアル、ガイド、または教育資料の可読性と使いやすさを向上させます。
- バッチ処理: 複数のPDF文書のテーブル生成を自動化します。
PDFオプティマイザー
Documentize PDFオプティマイザーは、PDF文書を高度な最適化技術によって強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツを切り取り、文書をリサイズするのを助けるために設計されています。これらの操作により、PDFファイルの品質と管理性が向上し、保管、共有、および表示が容易になります。
主な機能:
- 最適化: 質を損なうことなくPDFファイルのサイズを削減します。
- 回転: PDFページの向きを調整します。
- 切り取り: 文書から不要な余白やコンテンツを削除します。
- リサイズ: ページを特定の寸法(例:A4、レター)にリサイズします。
PDF文書の最適化
以下の手順は、品質を維持しながらPDF文書のファイルサイズを削減する方法を示しています。
- Optimizerクラスのインスタンスを作成します。
- 最適化設定を構成するためにOptimizeOptionsオブジェクトを作成します。
- 入力PDFファイルを追加し、最適化されたファイルの出力先を設定します。
- Processメソッドを実行して最適化を実行します。
1
2var optimizer = new Optimizer();
3var optimizeOptions = new OptimizeOptions();
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(optimizeOptions);
PDF文書のリサイズ
PDF文書をリサイズするために、ResizeOptionsクラスを使用して文書の新しいページサイズを指定します。
- Optimizerクラスのインスタンスを作成します。
- ページサイズを定義するためにResizeOptionsオブジェクトを作成します。
- 入力ファイルを追加し、希望の出力先を設定します。
- SetPageSizeメソッドを使用して新しいサイズを指定します(例:A4)。
- Processメソッドを呼び出して変更を適用します。
1
2var optimizer = new Optimizer();
3var resizeOptions = new ResizeOptions();
4resizeOptions.AddInput(new FileDataSource("input.pdf"));
5resizeOptions.SetPageSize(PageSize.A4);
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(resizeOptions);
PDFページの回転
RotateOptionsクラスを使用して、PDFファイル内のページの向きを調整します。
- Optimizerクラスのインスタンスを作成します。
- RotateOptionsオブジェクトを作成し、回転角度を設定します。
- 入力PDFファイルを追加し、出力ファイルの位置を指定します。
- SetRotationメソッドを使用して回転角度(例:90度)を設定します。
- Processメソッドで回転を実行します。
1
2var optimizer = new Optimizer();
3var rotateOptions = new RotateOptions();
4rotateOptions.AddInput(new FileDataSource("input.pdf"));
5rotateOptions.SetRotation(90);
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(rotateOptions);
PDF文書の切り取り
切り取りは、PDF文書から不要なコンテンツや余白を削除します。CropOptionsクラスを使用して、切り取り領域を定義できます。
- Optimizerクラスのインスタンスを作成します。
- CropOptionsオブジェクトを使用して切り取り領域を定義します。
- 入力ファイルを追加し、出力ファイルの位置を指定します。
- SetCropBoxメソッドを使用して切り取り領域を定義します。
- Processメソッドで切り取りを実行します。
1
2var optimizer = new Optimizer();
3var cropOptions = new CropOptions();
4cropOptions.AddInput(new FileDataSource("input.pdf"));
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 切り取り領域を定義
6cropOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(cropOptions);
PDFマージャー
Documentize PDFマージャー for .NET は、複数のPDF文書を1つのファイルに結合するために設計された多目的ツールです。このツールはPDFファイルの統合を簡素化し、ドキュメントが効率的に結合され、一貫性が保たれることを保証します。このプラグインは、マージされた文書を最適化するためにフォントや画像などの内部リソースを処理します。
主な機能:
- 複数のPDFの結合: 複数のPDFファイルを簡単に1つに結合できます。
- リソースの最適化: 結合中に重複したフォントや画像を削除します。
- バッチ処理: 大量のPDF文書を一度に結合します。
- 安全な結合: データの損失やコンテンツの破損なしに文書の整合性を保証します。
PDF文書を結合する方法
複数のPDF文書を1つのファイルに結合するには、次の手順に従います:
Merger
クラスのインスタンスを作成します。- 結合プロセスを構成するために
MergeOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
を使用して出力ファイルのパスを設定します。Process
メソッドを使用して結合を実行します。
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// 結合する入力PDFファイルを追加
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
9
10// 出力ファイルのパスを指定
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
12
13// PDFを結合
14merger.Process(mergeOptions);
ページ範囲でPDFを結合する方法
MergeOptions
クラスを使用して、入力PDFファイルから特定のページ範囲を結合することもできます。これにより、選択したページを最終出力文書にまとめることができます。
Merger
クラスのインスタンスを作成します。MergeOptions
を使用してページ範囲を構成します。- 指定したページ範囲の入力ファイルを追加します。
- 出力パスを設定します。
Process
メソッドを呼び出します。
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// 入力PDFの特定のページを結合
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
8
9// 出力ファイルのパスを指定
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
11
12// PDFを結合
13merger.Process(mergeOptions);
バッチ結合を処理する方法
PDFマージャープラグインは、大量のPDF文書を処理するために最適化されています。バッチ処理機能を活用することで、数百のPDFを一度の操作で結合し、効率的かつ迅速な文書管理を保証することができます。
Merger
クラスをインスタンス化します。- すべての入力PDFファイルを
MergeOptions
クラスに追加します。 - 出力パスを指定します。
Process
メソッドを呼び出して、バッチ内のすべてのファイルを結合します。
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// 結合のために大量のPDFを追加
6for (int i = 1; i <= 100; i++)
7{
8 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
9}
10
11// 出力ファイルのパスを指定
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
13
14// バッチ結合を処理
15merger.Process(mergeOptions);
PDF署名
Documentize PDF署名 for .NET プラグインは、ユーザーがPDFドキュメントにデジタル署名を行うことを可能にします。これは、署名を追加し、真正性を保証し、PDFコンテンツを保護するための合理化されたプロセスを提供します。このプラグインは、可視署名と非可視署名の両方をサポートしており、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。
主な機能:
- PDFドキュメントにデジタル署名: 可視または非可視のデジタル署名で文書を保護します。
- PFXサポート: PFX証明書を使用してPDFファイルに署名します。
- カスタマイズ可能なオプション: 理由、場所、連絡先の詳細などの署名設定を構成します。
- 可視署名と非可視署名: 署名がドキュメントに表示されるかどうかを選択します。
PDFドキュメントに署名する方法
PFXファイルを使用してPDFドキュメントに署名するには、以下の手順に従ってください:
Signature
クラスのインスタンスを作成します。- PFXファイルのパスとパスワードで
SignOptions
クラスをインスタンス化します。 - 入力PDFと出力ファイルをオプションに追加します。
Process
メソッドを実行して署名を適用します。
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// 入力PDFを追加し、出力ファイルを指定します
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 署名オプションを構成します
10signOptions.Reason = "契約合意";
11signOptions.Contact = "johndoe@example.com";
12signOptions.Location = "ニューヨーク";
13signOptions.PageNumber = 1;
14signOptions.Visible = true;
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
16
17// ドキュメントに署名を適用します
18signature.Process(signOptions);
PFXファイルにストリームを使用する方法
ファイルパスの代わりにストリームとして提供されたPFX証明書を使用してPDFに署名することもできます。これにより証明書の保存をより柔軟に扱うことができます。
Signature
クラスのインスタンスを作成します。- PFXを含むストリームとパスワードで
SignOptions
をインスタンス化します。 - 入力と出力ファイルを追加します。
Process
メソッドを実行して署名を適用します。
1
2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
3var signature = new Signature();
4var signOptions = new SignOptions(pfxStream, "pfxPassword");
5
6// 入力と出力ファイルを追加します
7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
9
10// 署名を適用します
11signature.Process(signOptions);
非可視署名を適用する方法
文書に署名を表示せずに文書を保護する非可視署名を追加するには、Visible
プロパティをfalse
に設定します。
SignOptions
のインスタンスを作成します。Visible
をfalse
に設定します。- 入力と出力ファイルを追加します。
Process
を呼び出して非可視署名を適用します。
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// 非可視署名を構成します
6signOptions.Visible = false;
7
8// 入力と出力ファイルを追加します
9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
11
12// 署名を処理します
13signature.Process(signOptions);
PDFスプリッター
Documentize PDFスプリッター for .NETは、大きなPDFドキュメントをより管理しやすい小さなファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合でも、特定のセクションにドキュメントを分割する必要がある場合でも、このプラグインを使用することで、効率的に、最小限の労力で達成できます。
主な機能:
- ページごとにPDFを分割: PDFドキュメントを個々のページに分解します。
- バッチ処理: 大量のPDFを一度に分割します。
- カスタム分割オプション: 要件に応じて分割プロセスを設定します。
- 整理された出力: 各分割ページまたはセクションの出力ファイルを簡単に管理できます。
PDFドキュメントを分割する方法
PDFドキュメントを個々のページに分割するには、以下の手順に従ってください:
Splitter
クラスのインスタンスを作成します。- 分割オプションを設定するために
SplitOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して各分割ページの出力ファイルを追加します。- ドキュメントを分割するために
Process
メソッドを実行します。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 入力PDFファイルを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 各ページの出力ファイルを指定
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
12
13// 分割操作を処理
14splitter.Process(splitOptions);
ページ範囲によるPDFの分割
ページ範囲を指定することでPDFを分割することもできます。これにより、特定のセクションや複数のページをPDFから別々のドキュメントとして抽出できます。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 入力PDFを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// ページ範囲の出力を定義(例: ページ1-3)
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
10
11// 分割を処理
12splitter.Process(splitOptions);
バッチ分割の扱い方
PDFスプリッタープラグインは、大量のPDFドキュメントを処理するために最適化されています。バッチ処理を活用することで、数百のPDFを個々のページやセクションに分割できます。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// バッチで入力PDFファイルを追加
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 各ファイルの出力を定義
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
12
13// バッチ分割を処理
14splitter.Process(splitOptions);
PDF ChatGPT
Documentize ChatGPT for .NETプラグインは、ChatGPT APIをPDFアプリケーションに統合するために設計された強力なツールです。このプラグインを使用すると、開発者は入力メッセージに基づいてチャット応答を生成し、その出力をPDF形式で保存することができ、PDFドキュメント内で会話インターフェースや分析レポートを直接作成するのに適しています。
主な機能:
- チャットの補完: カスタム入力に基づいてChatGPT APIを使用して応答を生成します。
- システムおよびユーザーメッセージ: システムコンテキストとユーザー入力の両方を提供してダイナミックな会話を作成します。
- PDF出力: 生成されたチャット補完を構造化されたPDFファイルに保存し、後で利用できます。
- 非同期処理: チャット補完を非同期的に処理することで、応答性の高いアプリケーションを実現します。
チャット応答の生成
ChatGPTプラグインを使用してチャット応答を生成し、それをPDFファイルに保存するには、次の手順に従ってください。
- リクエストオプションを構成するために
PdfChatGptRequestOptions
クラスのインスタンスを作成します。 - 入力および出力のPDFファイルを追加します。
- APIキーを設定し、最大トークン数やChatGPTモデルへのクエリなどのパラメータを指定します。
ProcessAsync
メソッドを実行してチャット補完を生成します。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // あなたのAPIキーを設定
4options.MaxTokens = 1000; // 最大トークン数を設定
5options.Query = "このテキストの重要なテーマを分析してください。";
6
7// 入力PDFファイルを追加
8options.AddInput(new FileDataSource("input.pdf"));
9
10// チャット応答を持つ出力PDFを保存する場所を指定
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// PdfChatGptプラグインのインスタンスを作成
14var plugin = new PdfChatGpt();
15
16// プロセスを非同期的に実行
17var result = await plugin.ProcessAsync(options);
システムおよびユーザーメッセージの追加
よりインタラクティブな会話を作成するために、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは、会話のコンテキストを形作るのに役立ちます。
- ChatGPTのコンテキストを設定するシステムメッセージを追加します。
- 会話のユーザーの入力を表すユーザーメッセージを追加します。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // あなたのAPIキーを設定
4
5// コンテキストのためのシステムメッセージを追加
6options.AddSystemMessage("あなたはテキストを要約するために訓練されたAIです。");
7
8// ChatGPTモデルを照会するためのユーザーメッセージを追加
9options.AddUserMessage("添付のドキュメントを要約してください。");
10
11// 入力および出力PDFを追加
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// リクエストを非同期的に処理
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
PDFテキスト抽出ツール
Documentize PDFテキスト抽出ツール for .NET は、PDF文書からテキストを抽出する作業を簡素化します。純粋なテキスト、生のテキスト、またはプレーンテキストが必要な場合、このプラグインはニーズに応じてフォーマットを保持したり省略したりしながら、効率的にテキストを抽出できます。
主な機能:
- 純粋モード: 元のフォーマットを保持しながらテキストを抽出します。
- 生モード: フォーマットなしでテキストを抽出します。
- プレーンモード: 特殊文字やフォーマットなしでテキストを抽出します。
- バッチ処理: 一度に複数のPDFからテキストを抽出します。
PDF文書からテキストを抽出する方法
PDF文書からテキストを抽出するには、以下の手順に従います:
TextExtractor
クラスのインスタンスを作成します。- 抽出オプションを設定するために
TextExtractorOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。Process
メソッドを実行してテキストを抽出します。ResultContainer.ResultCollection
を使用して抽出されたテキストにアクセスします。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// テキスト抽出を処理
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// 抽出されたテキストを表示
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
複数のPDFからテキストを抽出する
このプラグインは、複数のPDFから同時にテキストを抽出できるようにし、迅速で効率的な処理を確保します。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 複数の入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// 抽出を処理
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを出力
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
テキスト抽出モード
TextExtractorプラグインは、ニーズに応じた柔軟性を提供する3つの抽出モードを提供します。
- 純粋モード: 空白や整列を含む元のフォーマットを保持します。
- 生モード: フォーマットなしでテキストを抽出し、生データ処理に役立ちます。
- プレーンモード: 特殊文字や追加のフォーマットなしでテキストを抽出します。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 純粋モードに設定
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 処理して出力
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
バッチ処理の取り扱い方法
大規模な文書セットでは、バッチ処理を活用することで、複数のPDFから一度にテキストを抽出できます。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 複数の入力PDFを追加
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// 各ファイルの出力を定義
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを処理
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
PDF タイムスタンプ追加ツール
Documentize PDF タイムスタンプ追加ツール for .NETは、PDF文書に安全なタイムスタンプを追加するために設計された強力なツールです。信頼できる時間の参照を提供することにより、文書の整合性と真正性を向上させ、デジタル署名基準への準拠を確保します。
主な機能:
- 安全なタイムスタンプの追加: PDF文書に安全なタイムスタンプを簡単に追加できます。
- カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLと認証情報を使用できます。
- 自動化: .NETアプリケーションにタイムスタンプ処理を統合し、自動ワークフローを実現します。
- 準拠: 文書がデジタル署名およびタイムスタンプの業界基準を満たすことを保証します。
PDF文書にタイムスタンプを追加する方法
PDF文書に安全なタイムスタンプを追加するには、以下の手順に従ってください:
Timestamp
クラスのインスタンスを作成します。- **タイムスタンプ処理
PDF/Aコンバータ
Documentize PDF/Aコンバータ for .NETは、PDF文書をPDF/A形式に変換するための強力なツールであり、コンテンツが長期アーカイブ基準に準拠したまま保持されることを保証します。このプラグインは、PDF/A準拠のための既存のPDF文書を検証することもサポートしており、変換と検証の機能を単一のソリューションで提供します。
主な機能:
- PDF/Aへの変換: PDFファイルをPDF/A形式(PDF/A-1a、PDF/A-2b、PDF/A-3bなど)にシームレスに変換し、アーカイブ基準への準拠を保証します。
- PDF/A準拠の検証: 既存のPDF文書がPDF/A基準に適合しているかをチェックし、準拠していない場合は問題を特定します。
- バッチ処理: 複数のファイルを一度に処理して、変換または検証を行います。
- 効率的なワークフロー: 高速で信頼性のある変換プロセスで、時間と労力を最小限に抑えます。
PDFをPDF/Aに変換する方法
PDF文書をPDF/A形式に変換するには、次の手順に従ってください:
PdfAConverter
クラスのインスタンスを作成します。- 変換を設定するために
PdfAConvertOptions
のインスタンスを作成します。 - 希望するPDF/Aバージョンを指定します(例:PDF/A-3B)。
AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して、生成されるPDF/Aの出力ファイルを追加します。Process
メソッドを呼び出して変換を実行します。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 入力PDFファイルを追加
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力PDF/Aファイルを指定
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// 変換を処理
15pdfAConverter.Process(pdfAOptions);
PDF/A準拠の検証
PdfAValidateOptions
クラスを使用して、既存のPDFファイルのPDF/A準拠を検証できます。
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// 検証するPDFファイルを追加
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 検証プロセスを実行
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// 検証結果を確認
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A検証成功: " + validationResult.IsValid);
PDF/A変換のためのバッチ処理
このプラグインはバッチ処理をサポートしており、複数のPDFファイルを一度にPDF/A準拠のために変換または検証できます。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 複数の入力PDFを追加
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 変換されたPDF/Aの出力ファイルを指定
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// バッチ変換を処理
17pdfAConverter.Process(pdfAOptions);
PDFからXLSへの変換ツール
Documentize PDFからXLSへの変換ツール .NET は、PDF文書をExcelスプレッドシート(XLS/XLSX)に変換するための多目的で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的かつ編集可能なスプレッドシートにシームレスに変換でき、データの操作、分析、および共有を簡素化します。
主な機能:
- 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換します。
- コンテンツの保持: 元の構造、レイアウト、およびフォーマットを維持します。
- カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定できます。
- バッチ処理: 複数のPDFファイルを同時に処理して高い効率を実現します。
- 高度なフォーマット: 空の列を挿入したり、ワークシートの数を最小限に抑えたりします。
PDFからExcelへの変換方法
PDF文書をExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。
XlsConverter
クラスのインスタンスを作成します。PdfToXlsOptions
クラスを使用して変換設定を構成します。AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力ファイルパスを指定します。Process
メソッドを実行して変換を開始します。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換を実行
9converter.Process(options);
PDFからExcelへの変換をカスタマイズする
PdfToXlsOptions
クラスを使用すると、変換プロセスをカスタマイズできます。例えば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度なフォーマットオプションを有効にするには:
1var options = new PdfToXlsOptions
2{
3 Format = PdfToXlsOptions.ExcelFormat.XLSX, // XLSX形式を指定
4 WorksheetName = "MySheet", // ワークシートに名前を付ける
5 InsertBlankColumnAtFirst = true // 最初に空の列を挿入
6};
7
8// 入力および出力ファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// 変換を処理
13converter.Process(options);
PDFからXLSへのバッチ処理
バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその一例です。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 複数の入力ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 出力ファイルパスを指定
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を実行
13converter.Process(options);
変換結果の処理
変換プロセスの後、Process
メソッドは操作の詳細を含むResultContainer
オブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです。
1var resultContainer = converter.Process(options);
2
3// 出力ファイルパスにアクセス
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());
サポートされている出力形式
PdfToXlsOptions.ExcelFormat
列挙型は、さまざまな出力形式を提供します。
- XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
- XLSM: マクロ対応のExcel形式。
- CSV: カンマ区切りの値。
- ODS: Open Document Spreadsheet。
- XMLSpreadSheet2003: Excel 2003 XML形式。
PDFからDOCコンバータ
Documentize PDFからDOCコンバータ for .NET は、PDFドキュメントをDOCまたはDOCX形式に変換するために設計された強力なツールです。このプラグインは、PDFページを編集可能なMicrosoft Wordドキュメントにシームレスに変換し、コンテンツを複数のプラットフォームで再利用、編集、共有しやすくします。
主な機能:
- DOC/DOCX変換:PDFドキュメントを編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
- 書式の保持:変換プロセス中に元のレイアウト、テキスト、および書式を保持します。
- バッチ処理:複数のPDFファイルを一度に変換します。
- カスタム変換オプション:Enhanced Flowのような異なるモードで変換プロセスを微調整し、より良いレイアウトを実現します。
PDFをDOC/DOCXに変換する方法
PDFドキュメントをDOC/DOCX形式に変換するには、次の手順に従います:
DocConverter
クラスのインスタンスを作成します。- 変換プロセスを構成するために
DocConversionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して結果のDOC/DOCXファイルの出力ファイルパスを追加します。Process
メソッドを実行して変換を実行します。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX, // 出力形式をDOCXに設定
5 ConversionMode = ConversionMode.EnhancedFlow // レイアウトと書式を最適化
6};
7
8// 入力PDFファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Wordドキュメントのパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 変換を処理
15docConverter.Process(options);
カスタムオプションを使用したPDFをDOCへの変換
PDFからDOCコンバータプラグインは、変換プロセスをカスタマイズするためのいくつかのオプションを提供します。変換中のPDFのレイアウトや構造の扱いを制御するために、異なるモードから選択できます。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.Doc, // 出力形式をDOCに設定
5 ConversionMode = ConversionMode.Precise // 元のPDFレイアウトをできるだけ忠実に保持
6};
7
8// 入力PDFファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Wordドキュメントのパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 変換を処理
15docConverter.Process(options);
PDFをDOC/DOCXにバッチ処理で変換する
PDFからDOCコンバータはバッチ処理をサポートしており、複数のPDFファイルを一度に変換することができます。以下はバッチ変換の例です:
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// 複数の入力PDFファイルを追加
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 結果のDOCXファイルの出力ファイルパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// バッチ変換を処理
16docConverter.Process(options);
PDFからJPEGへのコンバータ
Documentize PDFからJPEGへのコンバータ for .NETは、PDFドキュメントを高品質なJPEG画像に変換するための強力なツールです。このプラグインは、PDFページを広く使用されている画像形式に変換することで、コンテンツをプラットフォーム間でよりアクセスしやすくするように設計されています。
主な機能:
- PDFをJPEGに変換: 全PDFドキュメントまたは特定のページを簡単にJPEG画像に変換します。
- カスタム解像度: 高品質な出力のために解像度(例:300 dpi)を調整します。
- ページ範囲: 変換する特定のページや範囲を選択します。
- バッチ処理: 複数のPDFページまたは全ドキュメントを一度に変換します。
- 迅速な変換: 最小限の労力で迅速かつ効率的なプロセスです。
PDFページをJPEGに変換する方法
PDFドキュメントをJPEG画像に変換するには、以下の手順に従います:
Jpeg
クラスのインスタンスを作成します。- 変換プロセスを構成するために
JpegOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用してJPEG画像の出力ファイルパスを指定します。Process
メソッドを実行してPDFページをJPEG画像に変換します。
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 入力PDFファイルを追加
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// JPEG画像の出力ディレクトリを指定
9options.AddOutput(new FileDataSource(@"C:\Samples\images"));
10
11// PDFからJPEGへの変換を処理
12converter.Process(options);
PDFからJPEGへの変換のカスタマイズ
解像度を調整したり、ページ範囲を選択したり、画像品質を設定することで、変換プロセスをカスタマイズできます。ここでは、300 dpiでPDFの最初のページを変換する方法を示します:
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 出力解像度を300 dpiに設定し、最初のページのみを変換
6options.OutputResolution = 300;
7options.PageRange = new PageRange(1);
8
9// 入力パスと出力パスを追加
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
12
13// 変換を処理
14converter.Process(options);
PDFからJPEGへの変換のバッチ処理
PDFからJPEGへのコンバータプラグインは、バッチ処理をサポートしており、PDFから複数のページを個別のJPEGファイルに変換できます。
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 入力PDFファイルを追加
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 各ページの出力パスを設定
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));
11
12// バッチ変換を処理
13converter.Process(options);
変換結果の扱い方
Processメソッドは、変換結果に関する情報を保持するResultContainer
オブジェクトを返します。以下のように、変換されたJPEGファイルのパスを印刷できます:
1
2ResultContainer resultContainer = converter.Process(options);
3
4// JPEG画像の出力パスを印刷
5foreach (FileResult result in resultContainer.ResultCollection)
6{
7 Console.WriteLine(result.Data.ToString());
8}
PDFをPNGに変換するツール
Documentize PDFをPNGに変換するツール for .NET は、PDF文書を高品質のPNG画像に変換するための高度なツールです。このプラグインは、PDFページを広くサポートされている画像形式に変換することで、コンテンツをより多様性のある、アクセス可能で、共有しやすいものにするために設計されています。
主な特徴:
- PDFをPNGに変換: PDF文書全体や特定のページを迅速かつ効率的にPNG画像に変換します。
- カスタマイズ可能な解像度: 高品質の画像出力のために、希望するDPI(例:300 DPI)を設定します。
- バッチ処理: 複数のPDFページや文書全体を一度に変換します。
- 簡単な出力管理: 各変換されたPNGファイルの出力ディレクトリを指定します。
- 迅速な変換: 迅速で効率的で、設定に最小限の手間を要します。
PDFをPNGに変換する方法
PDF文書をPNG画像に変換するには、以下の手順に従います:
Png
クラスのインスタンスを作成します。- 変換プロセスを構成するために
PngOptions
のインスタンスを作成します。 AddInput
メソッドを使用して、入力PDFファイルを追加します。AddOutput
メソッドを使用して、PNG画像の出力ディレクトリを指定します。Process
メソッドを実行して、PDFページをPNG画像に変換します。
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 入力PDFファイルを追加
6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
7
8// PNG画像の出力ディレクトリを指定
9options.AddOutput(new FileDataSource(@"C:\Samples\images"));
10
11// PDFをPNG変換を処理
12converter.Process(options);
PDFをPNG変換のカスタマイズ
解像度を調整したり、特定のページを選択することで、変換をカスタマイズできます。たとえば、PDFの最初のページのみを300 DPIで変換するには:
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 出力解像度を300 DPIに設定
6options.OutputResolution = 300;
7
8// 最初のページのみを変換
9options.PageRange = new PageRange(1);
10
11// 入力と出力のパスを追加
12options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
14
15// 変換を処理
16converter.Process(options);
PDFをPNG変換のバッチ処理
PDFをPNGに変換するツールプラグインは、バッチ処理もサポートしており、複数のページや文書全体を個別のPNGファイルに変換できます。
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 入力PDFファイルを追加
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 各ページの出力パスを設定
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
11
12// バッチ変換を処理
13converter.Process(options);
変換結果の処理
変換を処理した後、Processメソッドは変換結果を含むResultContainer
オブジェクトを返します。PNG画像の出力パスを以下のようにプリントすることができます:
1
2ResultContainer resultContainer = converter.Process(options);
3
4// PNG画像の出力パスをプリント
5foreach (FileResult result in resultContainer.ResultCollection)
6{
7 Console.WriteLine(result.Data.ToString());
8}
PDF to TIFF コンバータ
Documentize PDF to TIFF コンバータ for .NET は、PDF ドキュメントを高品質の TIFF 画像に変換するために設計された強力なツールです。このプラグインは、さまざまなプラットフォームでコンテンツにアクセスできるようにし、優れた忠実性と柔軟性を維持します。
主な機能:
- PDF を TIFF に変換: PDF ドキュメント全体または特定のページを簡単に TIFF 画像に変換します。
- カスタム解像度: 優れた品質の出力のために解像度(例:300 dpi)を調整します。
- マルチページ TIFF: 複数の PDF ページを 1 つのマルチページ TIFF ファイルに結合します。
- ページ範囲: 特定のページまたは範囲を変換して正確な結果を得ます。
- バッチ処理: 複数の PDF ドキュメントまたはページを一度に変換します。
- 迅速な変換: 最小限の労力で迅速かつ効率的なプロセスを提供します。
PDF ページを TIFF に変換する方法
PDF ドキュメントを TIFF 画像に変換するには、次のステップに従ってください:
TiffConverter
クラスのインスタンスを作成します。- 変換プロセスを設定するために
PdfToTiffOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力 PDF ファイルを追加します。AddOutput
メソッドを使用して TIFF 画像の出力ファイルパスを指定します。Process
メソッドを実行して PDF ページを TIFF 画像に変換します。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 入力 PDF ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// TIFF 画像の出力ファイルを指定
8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
9
10// PDF から TIFF への変換を処理
11converter.Process(options);
PDF から TIFF への変換をカスタマイズする
解像度を調整したり、マルチページ出力を有効にしたり、ページ範囲を選択することで、変換プロセスをカスタマイズできます。ここでは、PDF の最初のページを 300 dpi で TIFF ファイルに変換する方法を示します:
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 出力解像度を 300 dpi に設定し、最初のページのみを変換
5options.OutputResolution = 300;
6options.PageList = new List<int> { 1 };
7
8// 入力と出力のパスを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 変換を処理
13converter.Process(options);
マルチページ TIFF 作成
PDF to TIFF コンバータ プラグインは、マルチページ TIFF の生成をサポートしており、複数の PDF ページを 1 つの TIFF ファイルに結合して効率的なアーカイブや印刷が可能です。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions
3{
4 MultiPage = true // マルチページ TIFF 出力を有効にする
5};
6
7// 入力 PDF ファイルを追加
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// マルチページ TIFF の出力ファイルを指定
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 変換を処理
14converter.Process(options);
PDF から TIFF への変換のバッチ処理
PDF to TIFF コンバータ プラグインは、バッチ処理もサポートしており、複数の PDF ページまたはドキュメント全体を同時に個別の TIFF ファイルに変換できます。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 入力 PDF ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 個々のページの出力パスを設定
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// バッチ変換を処理
12converter.Process(options);
変換結果の処理方法
Process メソッドは、変換結果の詳細を提供する ResultContainer
オブジェクトを返します。変換された TIFF ファイルのパスを次のように出力できます:
1ResultContainer resultContainer = converter.Process(options);
2
3// TIFF 画像の出力パスを表示
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
HTML コンバータ
Documentize HTML Converter for .NET は、PDF と HTML フォーマット間で文書を変換する強力な機能を提供し、ウェブアプリケーション、アーカイブ、およびレポート生成に最適です。リソースとレイアウトを処理するための複数のオプションを備えており、コンバータはさまざまなプロジェクト要件に適応します。
主な機能
PDF から HTML への変換
PDF ファイルを HTML に変換して、ウェブベースの表示や HTML フォーマットが好まれるアプリケーションへの統合を容易にします。
HTML から PDF への変換
HTML コンテンツを高品質な PDF に変換し、印刷可能なレポートの生成、ウェブコンテンツのアーカイブ、または共有可能な文書フォーマットの作成に最適です。
詳細ガイド
PDF を HTML に変換する
PDF を HTML に変換するには:
- コンバータを初期化する:
HtmlConverter
のインスタンスを作成します。 - 変換オプションを設定する:
PdfToHtmlOptions
を使用して出力をカスタマイズし、埋め込みリソースまたは外部リソースのいずれかを選択します。 - 入力および出力パスを定義する: 入力 PDF と出力 HTML のパスを設定します。
- 変換を実行する:
Process
メソッドを呼び出してファイルを変換します。
例: 埋め込みリソースを持つ PDF を HTML に変換
// ステップ 1: HTML コンバータを初期化する
var converter = new HtmlConverter();
// ステップ 2: PDF から HTML への変換オプションを設定する
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// ステップ 3: ファイルパスを設定する
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));
// ステップ 4: 変換を実行する
converter.Process(options);
PDF から HTML への変換のための利用可能なオプション
SaveDataType:
FileWithEmbeddedResources
: すべてのリソースが埋め込まれた単一の HTML ファイルを生成します。FileWithExternalResources
: リソースを別々に保存し、大きな HTML ファイルに最適です。
出力カスタマイズ:
BasePath
: HTML ドキュメント内のリソースのベースパスを設定します。IsRenderToSinglePage
: PDF のすべてのコンテンツを単一の HTML ページに描画することをオプションで可能にします。
HTML を PDF に変換する
HTML ドキュメントを PDF に変換するには、次の手順に従います:
- コンバータを初期化する:
HtmlConverter
のインスタンスを作成します。 - PDF オプションを設定する:
HtmlToPdfOptions
を使用してレイアウトとメディア設定を定義します。 - パスを指定する: 入力 HTML および出力 PDF のファイルパスを設定します。
- 変換を実行する:
Process
メソッドを実行して変換を完了します。
例: HTML を PDF に変換
// ステップ 1: HTML コンバータを初期化する
var converter = new HtmlConverter();
// ステップ 2: HTML から PDF への変換オプションを設定する
var options = new HtmlToPdfOptions();
// ステップ 3: ファイルパスを設定する
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));
// ステップ 4: 変換を実行する
converter.Process(options);
HTML から PDF への変換のための追加オプション
メディアタイプ:
HtmlMediaType.Print
: 印刷に適した PDF を生成するために最適です。HtmlMediaType.Screen
: デジタルビュー用に設計されたコンテンツを変換する際に使用します。
レイアウト調整:
PageLayoutOption
: HTML コンテンツが PDF レイアウトにどのように適合するかを調整します。ScaleToPageWidth
などで、コンテンツを PDF 幅に合わせることができます。IsRenderToSinglePage
: 必要に応じて、すべての HTML コンテンツを単一の PDF ページに描画できるようにします。
このコンバータは、ウェブコンテンツに基づいて PDF レポートを生成することから、ウェブベースのアクセシビリティのために PDF ドキュメントのアーカイブを変換することまで、さまざまなアプリケーションに対応しています。より高度な設定については、完全な Documentize ドキュメントを参照してください。
FAQs
This FAQ provides comprehensive information regarding the features and functionalities of Documentize .NET Plugins, covering aspects like PDF conversion, form handling, and table of contents (TOC) generation.
General Questions
1. What is Documentize for .NET?
Documentize for .NET is a powerful library for managing and processing PDF documents programmatically. It includes plugins for converting PDFs into various formats, editing PDF forms, adding digital signatures, generating TOCs, and ensuring PDF/A compliance for long-term archival.
2. How do I install Documentize plugins for .NET?
You can install the Documentize plugins by downloading assembly files from the official website or fetching packages directly from NuGet. Detailed installation instructions are available within each plugin’s documentation.
PDF Conversion Plugins
3. How can I convert a PDF document to a Word (DOC/DOCX) file?
To convert a PDF document into Word format using the PDF to DOC Converter:
- Instantiate the
PdfDoc
class. - Create a
PdfToDocOptions
object to configure conversion options. - Add input PDF and output DOC/DOCX file paths.
- Call the
Process
method to execute the conversion.
4. How do I convert PDF pages into JPEG images?
Using the PDF to JPEG Converter:
- Create an instance of the
Jpeg
class. - Set conversion options (e.g., resolution, page range) via
JpegOptions
. - Add input/output file paths.
- Call the
Jpeg.Process
method to run the conversion.
5. How do I convert a PDF to PNG?
To convert a PDF into PNG format:
- Create an instance of the
Png
class and a PngOptions
object. - Add the input PDF and specify the output folder.
- Set options such as resolution (e.g., 300 DPI).
- Call the
Process
method to generate PNG images.
6. How do I convert a PDF to Excel (XLS/XLSX)?
For converting PDF to Excel:
- Instantiate the
PdfXls
class. - Use
PdfToXlsOptions
to configure input/output paths and conversion options. - Call the
Process
method to start the conversion.
7. How do I convert a PDF to HTML?
To convert PDF documents into HTML:
- Create an instance of the
PdfHtml
class. - Configure conversion options with
PdfToHtmlOptions
or HtmlToPdfOptions
. - Add input/output paths and call the
Process
method.
The PDF Form Editor provides capabilities to:
- Add fields (
FormEditorAddOptions
). - Update fields (
FormEditorSetOptions
). - Remove fields (
FormRemoveSelectedFieldsOptions
).
After configuring the form fields, run the Process
method.
To flatten form fields:
- Instantiate the
FormFlattener
class. - Use
FormFlattenAllFieldsOptions
to flatten all fields or FormFlattenSelectedFieldsOptions
to target specific fields. - Add input/output files and call the
Process
method.
To export form data, use the PDF Form Exporter. Create a FormExporterValuesToCsvOptions
object, specify form field conditions, and run the Process
method to export the data into CSV format.
PDF/A and TOC Management
For converting PDFs into PDF/A:
- Use the
PdfAConverter
class. - Configure the PDF/A version (e.g., PDF/A-3B) in
PdfAConvertOptions
. - Add input/output paths and call the
Process
method.
12. How do I generate a Table of Contents (TOC) in a PDF?
To create a TOC:
- Create an instance of the
TocGenerator
class. - Use
TocOptions
to define TOC parameters. - Add input/output files and run the
Process
method.
Signature Handling
13. How can I digitally sign a PDF document?
To add a digital signature:
- Instantiate the
Signature
class. - Use
SignOptions
to configure the PFX file, password, and signature details (e.g., reason, contact info). - Add input/output files and run the
Process
method.
Additional Features
14. Can I split PDF files using Documentize?
Yes, using the PDF Splitter:
- Instantiate the
Splitter
class. - Configure split options using
SplitOptions
. - Add input/output paths and call the
Process
method.
15. How do I merge multiple PDF files into one?
To merge PDFs:
- Instantiate the
Merger
class. - Add input PDFs and specify an output file via
MergeOptions
. - Run the
Process
method to merge the files.
16. Is Documentize limited to working with PDFs only?
While Documentize primarily focuses on PDF manipulation, it also supports conversions to and from formats such as DOC, XLS, HTML, JPEG, and PNG.
Licensing and Compatibility
17. What are the system requirements for using Documentize plugins?
Documentize supports:
- Operating Systems: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), and Linux.
- Frameworks: .NET Framework 4.0 to 8.0.
- IDE: Compatible with various versions of Visual Studio.
18. How do I set license keys for Documentize?
To activate a plugin, reference Documentize in your project and set the license keys before calling any methods. Refer to the specific plugin’s documentation for detailed instructions.
19. Where can I find more examples and documentation for Documentize plugins?
Complete API documentation and examples can be found on the Documentize website or through the NuGet packages within your development environment.