Developer's Guideのサブセクション
HTML Converter
Documentize HTML Converter for .NETは、PDFとHTMLフォーマットの間で文書を変換するための強力な機能を提供し、ウェブアプリケーション、アーカイブ、およびレポート生成に最適です。リソースやレイアウトの処理について多くのオプションがあり、コンバーターはさまざまなプロジェクト要件に適応します。
PDFからHTMLへの変換
PDFファイルをHTMLに変換し、ウェブベースの表示やHTMLフォーマットが好ましいアプリケーションへの統合を可能にします。
HTMLからPDFへの変換
HTMLコンテンツを高品質なPDFに変換し、印刷可能なレポートの生成、ウェブコンテンツのアーカイブ、共有可能な文書フォーマットの作成に最適です。
PDFからHTMLへの変換
PDFをHTMLに変換するには:
- オプションの設定:
PdfToHtmlOptions
を使用して出力をカスタマイズし、埋め込みリソースまたは外部リソースのいずれかを選択します。 - 入力と出力のパスを定義: 入力PDFと出力HTMLのパスを設定します。
- 変換を実行:
HtmlConverter
のProcess
メソッドを呼び出してファイルを変換します。
例: 埋め込みリソースを使用してPDFをHTMLに変換
1// ステップ1: PDFからHTMLへの変換のためのオプションの設定
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// ステップ2: ファイルパスの設定
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// ステップ3: 変換を実行
9HtmlConverter.Process(options);
PDFからHTMLへの変換に使用できるオプション
- SaveDataType:
FileWithEmbeddedResources
: すべてのリソースが埋め込まれた単一のHTMLファイルを生成します。FileWithExternalResources
: リソースを別々に保存し、大きなHTMLファイルに最適です。
HTMLからPDFへの変換
HTML文書をPDFに変換するには、以下の手順に従います:
- オプションの設定:
HtmlToPdfOptions
を使用してレイアウトとメディア設定を定義します。 - パスの指定: 入力HTMLと出力PDFのファイルパスを設定します。
- 変換を実行:
HtmlConverter
のProcess
メソッドを実行してファイルを変換します。
例: HTMLをPDFに変換
1// ステップ1: HTMLからPDFへの変換のためのオプションの設定
2var options = new HtmlToPdfOptions();
3
4// ステップ2: ファイルパスの設定
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// ステップ3: 変換を実行
9HtmlConverter.Process(options);
HTMLからPDFへの変換に関する追加オプション
メディアタイプ:
HtmlMediaType.Print
: 印刷に適したPDFを生成するために最適です。HtmlMediaType.Screen
: デジタル表示用に設計されたコンテンツを変換する際に使用します。
レイアウト調整:
PageLayoutOption
: HTMLコンテンツがPDFレイアウトにどのようにフィットするかを調整します。例えば、ScaleToPageWidth
を使用してコンテンツをPDFの幅にスケールさせることができます。IsRenderToSinglePage
: 簡潔なプレゼンテーションのために必要に応じてHTMLコンテンツ全体を単一のPDFページにレンダリングできるようにします。
このコンバーターは、ウェブコンテンツに基づいたPDFレポートの生成や、ウェブベースのアクセスのためのPDF文書のアーカイブ変換など、さまざまなアプリケーションに対応しています。より高度な設定については、Documentizeの完全なドキュメントを参照してください。
PDFセキュリティ
Documentize PDF Security for .NET は、PDFドキュメントのセキュリティを強化するために設計された強力なツールで、暗号化および復号化の機能を提供します。これにより、機密情報が秘密に保たれ、不正アクセスから保護されます。
PDFを暗号化する方法
PDFドキュメントを暗号化するには、以下の手順に従ってください:
- 必要なユーザーと所有者のパスワードを持つ
EncryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使って入力PDFファイルを追加します。AddOutput
メソッドを使用して出力PDFファイルを追加します。Security
クラスの Process
メソッドを使用して暗号化を実行します。
1// 手順を設定するためのEncryptionOptionsオブジェクトを作成
2var options = new EncryptionOptions("123456", "qwerty");
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// プロセスを実行
8Security.Process(options);
PDFを復号化する方法
PDFドキュメントを復号化するには、以下の手順に従ってください:
- 必要なパスワードを持つ
DecryptionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力PDFファイルを追加します。Security
クラスの Process
メソッドを使用して復号化を実行します。
1// 手順を設定するためのDecryptionOptionsオブジェクトを作成
2var options = new DecryptionOptions("123456");
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// プロセスを実行
8Security.Process(options);
主な特徴:
- PDFドキュメントの暗号化: ユーザーおよび所有者のパスワードを追加してPDFファイルを安全に保護します。
- PDFドキュメントの復号化: 必要に応じてPDFから暗号化を解除します。
- 自動化: 自動化されたワークフローのために、暗号化および復号化を.NETアプリケーションに統合します。
- コンプライアンス: ドキュメントが産業標準のドキュメントセキュリティに準拠していることを確認します。
PDF Optimizer
Documentize PDF Optimizerは、高度な最適化技術を通じてPDFドキュメントを強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントのサイズを変更するのに役立つように設計されています。これらの操作により、PDFファイルの品質と管理が向上し、保存、共有、閲覧が容易になります。
PDFの最適化
次の手順では、品質を維持しながらPDFドキュメントのファイルサイズを削減する方法を示します。
- 最適化設定を構成するためにOptimizeOptionsオブジェクトを作成します。
- 入力PDFファイルと最適化ファイルの出力場所を設定します。
Optimizer
のProcess
メソッドを実行して最適化を行います。
1// 最適化指示を設定するためにOptimizeOptionsオブジェクトを作成
2var options = new OptimizeOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// プロセスを実行
8Optimizer.Process(options);
PDFの回転
RotateOptionsクラスを使用して、PDFファイル内のページの向きを調整します。
- RotateOptionsオブジェクトを作成し、回転角度を設定します。
- 入力PDFファイルを追加し、出力ファイルの場所を指定します。
- SetRotationメソッドを使用して回転角度(例:90度)を設定します。
Optimizer
のProcess
メソッドを実行します。
1// 回転指示を設定するためにRotateOptionsオブジェクトを作成
2var options = new RotateOptions();
3// 新しい回転を設定
4options.Rotation = Rotation.On90;
5// 入力ファイルパスを追加
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// 出力ファイルパスを設定
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// プロセスを実行
10Optimizer.Process(options);
PDFのサイズ変更
PDFドキュメントをサイズ変更するには、ResizeOptionsクラスを使用してドキュメントの新しいページサイズを指定します。
- ページサイズを定義するためにResizeOptionsオブジェクトを作成します。
- 入力ファイルを追加し、希望する出力場所を設定します。
- SetPageSizeメソッドを使用して新しいサイズ(例:A4)を指定します。
Optimizer
のProcess
メソッドを実行します。
1// サイズ変更指示を設定するためにResizeOptionsオブジェクトを作成
2var options = new ResizeOptions();
3// 新しいページサイズを設定
4options.PageSize = PageSize.A3;
5// 入力ファイルパスを追加
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// 出力ファイルパスを設定
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// プロセスを実行
10Optimizer.Process(options);
PDFの圧縮
未使用のページリソースを排除し、同一の資産を結合し、冗長なオブジェクトを破棄することでPDFドキュメントを圧縮します。
- 最適化設定を構成するためにCompressOptionsオブジェクトを作成します。
- 入力ファイルを追加し、出力ファイルの場所を指定します。
- SetCropBoxメソッドを使用してトリミング領域を定義します。
Optimizer
のProcess
メソッドを実行します。
1// 圧縮指示を設定するためにCompressOptionsオブジェクトを作成
2var options = new CompressOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// プロセスを実行
8Optimizer.Process(options);
主な機能:
- 最適化: 品質を損なうことなくPDFファイルサイズを削減します。
- 回転: PDFページの向きを調整します。
- サイズ変更: ページを特定の寸法(例:A4、レター)にリサイズします。
- 圧縮: ドキュメントから未使用のページリソースとオブジェクトを削除します。
PDF Merger
Documentize PDF Merger for .NETは、複数のPDFドキュメントを1つのファイルにマージするために設計された多目的ツールです。PDFファイルの統合を簡素化し、ドキュメントが効率的にマージされ、コンテンツ全体の一貫性が保たれるようにします。このプラグインは、マージされたドキュメントを最適化するためにフォントや画像などの内部リソースを処理します。
PDFをマージする方法
複数のPDFドキュメントを1つのファイルにマージするには、次の手順に従ってください:
- マージ処理を構成するために
MergeOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力PDFファイルを追加します。Merger
クラスのProcess
メソッドを使用してマージを実行します。
1
2// マージの指示を設定するためにMergeOptionsオブジェクトを作成
3var options = new MergeOptions();
4// 入力ファイルパスを追加
5options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
6options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
7// 出力ファイルパスを設定
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// プロセスを実行
10Merger.Process(options);
特定のページ範囲でPDFをマージする方法
MergeOptions
クラスを使用して、入力PDFファイルから特定のページ範囲をマージすることもできます。これにより、選択したページを最終出力ドキュメントに結合することができます。
Merger
クラスのインスタンスを作成します。MergeOptions
を使用してページ範囲を構成します。- 指定されたページ範囲で入力ファイルを追加します。
- 出力パスを設定します。
Process
メソッドを呼び出します。
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// 入力PDFから特定のページをマージ
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
8
9// 出力ファイルパスを指定
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
11
12// PDFをマージ
13merger.Process(mergeOptions);
バッチマージの処理方法
PDF Mergerプラグインは、大規模なPDFドキュメントのバッチ処理に最適化されています。バッチ処理機能を活用することで、単一の操作で数百のPDFをマージし、効率的で迅速なドキュメント管理を実現できます。
Merger
クラスのインスタンスを作成します。- すべての入力PDFファイルを
MergeOptions
クラスに追加します。 - 出力パスを指定します。
Process
メソッドを呼び出してバッチ内のすべてのファイルをマージします。
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// マージのために大規模なPDFバッチを追加
6for (int i = 1; i <= 100; i++)
7{
8 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
9}
10
11// 出力ファイルパスを指定
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
13
14// バッチマージを処理
15merger.Process(mergeOptions);
主な機能:
- 複数のPDFをマージ:複数のPDFファイルを1つに簡単に結合します。
- リソース最適化:マージ時に重複したフォントや画像を削除します。
- バッチ処理:大規模なPDFドキュメントを一度にマージします。
PDF Table Generator
Documentize Table Generator for .NETは、PDF文書にテーブルを統合するプロセスを簡素化するために設計された多目的プラグインです。データの整理、フォームの設計、文書の可読性の向上に関係なく、このプラグインは精度と効率を保ちながらプロセスを簡素化します。直感的なAPIは、単一文書またはバッチ処理ワークフローの両方をサポートしており、構造化データを扱う開発者にとって不可欠なツールとなっています。
テーブルを含むPDFの作成
TableGenerator
クラスを使用して、PDF内に構造化されたテーブルを作成するには、次の手順に従ってください。
TableGenerator
クラスのインスタンスを作成します。TableOptions
オブジェクトを設定して、テーブルの構造、内容、および入出力ファイルを定義します。- PDFにテーブル、行、およびセルを追加します。
Process
メソッドを使用してテーブル生成プロセスを完了します。
以下はその例です:
1var generator = new TableGenerator();
2var options = new TableOptions();
3
4// 入力および出力PDFファイルを指定
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 行とセルを持つテーブルを定義
9options
10 .InsertPageAfter(1) // 最初のページの後にテーブルを追加
11 .AddTable()
12 .AddRow()
13 .AddCell().AddParagraph(new TextFragment("セル 1"))
14 .AddCell().AddParagraph(new TextFragment("セル 2"))
15 .AddCell().AddParagraph(new TextFragment("セル 3"));
16
17// 文書内にテーブルを生成
18generator.Process(options);
テーブルへのリッチコンテンツの追加
PDF文書内のテーブルには、機能性と外観を向上させるためのさまざまなコンテンツタイプを含めることができます。以下は、テーブルセルにHTMLコンテンツを追加する例です:
1options
2 .AddTable()
3 .AddRow()
4 .AddCell().AddParagraph(new HtmlFragment("<h1>ヘッダー 1</h1>"))
5 .AddCell().AddParagraph(new HtmlFragment("<h2>ヘッダー 2</h2>"))
6 .AddCell().AddParagraph(new HtmlFragment("<h3>ヘッダー 3</h3>"));
テーブルでサポートされているコンテンツタイプ
PDF Table Generatorは、さまざまなコンテンツタイプをサポートしており、開発者が多くのユースケースに対してテーブルをカスタマイズできるようにしています:
- HtmlFragment: ヘッダー、リスト、書式設定されたテキストなどのHTMLベースのコンテンツを追加します。
- TeXFragment: 数学の方程式や科学的表記のためにLaTeXベースのコンテンツを含めます。
- TextFragment: プレーンまたは書式設定されたテキストを挿入します。
- Image: 画像を直接テーブルセルに埋め込みます。
テーブルのレイアウトと構造のカスタマイズ
このプラグインは、行の高さ、列の幅、およびセルの整列を含むテーブル構造の調整の柔軟性を提供します。これらのカスタマイズオプションにより、文書のレイアウトやスタイルに合わせたテーブルを設計できます。
テーブル生成の処理
すべてのコンテンツを追加し、テーブル構造をカスタマイズした後は、Process
メソッドを呼び出してプロセスを完了します。このメソッドはテーブルを生成し、PDF文書を更新します。結果の取り扱い方法は次のとおりです:
1var resultContainer = generator.Process(options);
2
3// 生成された結果の数を出力
4Console.WriteLine("生成された結果の数: " + resultContainer.ResultCollection.Count);
PDF Table Generatorのユースケース
- データレポーティング: 分析、財務報告、または調査結果を明確で整理された形式で提示します。
- フォームデザイン: 構造化されたテーブルレイアウトを使用してインタラクティブなフォームを作成します。
- 文書の強化: ユーザーマニュアル、ガイド、または指導資料の可読性と使いやすさを向上させます。
- バッチ処理: 複数のPDF文書のテーブル生成を自動化します。
主な機能:
- 動的テーブル作成: PDF文書内に構造化されたテーブルを簡単に生成します。
- リッチコンテンツサポート: テキスト、HTML、画像、LaTeXコンテンツを使用してテーブルを埋めます。
- ページ配置: PDF内の特定の場所にテーブルを正確に挿入します。
- カスタマイズ可能なレイアウト: テーブル構造、セルの整列、スタイルを調整します。
- バッチ処理: 最大の効率を確保するために複数の文書を同時に処理します。
PDF TOC Generator
Documentize PDF TOC Generator for .NETは、PDF文書の組織化とナビゲーションを強化する強力なプラグインで、動的に目次(TOC)を生成します。このプラグインは、PDFにTOCを追加するプロセスを簡素化し、文書のナビゲートと管理を容易にします。
PDFの目次を生成する方法
PDFファイルに目次を作成するには、次の手順に従ってください:
TocGenerator
クラスのインスタンスを作成します。TocOptions
のインスタンスを作成し、TOC生成設定を構成します。AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用してTOC付きの出力PDFファイルを指定します。Process
メソッドを呼び出してTOCを生成します。
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// 入力と出力ファイルを追加
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
7
8// TOCを生成
9tocGenerator.Process(tocOptions);
TOCのカスタマイズ
TocOptions
クラスを修正することで目次をカスタマイズできます。たとえば、TOCエントリの深さレベルを制御したり、特定の書式設定オプションを設定したりできます:
1var tocOptions = new TocOptions
2{
3 Depth = 3, // TOCの深さレベルを3に設定
4 FontSize = 12, // TOCエントリのフォントサイズを設定
5 Title = "目次" // TOCタイトルをカスタマイズ
6};
7
8// 入力と出力ファイルを追加
9tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
11
12// カスタマイズされたオプションでTOCを生成
13tocGenerator.Process(tocOptions);
結果の処理方法
処理後、Process
メソッドはTOC生成に関する詳細を保持するResultContainer
オブジェクトを返します。出力詳細を取得して印刷できます:
1var resultContainer = tocGenerator.Process(tocOptions);
2
3// 結果コレクションにアクセスして出力ファイルパスを印刷
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
複数PDFのバッチ処理
PDF TOC Generatorプラグインはバッチ処理をサポートしており、複数のPDF文書に同時にTOCを追加できます。
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// 複数の入力PDFを追加
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6tocOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// TOC付きの出力PDFを追加
9tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output1_with_toc.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output2_with_toc.pdf"));
11
12// バッチTOC生成を処理
13tocGenerator.Process(tocOptions);
主な機能:
- 動的TOC生成:見出しやブックマークに基づいて自動的に生成されたエントリを持つ任意のPDFファイル用のTOCを作成します。
- バッチ処理:複数のPDF文書に一度にTOCを生成します。
- カスタマイズ:TOCの外観や構造を制御でき、スタイル、書式設定、深さのレベルを含みます。
- 効率的なワークフロー:特に大規模または複雑な文書に対して手動でTOCを作成する時間を最小限に抑えます。
PDF署名
Documentize PDF Signature for .NET プラグインは、ユーザーがPDF文書にデジタル署名を行うことを可能にします。署名を追加するための効率的なプロセスを提供し、真正性を確保し、PDFコンテンツを保護します。このプラグインは、目に見える署名と目に見えない署名の両方をサポートし、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。
PDF文書に署名する方法
PFXファイルを使用してPDF文書に署名するには、以下の手順に従います。
Signature
クラスのインスタンスを作成します。- PFXファイルのパスとパスワードを指定して
SignOptions
クラスをインスタンス化します。 - 入力PDFと出力ファイルをオプションに追加します。
Process
メソッドを実行して署名を適用します。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 入力PDFを追加し、出力ファイルを指定します
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// 署名オプションを設定します
9signOptions.Reason = "契約合意書";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "ニューヨーク";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 文書に署名を適用します
17signature.Process(signOptions);
ストリームでPFXファイルを使用する方法
ファイルパスの代わりにストリームとして提供されたPFX証明書を使用してPDFに署名することもできます。これにより、証明書の保存をより柔軟に扱うことができます。
Signature
クラスのインスタンスを作成します。- PFXを含むストリームとパスワードを指定して
SignOptions
をインスタンス化します。 - 入力と出力ファイルを追加します。
Process
メソッドを実行して署名を適用します。
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// 入力と出力ファイルを追加します
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 署名を適用します
10signature.Process(signOptions);
目に見えない署名を適用する方法
目に見えない署名(文書に署名を表示せずに文書を保護する署名)を追加するには、単に Visible
プロパティを false
に設定します。
SignOptions
のインスタンスを作成します。Visible
を false
に設定します。- 入力と出力ファイルを追加します。
Process
を呼び出して目に見えない署名を適用します。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 目に見えない署名を設定します
5signOptions.Visible = false;
6
7// 入力と出力ファイルを追加します
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 署名を処理します
12signature.Process(signOptions);
主な機能:
- PDF文書にデジタル署名: 目に見えるまたは目に見えないデジタル署名で文書を保護します。
- PFXサポート: PFX証明書を使用してPDFファイルに署名します。
- カスタマイズ可能なオプション: 理由、位置、連絡先の詳細など、署名設定を構成します。
- 目に見えるおよび目に見えない署名: 署名が文書に表示されるかどうかを選択できます。
PDF Splitter
Documentize PDF Splitter for .NET は、大きなPDF文書をより小さく、管理しやすいファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合や、文書を特定のセクションに分割する場合でも、このプラグインを使用することで、効率的に最小限の労力で達成できます。
PDFを分割する方法
PDF文書を個々のページに分割するには、以下の手順に従ってください:
- 分割オプションを構成するために
SplitOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して各分割ページの出力ファイルを追加します。Splitter
クラスのProcess
メソッドを実行して文書を分割します。
1var splitOptions = new SplitOptions();
2
3// 入力PDFファイルを追加
4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
5
6// 各ページの出力ファイルを指定
7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// 分割操作を処理
12Splitter.Process(splitOptions);
主な機能:
- ページによるPDFの分割: PDF文書を個々のページに分割します。
- バッチ処理: 大量のPDFを一度に分割。
- カスタム分割オプション: 要件に基づいた分割プロセスを構成します。
- 整理された出力: 各分割ページやセクションの出力ファイルを簡単に管理できます。
PDF ChatGPT
Documentize ChatGPT for .NET プラグインは、ChatGPT APIをPDFアプリケーションに統合するために設計された強力なツールです。このプラグインを使用すると、開発者は入力メッセージに基づいてチャット応答を生成し、出力をPDF形式で保存できます。これにより、PDF文書内で会話インターフェースや分析レポートを直接作成するのに適しています。
チャット応答の生成
ChatGPTプラグインを使用してチャット応答を生成し、PDFファイルに保存するには、以下の手順に従います。
PdfChatGptRequestOptions
クラスのインスタンスを作成してリクエストオプションを構成します。- 入力および出力のPDFファイルを追加します。
- APIキーを設定し、最大トークン数やChatGPTモデルへのクエリなどのパラメータを指定します。
ProcessAsync
メソッドを実行してチャットの完了を生成します。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // APIキーを設定
3options.MaxTokens = 1000; // 最大トークン数を設定
4options.Query = "このテキストの主要なテーマを分析します。";
5
6// 入力PDFファイルを追加
7options.AddInput(new FileDataSource("input.pdf"));
8
9// チャット応答の出力PDFを保存する場所を指定
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// PdfChatGptプラグインのインスタンスを作成
13var plugin = new PdfChatGpt();
14
15// 非同期でプロセスを実行
16var result = await plugin.ProcessAsync(options);
主な機能:
- チャット完了: カスタム入力に基づいてChatGPT APIを使用して応答を生成します。
- システムおよびユーザーのメッセージ: システムコンテキストとユーザー入力の両方を提供して、ダイナミックな会話を作成します。
- PDF出力: 生成されたチャット完了を構造化されたPDFファイルに保存して、さらに使用できます。
- 非同期処理: チャット完了を非同期に処理することで、応答性の高いアプリケーションを実現します。
システムおよびユーザーメッセージの追加
よりインタラクティブな会話を作成するために、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは、会話のコンテキストを形成するのに役立ちます。
- ChatGPTのコンテキストを設定するシステムメッセージを追加します。
- 会話のためにユーザーの入力を表すユーザーメッセージを追加します。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // APIキーを設定
3
4// コンテキスト用のシステムメッセージを追加
5options.AddSystemMessage("あなたはテキストを要約するように訓練されたAIです。");
6
7// ChatGPTモデルにクエリを送信するためのユーザーメッセージを追加
8options.AddUserMessage("添付の文書を要約してください。");
9
10// 入力および出力のPDFを追加
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// リクエストを非同期に処理
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);
Documentize PDF Image Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。このプラグインは PDF ファイルをスキャンし、埋め込まれた画像を特定して抽出し、元の品質と形式を維持します。このツールは、視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。
PDF から画像を抽出する方法
PDF ファイルから画像を抽出するには、次の手順に従います。
ImageExtractor
クラスのインスタンスを作成します。ImageExtractorOptions
クラスのインスタンスを作成します。- オプションに入力ファイルパスを追加します。
- プラグインを使用して画像抽出を処理します。
- 結果コンテナから抽出された画像を取得します。
1using var plugin = new ImageExtractor();
2
3// ImageExtractorOptions クラスのインスタンスを作成
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// 入力ファイルパスを追加
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// 画像抽出を処理
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// 抽出した画像を取得してファイルに保存
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
複数の PDF ファイルから画像を抽出する
ImageExtractor プラグインはバッチ処理をサポートしており、複数の PDF から同時に画像を抽出できます。この機能は、一連の PDF ファイルがあり、すべての画像を一度に取得する必要がある場合に特に便利です。
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// 複数の入力 PDF ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 画像抽出を処理
10var resultContainer = plugin.Process(options);
11
12// すべてのファイルから抽出された画像を保存
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
主な機能:
- 埋め込まれた画像の抽出: PDF ドキュメントから画像を特定して抽出します。
- 画像の品質を保持: 抽出された画像が元の品質を維持することを保証します。
- バッチ処理: 単一の操作で複数の PDF ドキュメントから画像を抽出します。
- 柔軟な出力: 抽出された画像を好みの形式または場所に保存します。
Documentize PDF Text Extractor for .NETは、PDF文書からテキストを抽出する作業を簡素化します。純粋なテキスト、未加工のテキスト、またはプレーンテキストが必要な場合でも、このプラグインを使用すると、フォーマットを保持したり、必要に応じて省略したりしながら、効率的にテキストを抽出できます。
PDFからテキストを抽出する方法
PDF文書からテキストを抽出するには、次の手順に従います。
TextExtractor
クラスのインスタンスを作成します。TextExtractorOptions
のインスタンスを作成して抽出オプションを構成します。AddInput
メソッドを使用して入力PDFファイルを追加します。Process
メソッドを実行してテキストを抽出します。ResultContainer.ResultCollection
を使用して抽出されたテキストにアクセスします。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 入力PDFを追加
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// テキスト抽出を処理
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを出力
12var extractedText = resultContainer.ResultCollection[0];
13Console.WriteLine(extractedText);
複数のPDFからテキストを抽出する
このプラグインでは、複数のPDFから同時にテキストを抽出でき、迅速かつ効率的な処理が可能です。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 複数の入力PDFを追加
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
8
9// 抽出を処理
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 抽出されたテキストを出力
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
テキスト抽出モード
TextExtractorプラグインは、ニーズに応じた柔軟性を提供する3つの抽出モードを提供します。
- ピュアモード: 元のフォーマット(スペースや配置を含む)を保持します。
- 生モード: フォーマットなしでテキストを抽出し、生データ処理に便利です。
- プレーンモード: 特殊文字や追加のフォーマットなしでテキストを抽出します。
1
2var textExtractorOptions = new TextExtractorOptions();
3
4// ピュアモードに設定
5textExtractorOptions.Mode = ExtractionMode.Pure;
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 処理と出力
9var resultContainer = extractor.Process(textExtractorOptions);
10Console.WriteLine(resultContainer.ResultCollection[0]);
バッチ処理の扱い方
大規模な文書セットの場合、バッチ処理を活用して、複数のPDFから同時にテキストを抽出できます。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 複数の入力PDFを追加
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
8
9// 各ファイルの出力を定義
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 抽出されたテキストを処理
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
主な機能:
- ピュアモード: 元のフォーマットを保持しながらテキストを抽出します。
- 生モード: フォーマットなしでテキストを抽出します。
- プレーンモード: 特殊文字やフォーマットなしでテキストを抽出します。
- バッチ処理: 複数のPDFから同時にテキストを抽出します。
PDF Timestamp Adder
Documentize PDF Timestamp Adder for .NETは、PDF文書に安全なタイムスタンプを追加するために設計された強力なツールです。信頼できる時間の参照を提供することにより、文書の整合性と信頼性を向上させ、デジタル署名基準への準拠を確保します。
PDFにタイムスタンプを追加する方法
PDF文書に安全なタイムスタンプを追加するには、次の手順に従います:
Timestamp
クラスのインスタンスを作成します。- タイムスタンププロセスを構成するために
AddTimestampOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
を使用して出力ファイルパスを設定します。Process
メソッドを使用してタイムスタンプ処理を実行します。
1// タイムスタンププラグインのインスタンスを生成する
2var plugin = new Timestamp();
3
4// タイムスタンプオプションを構成する
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
6
7// 入力PDFファイルを追加する
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 出力PDFファイルを指定する
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行する
14plugin.Process(opt);
タイムスタンプサーバーでのカスタム認証の使用方法
タイムスタンプサーバーに接続するときに基本認証資格情報を提供できます。これにより、ユーザー名とパスワードを必要とするサーバーで認証できます。
Timestamp
クラスのインスタンスを作成します。serverBasicAuthCredentials
を含むAddTimestampOptions
のインスタンスを作成します。- 入力ファイルと出力ファイルのパスを追加します。
Process
メソッドを呼び出します。
1// タイムスタンププラグインのインスタンスを生成する
2var plugin = new Timestamp();
3
4// 認証を使用してタイムスタンプオプションを構成する
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
6
7// 入力PDFファイルを追加する
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 出力PDFファイルを指定する
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// タイムスタンプ処理を実行する
14plugin.Process(opt);
PFXファイルとパスワードの取り扱い
AddTimestampOptions
クラスを使用すると、デジタル署名用にPFXファイルとパスワードを使用できます。
- PFXストリームまたはファイルパス: PFXファイルに対してストリームまたはファイルパスを提供できます。
- パスワード保護: PFXファイルのパスワードを安全に管理することを確認してください。
主な機能:
- 安全なタイムスタンプの追加: PDF文書に安全なタイムスタンプを簡単に追加します。
- カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLと認証情報を使用します。
- 自動化: 自動ワークフローのために.NETアプリケーションにタイムスタンピングを統合します。
- 準拠性: 文書がデジタル署名とタイムスタンプの業界基準を満たすことを保証します。
PDF/A コンバーター
Documentize PDF/Aコンバーター for .NETは、PDF文書をPDF/A形式に変換するために設計された強力なツールであり、コンテンツが長期保存基準に準拠することを保証します。このプラグインは、PDF/Aコンプライアンスのために既存のPDF文書を検証することもサポートしており、変換と検証の機能を一つのソリューションで提供します。
PDFをPDF/Aに変換する方法
PDF文書をPDF/A形式に変換するには、以下の手順に従ってください:
PdfAConverter
クラスのインスタンスを作成します。- 変換を構成するために
PdfAConvertOptions
のインスタンスを作成します。 - 希望するPDF/Aバージョン(例:PDF/A-3B)を指定します。
AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して生成されるPDF/Aの出力ファイルを追加します。Process
メソッドを呼び出して変換を実行します。
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// 入力PDFファイルを追加
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 出力PDF/Aファイルを指定
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// 変換を処理
14pdfAConverter.Process(pdfAOptions);
PDF/Aコンプライアンスの検証
PdfAValidateOptions
クラスを使用して、既存のPDFファイルのPDF/Aコンプライアンスを検証できます。
1var pdfAConverter = new PdfAConverter();
2var validationOptions = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// 検証するPDFファイルを追加
8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 検証プロセスを実行
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// 検証結果を確認
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("PDF/A検証に合格: " + validationResult.IsValid);
PDF/A変換のバッチ処理
このプラグインはバッチ処理をサポートしており、複数のPDFファイルを一度にPDF/Aコンプライアンスのために変換または検証できます。
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// 複数の入力PDFを追加
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 変換されたPDF/Aの出力ファイルを指定
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// バッチ変換を処理
16pdfAConverter.Process(pdfAOptions);
主な機能:
- PDF/Aへの変換: PDFファイルをPDF/A形式(PDF/A-1a、PDF/A-2b、PDF/A-3bなど)にシームレスに変換して、保存基準に準拠することを保証します。
- PDF/Aコンプライアンスの検証: 既存のPDF文書がPDF/A基準に適合しているかを確認し、に不適合の場合は問題を特定します。
- バッチ処理: 複数のファイルを一度に変換または検証します。
- 効率的なワークフロー: 高速で信頼性の高い変換プロセスにより、時間と労力を最小限に抑えます。
PDF to XLS Converter
Documentize PDF to XLS Converter for .NETは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)に変換するための多用途で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的で編集可能なスプレッドシートにシームレスに変換し、データ操作、分析、共有を簡素化できます。
PDFをExcelに変換する方法
PDFドキュメントをExcelファイル(XLS/XLSX)に変換するには、以下の手順に従います:
XlsConverter
クラスのインスタンスを作成します。PdfToXlsOptions
クラスを使用して変換設定を構成します。AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力ファイルパスを指定します。Process
メソッドを実行して変換を開始します。
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 入力および出力ファイルパスを追加
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// 変換を実行
10converter.Process(options);
PDFをExcelへの変換をカスタマイズする
PdfToXlsOptions
クラスを使用すると、変換プロセスをカスタマイズできます。たとえば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度な書式設定オプションを有効にするには次のようにします:
1
2var options = new PdfToXlsOptions
3{
4 Format = PdfToXlsOptions.ExcelFormat.XLSX, // XLSXフォーマットを指定
5 WorksheetName = "MySheet", // ワークシートに名前を付ける
6 InsertBlankColumnAtFirst = true // 最初に空白の列を挿入
7};
8
9// 入力および出力ファイルを追加
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
12
13// 変換を処理
14converter.Process(options);
PDFをXLSへのバッチ処理
バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその例です:
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 複数の入力ファイルを追加
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 出力ファイルパスを指定
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// バッチ変換を実行
14converter.Process(options);
変換結果の処理
変換プロセス後、Process
メソッドは操作の詳細を含むResultContainer
オブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです:
1
2var resultContainer = converter.Process(options);
3
4// 出力ファイルパスにアクセス
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());
サポートされている出力形式
PdfToXlsOptions.ExcelFormat
enumは、さまざまな出力形式を提供します:
- XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
- XLSM: マクロ対応のExcelフォーマット。
- CSV: カンマ区切りの値。
- ODS: オープンドキュメントスプレッドシート。
- XMLSpreadSheet2003: Excel 2003 XMLフォーマット。
主な機能:
- 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換。
- コンテンツの保持: 元の構造、レイアウト、および書式設定を維持。
- カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定。
- バッチ処理: 複数のPDFファイルを同時に処理して高効率を実現。
- 高度な書式設定: 空白の列を挿入したり、ワークシートの数を最小限に抑えたり。
PDF to DOC Converter
Documentize PDF to DOC Converter for .NETは、PDF文書をDOCまたはDOCX形式に変換するための強力なツールです。このプラグインはPDFページを編集可能なMicrosoft Word文書にシームレスに変換し、コンテンツを複数のプラットフォームで再利用、編集、共有しやすくします。
PDFをDOC/DOCXに変換する方法
PDF文書をDOC/DOCX形式に変換するには、以下の手順に従ってください。
DocConverter
クラスのインスタンスを作成します。- 変換プロセスを設定するために
DocConversionOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して、結果のDOC/DOCXファイルの出力ファイルパスを追加します。Process
メソッドを実行して変換を実行します。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX, // 出力形式としてDOCX
5 ConversionMode = ConversionMode.EnhancedFlow // レイアウトとフォーマットを最適化
6};
7
8// 入力PDFファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Word文書のパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 変換を処理
15docConverter.Process(options);
カスタムオプションを使用したPDFをDOCへの変換
PDF to DOC Converterプラグインは、変換プロセスをカスタマイズするためのさまざまなオプションを提供します。変換中にPDFのレイアウトや構造をどのように扱うかを制御するために、異なるモードを選択できます。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.Doc, // 出力形式としてDOC
5 ConversionMode = ConversionMode.Precise // 元のPDFのレイアウトを可能な限り維持
6};
7
8// 入力PDFファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Word文書のパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 変換を処理
15docConverter.Process(options);
PDFをDOC/DOCXへのバッチ処理変換
PDF to DOC Converterはバッチ処理をサポートしており、複数のPDFファイルを一度に変換できます。バッチ変換の例を以下に示します。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// 複数の入力PDFファイルを追加
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 結果のDOCXファイルのための出力ファイルパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// バッチ変換を処理
16docConverter.Process(options);
主な特徴:
- DOC/DOCX変換: PDF文書を編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
- フォーマットの維持: 変換プロセス中に元のレイアウト、テキスト、およびフォーマットを保持します。
- バッチ処理: 複数のPDFファイルを一度に変換します。
- カスタム変換オプション: Enhanced Flowのような異なるモードで変換プロセスを細かく調整可能です。
PDF to HTML Converter
Documentize PDF to HTML Converter for .NETは、PDFドキュメントをHTML形式に変換するのを簡素化するダイナミックなツールです。このプラグインは単なるファイル形式の変更だけでなく、アクセシビリティを向上させ、ドキュメントをよりユーザーフレンドリーでウェブ環境に適応可能にするために設計されています。
PDFをHTMLに変換する方法
PDFドキュメントをHTMLに変換するには、次の手順を実行します。
PdfHtml
クラスのインスタンスを作成します。- 変換オプションを設定するために
PdfToHtmlOptions
クラスのインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力HTMLファイルのパスを追加します。Process
メソッドを呼び出してPDFをHTMLに変換します。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// PDFからHTMLへの変換を処理
9pdfHtml.Process(options);
HTMLをPDFに変換する方法
PDF to HTML Converterは、HTMLファイルをPDF形式に戻すこともサポートしており、双方向の完全な変換を可能にします。
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// HTMLからPDFへの変換を処理
9pdfHtml.Process(options);
PDFからHTMLへの変換のカスタマイズ
エンコーディング、フォント、その他の設定を指定することで、変換プロセスをカスタマイズできます。以下は、UTF-8エンコーディングとArialフォントを設定する例です。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// エンコーディングとフォントを設定
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// 入力と出力ファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// 変換を処理
13pdfHtml.Process(options);
PDFからHTMLへのバッチ変換
このプラグインはバッチ処理もサポートしており、複数のPDFを一度にHTMLファイルに変換することができます。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 複数の入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 各変換の出力ファイルのパスを設定
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// バッチ変換を処理
13pdfHtml.Process(options);
主な機能:
- PDFをHTMLに変換: PDFドキュメントを完全に機能するHTMLファイルにシームレスに変換します。
- 埋め込みリソース: 画像やフォントなどのリソースをHTMLに直接埋め込むか、外部リンクとして設定するかを選択できます。
- 双方向変換: PDFをHTMLに、またその逆に変換するための完全なサポートを提供します。
- レイアウトを維持: 変換中に元のレイアウトや形式を保持します。
- カスタムエンコーディング: 変換されたHTML内のテキストを正確にレンダリングするためにUTF-8などのエンコーディング形式を指定できます。
PDF to JPEG Converter
Documentize PDF to JPEG Converter for .NETは、PDFドキュメントを高品質のJPEG画像に変換する強力なツールです。このプラグインは、PDFページを広く使用される画像形式に変換することで、プラットフォーム全体でコンテンツをよりアクセスしやすくすることを目的としています。
PDFページをJPEGに変換する方法
PDFドキュメントをJPEG画像に変換するには、次の手順に従います。
Jpeg
クラスのインスタンスを作成します。- 変換プロセスを設定するために
JpegOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用してJPEG画像の出力ファイルパスを指定します。Process
メソッドを実行してPDFページをJPEG画像に変換します。
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// JPEG画像の出力ディレクトリを指定
8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
9
10// PDFをJPEGに変換を処理
11converter.Process(options);
PDFからJPEGへの変換をカスタマイズ
解像度を調整したり、ページ範囲を選択したり、画像の品質を設定することで、変換プロセスをカスタマイズできます。300 dpiでPDFの最初のページを変換する方法は次のとおりです。
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// 出力解像度を300 dpiに設定し、最初のページのみを変換
5options.OutputResolution = 300;
6options.PageRange = new PageRange(1);
7
8// 入力および出力パスを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
11
12// 変換を処理
13converter.Process(options);
PDFからJPEGへの変換のバッチ処理
PDF to JPEG Converterプラグインはバッチ処理をサポートしており、PDFから複数のページを個別のJPEGファイルに変換できます。
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 各ページの出力パスを設定
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));
10
11// バッチ変換を処理
12converter.Process(options);
変換結果の処理方法
Processメソッドは、変換結果に関する情報を保持するResultContainer
オブジェクトを返します。変換されたJPEGファイルのパスを次のように印刷できます。
1ResultContainer resultContainer = converter.Process(options);
2
3// JPEG画像の出力パスを印刷
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
主な機能:
- PDFをJPEGに変換: PDFドキュメント全体や特定のページを簡単にJPEG画像に変換します。
- カスタム解像度: 高品質の出力のために解像度(例:300 dpi)を調整します。
- ページ範囲: 変換する特定のページや範囲を選択します。
- バッチ処理: 複数のPDFページまたは全ドキュメントを一度に変換します。
- 迅速な変換: 最小限の労力で迅速かつ効率的なプロセス。
PDF to PNG Converter
Documentize PDF to PNG Converter for .NETは、PDFドキュメントを高品質のPNG画像に変換するための高度なツールです。このプラグインは、PDFページを広くサポートされている画像形式に変換することで、コンテンツをより多用途に、アクセスしやすく、共有しやすくするように設計されています。
PDFをPNGに変換する方法
PDFドキュメントをPNG画像に変換するには、以下の手順に従ってください。
Png
クラスのインスタンスを作成します。- 変換プロセスを設定するために
PngOptions
のインスタンスを作成します。 AddInput
メソッドを使用して、入力PDFファイルを追加します。AddOutput
メソッドを使用してPNG画像の出力ディレクトリを指定します。Process
メソッドを実行して、PDFページをPNG画像に変換します。
1var converter = new Png();
2var options = new PngOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6
7// PNG画像の出力ディレクトリを指定
8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
9
10// PDFからPNGへの変換を処理
11converter.Process(options);
PDFからPNGへの変換のカスタマイズ
解像度を調整したり特定のページを選択したりすることで、変換をカスタマイズできます。たとえば、300 DPIでPDFの最初のページのみを変換するには:
1var converter = new Png();
2var options = new PngOptions();
3
4// 出力解像度を300 DPIに設定
5options.OutputResolution = 300;
6
7// 最初のページのみを変換
8options.PageRange = new PageRange(1);
9
10// 入力および出力パスを追加
11options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
13
14// 変換を処理
15converter.Process(options);
PDFからPNGへの変換のバッチ処理
PDF to PNG Converterプラグインは、バッチ処理もサポートしており、複数のページや全PDFドキュメントを個別のPNGファイルに変換できます。
1var converter = new Png();
2var options = new PngOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 各ページの出力パスを設定
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
10
11// バッチ変換を処理
12converter.Process(options);
変換結果の処理
変換処理後、Processメソッドは変換結果を含むResultContainer
オブジェクトを返します。PNG画像の出力パスを次のように表示できます:
1ResultContainer resultContainer = converter.Process(options);
2
3// PNG画像の出力パスを表示
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
主な機能:
- PDFをPNGに変換: PDFドキュメント全体または特定のページを迅速かつ効率的にPNG画像に変換します。
- カスタマイズ可能な解像度: 高品質の画像出力のために希望のDPI(例: 300 DPI)を設定します。
- バッチ処理: 複数のPDFページや全ドキュメントを一度に変換します。
- 簡単な出力管理: 変換された各PNGファイルの出力ディレクトリを指定します。
- 迅速な変換: 高速で効率的、設定に最小限の労力を要します。
PDF to TIFF Converter
Documentize PDF to TIFF Converter for .NET は、PDF文書を高品質のTIFF画像に変換するために設計された強力なツールです。このプラグインは、さまざまなプラットフォームでコンテンツがアクセス可能であることを保証し、優れた忠実度と柔軟性を維持します。
PDFをTIFFに変換する方法
PDF文書をTIFF画像に変換するには、以下の手順に従ってください。
TiffConverter
クラスのインスタンスを作成します。- 変換プロセスを構成するために
PdfToTiffOptions
のインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用してTIFF画像の出力ファイルパスを指定します。Process
メソッドを実行して、PDFページをTIFF画像に変換します。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// TIFF画像の出力ファイルを指定
8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
9
10// PDFをTIFFに変換処理を実行
11converter.Process(options);
PDFからTIFFへの変換をカスタマイズする
解像度を調整したり、マルチページ出力を有効にしたり、ページ範囲を選択することで、変換プロセスをカスタマイズできます。ここでは、300 dpiでPDFの最初のページをTIFFファイルに変換する方法を示します:
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 出力解像度を300 dpiに設定し、最初のページのみを変換
5options.OutputResolution = 300;
6options.PageList = new List<int> { 1 };
7
8// 入力と出力のパスを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 変換処理を実行
13converter.Process(options);
マルチページTIFFの作成
PDF to TIFF Converterプラグインは、マルチページTIFFの生成をサポートしており、複数のPDFページを1つのTIFFファイルにまとめて、効率的なアーカイブや印刷を可能にします。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions
3{
4 MultiPage = true // マルチページTIFF出力を有効化
5};
6
7// 入力PDFファイルを追加
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// マルチページTIFFの出力ファイルを指定
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 変換処理を実行
14converter.Process(options);
PDFからTIFFへの変換のバッチ処理
PDF to TIFF Converterプラグインは、バッチ処理もサポートしており、複数のPDFページや文書全体を同時に個別のTIFFファイルに変換できます。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 各ページの出力パスを設定
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// バッチ変換を実行
12converter.Process(options);
変換結果の処理方法
Processメソッドは、変換結果に関する詳細を提供するResultContainer
オブジェクトを返します。以下のように変換されたTIFFファイルのパスを印刷できます:
1ResultContainer resultContainer = converter.Process(options);
2
3// TIFF画像の出力パスを印刷
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
主な特徴:
- PDFをTIFFに変換: 完全なPDF文書または特定のページを簡単にTIFF画像に変換します。
- カスタム解像度: 優れた品質の出力のために解像度(例: 300 dpi)を調整します。
- マルチページTIFF: 複数のPDFページを1つのマルチページTIFFファイルにまとめます。
- ページ範囲: 特定のページや範囲を変換して正確な結果を得ることができます。
- バッチ処理: 複数のPDF文書やページを一度に変換します。
- 迅速な変換: 最小限の労力で速く効率的なプロセスを実現します。
Documentize PDF Form Flattener for .NET プラグインは、インタラクティブPDFフォームを非編集可能なドキュメントに変換し、不正な変更から保護することを目的としています。このツールは、フォームフィールドを静的コンテンツに変換し、PDFドキュメントのセキュリティを向上させます。契約書、合意書、またはフォームフィールドを変更できない必要がある任意のドキュメントを保護する際に特に役立ちます。
PDFでフォームフィールドをフラット化する方法
PDFドキュメントでフォームフィールドをフラット化するには、以下の手順に従ってください。
FormFlattener
クラスのインスタンスを作成します。FormFlattenAllFieldsOptions
または FormFlattenSelectedFieldsOptions
クラスのインスタンスを作成します。- オプションに入力ファイルと出力ファイルを追加します。
Process
メソッドを呼び出して、フラット化操作を実行します。
1var formFlattener = new FormFlattener();
2
3// すべてのフィールドをフラット化するためのオプションを作成
4var flattenOptions = new FormFlattenAllFieldsOptions();
5
6// 入力ファイルと出力ファイルを追加
7flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
8flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
9
10// フォームのフラット化操作を実行
11var resultContainer = formFlattener.Process(flattenOptions);
選択したフィールドをフラット化する
特定のフィールドの位置やタイプなどの基準に基づいて、特定のフォームフィールドのみを選択的にフラット化できます。
FormFlattener
クラスのインスタンスを作成します。FormFlattenSelectedFieldsOptions
を使用して、特定のフィールドをフラット化するための基準を定義します。- オプションに入力ファイルと出力ファイルを追加します。
Process
メソッドを呼び出して変更を適用します。
1var formFlattener = new FormFlattener();
2
3// 選択したフィールドをフラット化するためのオプションを作成(例:左下のx座標が300より大きいフィールド)
4var flattenOptions = new FormFlattenSelectedFieldsOptions(
5 (field) => field.Rect.LLX > 300
6);
7
8// 入力ファイルと出力ファイルを追加
9flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
10flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
11
12// フォームのフラット化操作を実行
13var resultContainer = formFlattener.Process(flattenOptions);
主な機能:
- すべてのフォームフィールドをフラット化: インタラクティブフォームフィールドを非編集可能な静的コンテンツに変換します。
- 選択したフィールドをフラット化: 特定のフィールドをフラット化し、他のフィールドは編集可能のままにすることができます。
- ドキュメントの保護: フラット化されたフィールドがさらなる変更から保護されます。
- バッチ処理: 単一のプロセスで複数のPDFフォームをフラット化することができます。
FAQs
このFAQでは、Documentize .NET Pluginsの機能や特性に関する包括的な情報を提供し、PDF変換、フォーム処理、目次(TOC)生成などの側面を取り上げています。
一般的な質問
1. Documentize for .NETとは何ですか?
Documentize for .NETは、プログラムを通じてPDF文書を管理・処理するための強力なライブラリです。PDFをさまざまな形式に変換したり、PDFフォームを編集したり、デジタル署名を追加したり、TOCを生成したり、長期的なアーカイブのためのPDF/A準拠を確保したりできます。
2. Documentizeのプラグインをどうやってインストールしますか?
公式ウェブサイトからアセンブリファイルをダウンロードするか、NuGetから直接パッケージを取得することで、Documentizeプラグインをインストールできます。各プラグインのドキュメント内に詳細なインストール手順があります。
PDF変換プラグイン
3. PDF文書をWord(DOC/DOCX)ファイルに変換するにはどうすればよいですか?
PDF to DOC Converterを使用してPDF文書をWord形式に変換するには:
PdfDoc
クラスをインスタンス化します。- 変換オプションを設定するための
PdfToDocOptions
オブジェクトを作成します。 - 入力PDFと出力DOC/DOCXファイルのパスを追加します。
- 変換を実行するために
Process
メソッドを呼び出します。
4. PDFページをJPEG画像に変換するにはどうすればよいですか?
PDF to JPEG Converterを使用して:
Jpeg
クラスのインスタンスを作成します。JpegOptions
を介して変換オプション(解像度、ページ範囲など)を設定します。- 入力/出力ファイルのパスを追加します。
Jpeg.Process
メソッドを呼び出して変換を実行します。
5. PDFをPNGに変換するにはどうすればよいですか?
PDFをPNG形式に変換するには:
Png
クラスのインスタンスとPngOptions
オブジェクトを作成します。- 入力PDFを追加し、出力フォルダーを指定します。
- 解像度(例:300 DPI)などのオプションを設定します。
- PNG画像を生成するために
Process
メソッドを呼び出します。
6. PDFをExcel(XLS/XLSX)に変換するにはどうすればよいですか?
PDFをExcelに変換するには:
PdfXls
クラスをインスタンス化します。PdfToXlsOptions
を使用して入力/出力パスおよび変換オプションを設定します。- 変換を開始するために
Process
メソッドを呼び出します。
7. PDFをHTMLに変換するにはどうすればよいですか?
PDF文書をHTMLに変換するには:
PdfHtml
クラスのインスタンスを作成します。PdfToHtmlOptions
またはHtmlToPdfOptions
で変換オプションを設定します。- 入力/出力パスを追加し、
Process
メソッドを呼び出します。
PDFフォーム処理
8. フォームエディタでPDFフォームを編集するにはどうすればよいですか?
PDF Form Editorは、以下の機能を提供します:
- フィールドを追加する(
FormEditorAddOptions
)。 - フィールドを更新する(
FormEditorSetOptions
)。 - フィールドを削除する(
FormRemoveSelectedFieldsOptions
)。
フォームフィールドを設定したら、Process
メソッドを実行します。
9. PDFフォームをフラット化するにはどうすればよいですか?
フォームフィールドをフラット化するには:
FormFlattener
クラスをインスタンス化します。- すべてのフィールドをフラット化するために
FormFlattenAllFieldsOptions
を使用するか、特定のフィールドをターゲットにするためにFormFlattenSelectedFieldsOptions
を使用します。 - 入力/出力ファイルを追加し、
Process
メソッドを呼び出します。
10. PDFフォームからデータをエクスポートするにはどうすればよいですか?
フォームデータをエクスポートするには、PDF Form Exporterを使用します。 FormExporterValuesToCsvOptions
オブジェクトを作成し、フォームフィールドの条件を指定し、データをCSV形式でエクスポートするためにProcess
メソッドを実行します。
PDF/AおよびTOC管理
11. PDFをPDF/A形式に変換するにはどうすればよいですか?
PDFをPDF/Aに変換するには:
PdfAConverter
クラスを使用します。PdfAConvertOptions
でPDF/Aのバージョン(例:PDF/A-3B)を設定します。- 入力/出力パスを追加し、
Process
メソッドを呼び出します。
12. PDF内に目次(TOC)を生成するにはどうすればよいですか?
目次を作成するには:
TocGenerator
クラスのインスタンスを作成します。TocOptions
を使用してTOCのパラメータを定義します。- 入力/出力ファイルを追加し、
Process
メソッドを実行します。
署名処理
13. PDF文書にデジタル署名を追加するにはどうすればよいですか?
デジタル署名を追加するには:
Signature
クラスをインスタンス化します。SignOptions
を使用してPFXファイル、パスワード、および署名の詳細(理由、連絡先情報など)を設定します。- 入力/出力ファイルを追加し、
Process
メソッドを実行します。
追加機能
14. Documentizeを使用してPDFファイルを分割できますか?
はい、PDF Splitterを使用して:
Splitter
クラスをインスタンス化します。SplitOptions
を使用して分割オプションを設定します。- 入力/出力パスを追加し、
Process
メソッドを呼び出します。
15. 複数のPDFファイルを1つに結合するにはどうすればよいですか?
PDFを結合するには:
Merger
クラスをインスタンス化します。- 入力PDFを追加し、
MergeOptions
を介して出力ファイルを指定します。 - ファイルを結合するために
Process
メソッドを実行します。
16. DocumentizeはPDFのみを処理する制限がありますか?
Documentizeは主にPDF操作に焦点を当てていますが、DOC、XLS、HTML、JPEG、PNGなどのフォーマットへの変換もサポートしています。
ライセンスと互換性
17. Documentizeプラグインを使用するためのシステム要件は何ですか?
Documentizeは以下をサポートします:
- オペレーティングシステム: Windows 7-11、Windows Server 2003-2022、macOS (10.12+)、Linux。
- フレームワーク: .NET Framework 4.0から8.0。
- IDE: Visual Studioのさまざまなバージョンと互換性があります。
18. Documentizeのライセンスキーを設定するにはどうすればよいですか?
プラグインをアクティブにするには、プロジェクトでDocumentizeを参照し、任意のメソッドを呼び出す前にライセンスキーを設定します。詳細な手順は特定のプラグインのドキュメントを参照してください。
19. Documentizeプラグインのさらなる例やドキュメントはどこで見つけられますか?
完全なAPIドキュメントや例は、Documentizeのウェブサイトまたは開発環境内のNuGetパッケージを通じて見つけることができます。