概要

Documentizeは、.NETアプリケーション内でPDF文書を管理するためのSDKを提供する包括的なプラットフォームです。これらのSDKは、PDF処理に関連する複雑なタスクを簡素化し、文書ワークフローを改善し、ユーザーにとってより直感的かつ効率的にします。以下は、その主要な機能の概要です。

主な機能

  • PDF変換:

    • PDFをMicrosoft Word(DOC/DOCX)、Excel(XLS/XLSX)、HTML、JPEG、PNGなどの複数の形式に変換します。
    • 長期のアーカイブに理想的で、保持基準への準拠を可能にするPDF/A形式への変換をサポートしています。
  • 文書操作:

    • PDFのマージと分割: 複数のPDFファイルを簡単に結合したり、大きな文書を小さく管理しやすい部分に分割したりします。
    • PDFの最適化: コンテンツの品質を損なうことなく、ファイルサイズを削減するためにPDF文書を圧縮し、改善します。
  • テキスト抽出:

    • 構造化データと非構造化データフォーマットの両方をサポートしながら、精度を持ってテキストを抽出します。
  • デジタル署名:

    • PDF文書にデジタル署名をして、その真正性と整合性を保証し、機密ファイルに対して安全性と信頼を提供します。

専門SDK

  • PDF to DOC コンバータ: フォーマットとレイアウトを保持しながら、PDFコンテンツを編集可能なWord文書に正確に変換します。
  • PDF to Excel コンバータ: PDFから表形式のデータを抽出し、さらにデータ分析のためにExcelスプレッドシートに変換します。
  • ChatGPT統合: ChatGPTとの対話を可能にし、PDF内に会話型AIの応答を埋め込むことで、ユニークな文書の強化を実現します。

使い方と互換性

Documentize SDKは、.NETアプリケーションへのシームレスな統合のために構築されており、WindowsmacOS、およびLinuxなど、複数のプラットフォームをサポートしています。SDKは、多様な文書処理の要件に対応しながら、高いパフォーマンスと信頼性を確保する柔軟で強力なAPIを提供します。

SDKおよびプロジェクトへの統合に関する詳細情報については、公式ウェブサイトを訪れてください。

概要のサブセクション

インストール

Documentize SDKは、さまざまな開発環境や好みに合わせた複数の方法でインストールできます。以下はDocumentizeをインストールするための推奨方法です:

1. NuGet(推奨方法)

NuGetは、Documentizeをインストールする最も簡単で推奨される方法であり、常に最新のバージョンと更新を開発環境内で直接利用できます。このインストール方法の詳細については、NuGetを使用してDocumentize SDKをインストールする方法を確認してください。

2. MSIインストーラー

MSIインストーラーは、DocumentizeのDLLを直接システムにインストールしたい場合に便利なオプションです。この方法は、複数のプロジェクトでDocumentizeを使用したい開発者に最適で、DLLファイルを手動で管理する必要がありません。このインストール方法の詳細については、MSIを使用してDocumentize SDKをインストールする方法を確認してください。

3. ZIPアーカイブ

手動アプローチを好む開発者のために、ZIPアーカイブにはDocumentizeのDLLが含まれており、これを抽出してプロジェクトに直接追加できます。このインストール方法の詳細については、ZIPを使用してDocumentize SDKをインストールする方法を確認してください。

2024/12/28

インストールのサブセクション

システム要件

Documentize SDKsは、.NETアプリケーションと統合するように設計されており、さまざまなオペレーティングシステムおよび開発環境をサポートしています。以下は主要なシステム要件です。

サポートされているオペレーティングシステム

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003からWindows Server 2022 (x64, x86)
  • クラウド: Microsoft Azure

macOS

  • macOS 10.12 (Sierra)以降

Linux

  • 複数のLinuxディストリビューションに対応:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Android 8.0 (Oreo)以降をサポート。

開発環境

  • Microsoft Visual Studio:
    • Visual Studio 2010以降(2019および2022を含む)
  • .NETプラットフォームを対象とした任意の開発環境をサポート。

サポートされている.NETフレームワーク

  • .NET Framework 4.0以上
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0、.NET 7.0、.NET 8.0

追加の注意事項

  • Adobe AcrobatはDocumentize SDKsを実行するために必須ではありませんが、PDFを閲覧するために推奨されます。
2024/12/28

宣言

Documentize.com SDK は、.NET アプリケーション内で使用する際に フル トラスト 権限セットを必要とします。この権限レベルは、レジストリ設定、システムファイルへのアクセス、フォントの解析など、特定のシステムレベルの操作を SDK が実行するために不可欠です。

なぜフル トラストが必要か

Documentize SDK は、次の理由により、しばしば昇格された権限を必要とする .NET のコアシステムクラスを利用しています:

  • レジストリアクセス: 一部の操作では、システムレジストリの読み取りまたは書き込みが必要です。
  • システムファイル: フォントの処理やファイル操作など、特定のタスクのためにアプリケーションの仮想ディレクトリを超えるシステムファイルへのアクセスが必要になることがあります。

ミディアム トラスト環境の制限

ミディアム トラスト セキュリティを強制するホスティング環境では、いくつかの重要な権限が制限されるか、または利用できなくなります。これにより、そのような環境で SDK が正常に機能しない可能性があります。ミディアム トラスト 下での制限は以下の通りです:

  • OleDbPermission: ADO.NET マネージド OLE DB データプロバイダーを使用してデータベースにアクセスできません。
  • EventLogPermission: Windows イベントログへのアクセスは禁止されています。
  • ReflectionPermission: リフレクションの使用が制限され、特定の動的操作に影響を及ぼす可能性があります。
  • RegistryPermission: システムレジストリへのアクセスが拒否されます。
  • WebPermission: 通信は <trust> 要素で構成された事前定義されたアドレスまたは範囲に制限されます。
  • FileIOPermission: ファイルへのアクセスは、アプリケーションの仮想ディレクトリ内のファイルに限られます。
2024/12/28

非Windows環境

Documentize SDKは**.NET Standard 2.0**をサポートしており、これによりLinuxやその他の非Windows環境で動作する.NET Coreアプリケーションで使用できます。最適なパフォーマンスと正しいテキストレンダリングを確保するために、以下の手順に従ってください。

Linuxの推奨設定

1. libgdiplusパッケージのインストール

このパッケージは、PDFのレンダリングと処理に欠かせないGDI+機能を提供します。以下のコマンドをターミナルで実行してインストールできます。

sudo apt-get install libgdiplus

2. Microsoft互換フォントのインストール

正しいテキストレンダリングのために、次のコマンドを使用してMicrosoft TrueTypeフォントをインストールします。

sudo apt-get install ttf-mscorefonts-installer

これらのフォントは/usr/share/fonts/truetype/msttcorefontsディレクトリに配置する必要があります。システムが異なるディレクトリにフォントを保存している場合は、Documentize SDKを使用する前にコード内のパスを更新してください。

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));

ヒント

これらのインストールを完了させ、フォントパスを正しく構成することで、Linuxやその他の非Windowsシステム上でDocumentize SDKのパフォーマンスを最大化できます。

2024/12/28

評価

評価目的でDocumentize SDKを簡単にダウンロードできます。評価版は購入版と同一で、ライセンスの適用方法のみが異なります。

評価版の制限

評価版はすべての機能に完全にアクセスできますが、ライセンスが適用されるまで以下の制限があります:

  • すべての出力文書に評価用の透かしが挿入されます。
  • PDF文書の最初の4ページのみが表示または編集できます。

これらの制限を解除し、フルバージョンをアンロックするには、プロジェクトに数行のコードを追加してライセンスを適用するだけです。

2024/12/28

開発者ガイド

PDFセキュリティ

C# .NETを使用してPDF文書の暗号化と復号化

PDFテーブルジェネレーター

データを整理するための理想的な構造化されたテーブルをPDF文書で簡単に生成し、インタラクティブなフォームを作成し、コンテンツの可読性を向上させます。

PDFオプティマイザー

ファイルサイズを削減し、ページを回転させ、コンテンツを切り取り、文書をリサイズする

PDFマージャー

C# .NETを使用して複数のPDF文書を1つのファイルに結合します

PDF署名

.NETプラグインは、署名を追加し、真正性を保証し、PDFコンテンツを保護するための合理化されたプロセスを提供します

PDFスプリッター

.NETツールで、大きなPDFドキュメントをより管理しやすい小さなファイルに分割するプロセスを簡素化します

PDF ChatGPT

ChatGPT APIを.NET PDFアプリケーションに統合する

PDFテキスト抽出ツール

.NETプラグインにより、フォーマットを保持したり、ニーズに応じて省略したりしながら効率的にテキストを抽出できます

PDF タイムスタンプ追加ツール

C# .NETを使用してPDF文書に安全なタイムスタンプを追加します

PDF/Aコンバータ

.NETプラグインはPDF文書をPDF/A形式に変換し、コンテンツが長期アーカイブ基準に準拠したまま保持されることを保証します。

PDFからXLSへの変換ツール

Documentizeの強力な.NETプラグインを使用してPDF文書をExcelスプレッドシート(XLS/XLSX)に無労力で変換します。

PDFからDOCコンバータ

.NETツールはPDFドキュメントをDOCまたはDOCX形式に変換することができます

PDFからJPEGへのコンバータ

.NETプラグインはPDFドキュメントを高品質なJPEG画像に変換するのを簡単にします

PDFをPNGに変換するツール

.NETプラグインを使用して、PDF文書を高品質のPNG画像に変換できます

PDF to TIFF コンバータ

.NET プラグインが PDF ドキュメントを高品質の TIFF 画像に変換する作業を簡素化します

HTML コンバータ

Documentize HTML Converter の PDF から HTML への変換および HTML から PDF への変換機能に関する包括的なガイド。

2024/10/10

開発者ガイドのサブセクション

PDFセキュリティ

Documentize PDFセキュリティ for .NETは、PDF文書のセキュリティを強化するために設計された強力なツールで、暗号化と復号化の機能を提供します。これにより、機密情報が非公開であり、無断アクセスから保護されることを保証します。

主な機能:

  • PDF文書の暗号化: ユーザーとオーナーのパスワードを追加してPDFファイルを保護します。
  • PDF文書の復号化: 必要に応じてPDFから暗号を削除します。
  • 権限の設定: 印刷、コピー、コンテンツの変更などの権限を制御します。
  • 自動化: .NETアプリケーションに暗号化と復号化を統合し、自動化されたワークフローを実現します。
  • コンプライアンス: 文書が業界標準の文書セキュリティ要件を満たすことを保証します。

PDF文書を暗号化する方法

PDF文書を暗号化するには、次の手順に従います:

  1. Securityクラスのインスタンスを作成します。
  2. 望ましいユーザーとオーナーのパスワードでEncryptionOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputを使用して出力ファイルのパスを設定します。
  5. Processメソッドを使用して暗号化を実行します。
 1// Securityプラグインのインスタンスを作成
 2var plugin = new Security();
 3
 4// 暗号化オプションを設定
 5var opt = new EncryptionOptions("user_password", "owner_password");
 6
 7// 入力PDFファイルを追加
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 出力暗号化PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// 暗号化プロセスを実行
14plugin.Process(opt);

PDF文書を復号化する方法

PDF文書を復号化するには、次の手順に従います:

  1. Securityクラスのインスタンスを作成します。
  2. 必要なパスワードでDecryptionOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して暗号化されたPDFファイルを追加します。
  4. AddOutputを使用して出力ファイルのパスを設定します。
  5. Processメソッドを使用して復号化を実行します。
 1// Securityプラグインのインスタンスを作成
 2var plugin = new Security();
 3
 4// 復号化オプションを設定
 5var opt = new DecryptionOptions("user_password");
 6
 7// 入力暗号化PDFファイルを追加
 8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
 9
10// 出力復号化PDFファイルを指定
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// 復号化プロセスを実行
14plugin.Process(opt);

PDF文書に権限を設定する

PDFを暗号化するとき、文書の使用方法を制御するためのさまざまな権限を設定できます。

  • 印刷: 文書の印刷を許可または不許可にします。
  • コピー: コンテンツのコピーを許可または不許可にします。
  • 変更: 文書の変更を許可または不許可にします。

権限を設定するには、適切にEncryptionOptionsを構成できます。

PDFテーブルジェネレーター

.NET用ドキュメンタイズテーブルジェネレーターは、PDF文書へのテーブルの統合をスムーズにするために設計された多目的プラグインです。データを整理する場合、フォームをデザインする場合、または文書の可読性を向上させる場合でも、このプラグインはプロセスを簡素化し、精密さと効率を保ちます。その直感的なAPIは、単一の文書とバッチ処理ワークフローの両方をサポートしており、構造化データを扱う開発者にとって不可欠なツールです。

主な特徴:

  • 動的テーブル作成: PDF文書に構造化されたテーブルを簡単に生成します。
  • リッチコンテンツサポート: テーブルにテキスト、HTML、画像、LaTeXコンテンツを埋め込みます。
  • ページ配置: PDF内の特定の位置にテーブルを正確に挿入します。
  • カスタマイズ可能なレイアウト: テーブル構造、セルの配置、スタイルを調整します。
  • バッチ処理: 複数の文書を同時に処理して最大限の効率を実現します。

テーブルを含むPDFの作成

TableGeneratorクラスを使用してPDF内に構造化されたテーブルを作成する手順は次のとおりです。

  1. TableGeneratorクラスをインスタンス化します。
  2. TableOptionsオブジェクトを設定してテーブルの構造、コンテンツ、入出力ファイルを定義します。
  3. PDFにテーブル、行、およびセルを追加します。
  4. Processメソッドを使用してテーブル生成プロセスを完了します。

以下は例です。

 1  
 2var generator = new TableGenerator();  
 3var options = new TableOptions();  
 4
 5// 入力と出力のPDFファイルを指定  
 6options.AddInput(new FileDataSource("input.pdf"));  
 7options.AddOutput(new FileDataSource("output.pdf"));  
 8
 9// 行とセルを持つテーブルを定義  
10options  
11    .InsertPageAfter(1) // 最初のページの後にテーブルを追加  
12    .AddTable()  
13        .AddRow()  
14            .AddCell().AddParagraph(new TextFragment("セル 1"))  
15            .AddCell().AddParagraph(new TextFragment("セル 2"))  
16            .AddCell().AddParagraph(new TextFragment("セル 3"));  
17
18// 文書内でテーブルを生成  
19generator.Process(options);  

テーブルにリッチコンテンツを追加

PDF文書のテーブルには、その機能性と外観を向上させるためにさまざまなコンテンツタイプを含めることができます。以下は、HTMLコンテンツをテーブルセルに追加する例です。

1  
2options  
3    .AddTable()  
4        .AddRow()  
5            .AddCell().AddParagraph(new HtmlFragment("<h1>ヘッダー 1</h1>"))  
6            .AddCell().AddParagraph(new HtmlFragment("<h2>ヘッダー 2</h2>"))  
7            .AddCell().AddParagraph(new HtmlFragment("<h3>ヘッダー 3</h3>"));  

テーブルでサポートされているコンテンツタイプ

PDFテーブルジェネレーターは、さまざまなコンテンツタイプをサポートしており、開発者が幅広いユースケースに対応できるようにテーブルをカスタマイズできます。

  • HtmlFragment: ヘッダー、リスト、フォーマットされたテキストなどのHTMLベースのコンテンツを追加します。
  • TeXFragment: 数学的な方程式や科学的表記のためのLaTeXベースのコンテンツを含めます。
  • TextFragment: プレーンまたはフォーマットされたテキストを挿入します。
  • Image: テーブルセルに直接画像を埋め込みます。

テーブルのレイアウトと構造のカスタマイズ

このプラグインは、行の高さ、列の幅、セルの配置など、テーブル構造を調整する柔軟性を提供します。これらのカスタマイズオプションを使用して、文書のレイアウトとスタイルのニーズに合ったテーブルをデザインできます。

テーブル生成の処理

すべてのコンテンツを追加し、テーブル構造をカスタマイズした後、Processメソッドを呼び出してプロセスを完了します。このメソッドは、テーブルを生成しPDF文書を更新します。結果を処理する方法は以下の通りです。

1  
2var resultContainer = generator.Process(options);  
3
4// 生成した結果の数を出力  
5Console.WriteLine("生成された結果の数: " + resultContainer.ResultCollection.Count);  

PDFテーブルジェネレーターのユースケース

  1. データレポーティング: 分析、財務報告、または調査結果を明確で整理された形式で提示します。
  2. フォームデザイン: 構造化されたテーブルレイアウトを持つインタラクティブなフォームを作成します。
  3. 文書の強化: ユーザーマニュアル、ガイド、または教育資料の可読性と使いやすさを向上させます。
  4. バッチ処理: 複数のPDF文書のテーブル生成を自動化します。

PDFオプティマイザー

Documentize PDFオプティマイザーは、PDF文書を高度な最適化技術によって強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツを切り取り、文書をリサイズするのを助けるために設計されています。これらの操作により、PDFファイルの品質と管理性が向上し、保管、共有、および表示が容易になります。

主な機能:

  • 最適化: 質を損なうことなくPDFファイルのサイズを削減します。
  • 回転: PDFページの向きを調整します。
  • 切り取り: 文書から不要な余白やコンテンツを削除します。
  • リサイズ: ページを特定の寸法(例:A4、レター)にリサイズします。

PDF文書の最適化

以下の手順は、品質を維持しながらPDF文書のファイルサイズを削減する方法を示しています。

  1. Optimizerクラスのインスタンスを作成します。
  2. 最適化設定を構成するためにOptimizeOptionsオブジェクトを作成します。
  3. 入力PDFファイルを追加し、最適化されたファイルの出力先を設定します。
  4. Processメソッドを実行して最適化を実行します。
1  
2var optimizer = new Optimizer();  
3var optimizeOptions = new OptimizeOptions();  
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));  
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));  
6optimizer.Process(optimizeOptions);  

PDF文書のリサイズ

PDF文書をリサイズするために、ResizeOptionsクラスを使用して文書の新しいページサイズを指定します。

  1. Optimizerクラスのインスタンスを作成します。
  2. ページサイズを定義するためにResizeOptionsオブジェクトを作成します。
  3. 入力ファイルを追加し、希望の出力先を設定します。
  4. SetPageSizeメソッドを使用して新しいサイズを指定します(例:A4)。
  5. Processメソッドを呼び出して変更を適用します。
1  
2var optimizer = new Optimizer();  
3var resizeOptions = new ResizeOptions();  
4resizeOptions.AddInput(new FileDataSource("input.pdf"));  
5resizeOptions.SetPageSize(PageSize.A4);  
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(resizeOptions);  

PDFページの回転

RotateOptionsクラスを使用して、PDFファイル内のページの向きを調整します。

  1. Optimizerクラスのインスタンスを作成します。
  2. RotateOptionsオブジェクトを作成し、回転角度を設定します。
  3. 入力PDFファイルを追加し、出力ファイルの位置を指定します。
  4. SetRotationメソッドを使用して回転角度(例:90度)を設定します。
  5. Processメソッドで回転を実行します。
1  
2var optimizer = new Optimizer();  
3var rotateOptions = new RotateOptions();  
4rotateOptions.AddInput(new FileDataSource("input.pdf"));  
5rotateOptions.SetRotation(90);  
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(rotateOptions);  

PDF文書の切り取り

切り取りは、PDF文書から不要なコンテンツや余白を削除します。CropOptionsクラスを使用して、切り取り領域を定義できます。

  1. Optimizerクラスのインスタンスを作成します。
  2. CropOptionsオブジェクトを使用して切り取り領域を定義します。
  3. 入力ファイルを追加し、出力ファイルの位置を指定します。
  4. SetCropBoxメソッドを使用して切り取り領域を定義します。
  5. Processメソッドで切り取りを実行します。
1  
2var optimizer = new Optimizer();  
3var cropOptions = new CropOptions();  
4cropOptions.AddInput(new FileDataSource("input.pdf"));  
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 切り取り領域を定義  
6cropOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(cropOptions);  

PDFマージャー

Documentize PDFマージャー for .NET は、複数のPDF文書を1つのファイルに結合するために設計された多目的ツールです。このツールはPDFファイルの統合を簡素化し、ドキュメントが効率的に結合され、一貫性が保たれることを保証します。このプラグインは、マージされた文書を最適化するためにフォントや画像などの内部リソースを処理します。

主な機能:

  • 複数のPDFの結合: 複数のPDFファイルを簡単に1つに結合できます。
  • リソースの最適化: 結合中に重複したフォントや画像を削除します。
  • バッチ処理: 大量のPDF文書を一度に結合します。
  • 安全な結合: データの損失やコンテンツの破損なしに文書の整合性を保証します。

PDF文書を結合する方法

複数のPDF文書を1つのファイルに結合するには、次の手順に従います:

  1. Mergerクラスのインスタンスを作成します。
  2. 結合プロセスを構成するためにMergeOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputを使用して出力ファイルのパスを設定します。
  5. Processメソッドを使用して結合を実行します。
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// 結合する入力PDFファイルを追加  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));  
 9
10// 出力ファイルのパスを指定  
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));  
12
13// PDFを結合  
14merger.Process(mergeOptions);  

ページ範囲でPDFを結合する方法

MergeOptionsクラスを使用して、入力PDFファイルから特定のページ範囲を結合することもできます。これにより、選択したページを最終出力文書にまとめることができます。

  1. Mergerクラスのインスタンスを作成します。
  2. MergeOptionsを使用してページ範囲を構成します。
  3. 指定したページ範囲の入力ファイルを追加します。
  4. 出力パスを設定します。
  5. Processメソッドを呼び出します。
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// 入力PDFの特定のページを結合  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));  
 8
 9// 出力ファイルのパスを指定  
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));  
11
12// PDFを結合  
13merger.Process(mergeOptions);  

バッチ結合を処理する方法

PDFマージャープラグインは、大量のPDF文書を処理するために最適化されています。バッチ処理機能を活用することで、数百のPDFを一度の操作で結合し、効率的かつ迅速な文書管理を保証することができます。

  1. Mergerクラスをインスタンス化します。
  2. すべての入力PDFファイルをMergeOptionsクラスに追加します。
  3. 出力パスを指定します。
  4. Processメソッドを呼び出して、バッチ内のすべてのファイルを結合します。
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// 結合のために大量のPDFを追加  
 6for (int i = 1; i <= 100; i++)  
 7{  
 8    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));  
 9}  
10
11// 出力ファイルのパスを指定  
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));  
13
14// バッチ結合を処理  
15merger.Process(mergeOptions);  

PDF署名

Documentize PDF署名 for .NET プラグインは、ユーザーがPDFドキュメントにデジタル署名を行うことを可能にします。これは、署名を追加し、真正性を保証し、PDFコンテンツを保護するための合理化されたプロセスを提供します。このプラグインは、可視署名と非可視署名の両方をサポートしており、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。

主な機能:

  • PDFドキュメントにデジタル署名: 可視または非可視のデジタル署名で文書を保護します。
  • PFXサポート: PFX証明書を使用してPDFファイルに署名します。
  • カスタマイズ可能なオプション: 理由、場所、連絡先の詳細などの署名設定を構成します。
  • 可視署名と非可視署名: 署名がドキュメントに表示されるかどうかを選択します。

PDFドキュメントに署名する方法

PFXファイルを使用してPDFドキュメントに署名するには、以下の手順に従ってください:

  1. Signatureクラスのインスタンスを作成します。
  2. PFXファイルのパスとパスワードでSignOptionsクラスをインスタンス化します。
  3. 入力PDFと出力ファイルをオプションに追加します。
  4. Processメソッドを実行して署名を適用します。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 入力PDFを追加し、出力ファイルを指定します  
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 8
 9// 署名オプションを構成します  
10signOptions.Reason = "契約合意";  
11signOptions.Contact = "johndoe@example.com";  
12signOptions.Location = "ニューヨーク";  
13signOptions.PageNumber = 1;  
14signOptions.Visible = true;  
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);  
16
17// ドキュメントに署名を適用します  
18signature.Process(signOptions);  

PFXファイルにストリームを使用する方法

ファイルパスの代わりにストリームとして提供されたPFX証明書を使用してPDFに署名することもできます。これにより証明書の保存をより柔軟に扱うことができます。

  1. Signatureクラスのインスタンスを作成します。
  2. PFXを含むストリームとパスワードでSignOptionsをインスタンス化します。
  3. 入力と出力ファイルを追加します。
  4. Processメソッドを実行して署名を適用します。
 1  
 2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");  
 3var signature = new Signature();  
 4var signOptions = new SignOptions(pfxStream, "pfxPassword");  
 5
 6// 入力と出力ファイルを追加します  
 7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 9
10// 署名を適用します  
11signature.Process(signOptions);  

非可視署名を適用する方法

文書に署名を表示せずに文書を保護する非可視署名を追加するには、Visibleプロパティをfalseに設定します。

  1. SignOptionsのインスタンスを作成します。
  2. Visiblefalseに設定します。
  3. 入力と出力ファイルを追加します。
  4. Processを呼び出して非可視署名を適用します。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 非可視署名を構成します  
 6signOptions.Visible = false;  
 7
 8// 入力と出力ファイルを追加します  
 9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));  
11
12// 署名を処理します  
13signature.Process(signOptions);  

PDFスプリッター

Documentize PDFスプリッター for .NETは、大きなPDFドキュメントをより管理しやすい小さなファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合でも、特定のセクションにドキュメントを分割する必要がある場合でも、このプラグインを使用することで、効率的に、最小限の労力で達成できます。

主な機能:

  • ページごとにPDFを分割: PDFドキュメントを個々のページに分解します。
  • バッチ処理: 大量のPDFを一度に分割します。
  • カスタム分割オプション: 要件に応じて分割プロセスを設定します。
  • 整理された出力: 各分割ページまたはセクションの出力ファイルを簡単に管理できます。

PDFドキュメントを分割する方法

PDFドキュメントを個々のページに分割するには、以下の手順に従ってください:

  1. Splitterクラスのインスタンスを作成します。
  2. 分割オプションを設定するためにSplitOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して各分割ページの出力ファイルを追加します。
  5. ドキュメントを分割するためにProcessメソッドを実行します。
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 入力PDFファイルを追加
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 各ページの出力ファイルを指定
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12
13// 分割操作を処理
14splitter.Process(splitOptions);  

ページ範囲によるPDFの分割

ページ範囲を指定することでPDFを分割することもできます。これにより、特定のセクションや複数のページをPDFから別々のドキュメントとして抽出できます。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 入力PDFを追加
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// ページ範囲の出力を定義(例: ページ1-3)
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10
11// 分割を処理
12splitter.Process(splitOptions);  

バッチ分割の扱い方

PDFスプリッタープラグインは、大量のPDFドキュメントを処理するために最適化されています。バッチ処理を活用することで、数百のPDFを個々のページやセクションに分割できます。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// バッチで入力PDFファイルを追加
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 各ファイルの出力を定義
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12
13// バッチ分割を処理
14splitter.Process(splitOptions);  

PDF ChatGPT

Documentize ChatGPT for .NETプラグインは、ChatGPT APIをPDFアプリケーションに統合するために設計された強力なツールです。このプラグインを使用すると、開発者は入力メッセージに基づいてチャット応答を生成し、その出力をPDF形式で保存することができ、PDFドキュメント内で会話インターフェースや分析レポートを直接作成するのに適しています。

主な機能:

  • チャットの補完: カスタム入力に基づいてChatGPT APIを使用して応答を生成します。
  • システムおよびユーザーメッセージ: システムコンテキストとユーザー入力の両方を提供してダイナミックな会話を作成します。
  • PDF出力: 生成されたチャット補完を構造化されたPDFファイルに保存し、後で利用できます。
  • 非同期処理: チャット補完を非同期的に処理することで、応答性の高いアプリケーションを実現します。

チャット応答の生成

ChatGPTプラグインを使用してチャット応答を生成し、それをPDFファイルに保存するには、次の手順に従ってください。

  1. リクエストオプションを構成するためにPdfChatGptRequestOptionsクラスのインスタンスを作成します。
  2. 入力および出力のPDFファイルを追加します。
  3. APIキーを設定し、最大トークン数やChatGPTモデルへのクエリなどのパラメータを指定します。
  4. ProcessAsyncメソッドを実行してチャット補完を生成します。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // あなたのAPIキーを設定  
 4options.MaxTokens = 1000;  // 最大トークン数を設定  
 5options.Query = "このテキストの重要なテーマを分析してください。";  
 6
 7// 入力PDFファイルを追加  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// チャット応答を持つ出力PDFを保存する場所を指定  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// PdfChatGptプラグインのインスタンスを作成  
14var plugin = new PdfChatGpt();  
15
16// プロセスを非同期的に実行  
17var result = await plugin.ProcessAsync(options);  

システムおよびユーザーメッセージの追加

よりインタラクティブな会話を作成するために、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは、会話のコンテキストを形作るのに役立ちます。

  1. ChatGPTのコンテキストを設定するシステムメッセージを追加します。
  2. 会話のユーザーの入力を表すユーザーメッセージを追加します。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // あなたのAPIキーを設定  
 4
 5// コンテキストのためのシステムメッセージを追加  
 6options.AddSystemMessage("あなたはテキストを要約するために訓練されたAIです。");  
 7
 8// ChatGPTモデルを照会するためのユーザーメッセージを追加  
 9options.AddUserMessage("添付のドキュメントを要約してください。");  
10
11// 入力および出力PDFを追加  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// リクエストを非同期的に処理  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDFテキスト抽出ツール

Documentize PDFテキスト抽出ツール for .NET は、PDF文書からテキストを抽出する作業を簡素化します。純粋なテキスト、生のテキスト、またはプレーンテキストが必要な場合、このプラグインはニーズに応じてフォーマットを保持したり省略したりしながら、効率的にテキストを抽出できます。

主な機能:

  • 純粋モード: 元のフォーマットを保持しながらテキストを抽出します。
  • 生モード: フォーマットなしでテキストを抽出します。
  • プレーンモード: 特殊文字やフォーマットなしでテキストを抽出します。
  • バッチ処理: 一度に複数のPDFからテキストを抽出します。

PDF文書からテキストを抽出する方法

PDF文書からテキストを抽出するには、以下の手順に従います:

  1. TextExtractorクラスのインスタンスを作成します。
  2. 抽出オプションを設定するためにTextExtractorOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. Processメソッドを実行してテキストを抽出します。
  5. ResultContainer.ResultCollectionを使用して抽出されたテキストにアクセスします。
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// テキスト抽出を処理
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// 抽出されたテキストを表示
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

複数のPDFからテキストを抽出する

このプラグインは、複数のPDFから同時にテキストを抽出できるようにし、迅速で効率的な処理を確保します。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 複数の入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// 抽出を処理
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを出力
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

テキスト抽出モード

TextExtractorプラグインは、ニーズに応じた柔軟性を提供する3つの抽出モードを提供します。

  1. 純粋モード: 空白や整列を含む元のフォーマットを保持します。
  2. 生モード: フォーマットなしでテキストを抽出し、生データ処理に役立ちます。
  3. プレーンモード: 特殊文字や追加のフォーマットなしでテキストを抽出します。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 純粋モードに設定
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 処理して出力
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

バッチ処理の取り扱い方法

大規模な文書セットでは、バッチ処理を活用することで、複数のPDFから一度にテキストを抽出できます。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 複数の入力PDFを追加
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// 各ファイルの出力を定義
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 抽出されたテキストを処理
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

PDF タイムスタンプ追加ツール

Documentize PDF タイムスタンプ追加ツール for .NETは、PDF文書に安全なタイムスタンプを追加するために設計された強力なツールです。信頼できる時間の参照を提供することにより、文書の整合性と真正性を向上させ、デジタル署名基準への準拠を確保します。

主な機能:

  • 安全なタイムスタンプの追加: PDF文書に安全なタイムスタンプを簡単に追加できます。
  • カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLと認証情報を使用できます。
  • 自動化: .NETアプリケーションにタイムスタンプ処理を統合し、自動ワークフローを実現します。
  • 準拠: 文書がデジタル署名およびタイムスタンプの業界基準を満たすことを保証します。

PDF文書にタイムスタンプを追加する方法

PDF文書に安全なタイムスタンプを追加するには、以下の手順に従ってください:

  1. Timestampクラスのインスタンスを作成します。
  2. **タイムスタンプ処理

PDF/Aコンバータ

Documentize PDF/Aコンバータ for .NETは、PDF文書をPDF/A形式に変換するための強力なツールであり、コンテンツが長期アーカイブ基準に準拠したまま保持されることを保証します。このプラグインは、PDF/A準拠のための既存のPDF文書を検証することもサポートしており、変換と検証の機能を単一のソリューションで提供します。

主な機能:

  • PDF/Aへの変換: PDFファイルをPDF/A形式(PDF/A-1a、PDF/A-2b、PDF/A-3bなど)にシームレスに変換し、アーカイブ基準への準拠を保証します。
  • PDF/A準拠の検証: 既存のPDF文書がPDF/A基準に適合しているかをチェックし、準拠していない場合は問題を特定します。
  • バッチ処理: 複数のファイルを一度に処理して、変換または検証を行います。
  • 効率的なワークフロー: 高速で信頼性のある変換プロセスで、時間と労力を最小限に抑えます。

PDFをPDF/Aに変換する方法

PDF文書をPDF/A形式に変換するには、次の手順に従ってください:

  1. PdfAConverterクラスのインスタンスを作成します。
  2. 変換を設定するためにPdfAConvertOptionsのインスタンスを作成します。
  3. 希望するPDF/Aバージョンを指定します(例:PDF/A-3B)。
  4. AddInputメソッドを使用して入力PDFファイルを追加します。
  5. AddOutputメソッドを使用して、生成されるPDF/Aの出力ファイルを追加します。
  6. Processメソッドを呼び出して変換を実行します。
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 入力PDFファイルを追加  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 出力PDF/Aファイルを指定  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13
14// 変換を処理  
15pdfAConverter.Process(pdfAOptions);  

PDF/A準拠の検証

PdfAValidateOptionsクラスを使用して、既存のPDFファイルのPDF/A準拠を検証できます。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7
 8// 検証するPDFファイルを追加  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 検証プロセスを実行  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13
14// 検証結果を確認  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A検証成功: " + validationResult.IsValid);  

PDF/A変換のためのバッチ処理

このプラグインはバッチ処理をサポートしており、複数のPDFファイルを一度にPDF/A準拠のために変換または検証できます。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 複数の入力PDFを追加  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// 変換されたPDF/Aの出力ファイルを指定  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15
16// バッチ変換を処理  
17pdfAConverter.Process(pdfAOptions);  

PDFからXLSへの変換ツール

Documentize PDFからXLSへの変換ツール .NET は、PDF文書をExcelスプレッドシート(XLS/XLSX)に変換するための多目的で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的かつ編集可能なスプレッドシートにシームレスに変換でき、データの操作、分析、および共有を簡素化します。

主な機能:

  • 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換します。
  • コンテンツの保持: 元の構造、レイアウト、およびフォーマットを維持します。
  • カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定できます。
  • バッチ処理: 複数のPDFファイルを同時に処理して高い効率を実現します。
  • 高度なフォーマット: 空の列を挿入したり、ワークシートの数を最小限に抑えたりします。

PDFからExcelへの変換方法

PDF文書をExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。

  1. XlsConverterクラスのインスタンスを作成します。
  2. PdfToXlsOptionsクラスを使用して変換設定を構成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して出力ファイルパスを指定します。
  5. Processメソッドを実行して変換を開始します。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換を実行
9converter.Process(options);

PDFからExcelへの変換をカスタマイズする

PdfToXlsOptionsクラスを使用すると、変換プロセスをカスタマイズできます。例えば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度なフォーマットオプションを有効にするには:

 1var options = new PdfToXlsOptions
 2{
 3    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // XLSX形式を指定
 4    WorksheetName = "MySheet",                    // ワークシートに名前を付ける
 5    InsertBlankColumnAtFirst = true               // 最初に空の列を挿入
 6};
 7
 8// 入力および出力ファイルを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// 変換を処理
13converter.Process(options);

PDFからXLSへのバッチ処理

バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその一例です。

 1var converter = new XlsConverter();
 2var options = new PdfToXlsOptions();
 3
 4// 複数の入力ファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 出力ファイルパスを指定
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を実行
13converter.Process(options);

変換結果の処理

変換プロセスの後、Processメソッドは操作の詳細を含むResultContainerオブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです。

1var resultContainer = converter.Process(options);
2
3// 出力ファイルパスにアクセス
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());

サポートされている出力形式

PdfToXlsOptions.ExcelFormat列挙型は、さまざまな出力形式を提供します。

  • XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
  • XLSM: マクロ対応のExcel形式。
  • CSV: カンマ区切りの値。
  • ODS: Open Document Spreadsheet。
  • XMLSpreadSheet2003: Excel 2003 XML形式。

PDFからDOCコンバータ

Documentize PDFからDOCコンバータ for .NET は、PDFドキュメントをDOCまたはDOCX形式に変換するために設計された強力なツールです。このプラグインは、PDFページを編集可能なMicrosoft Wordドキュメントにシームレスに変換し、コンテンツを複数のプラットフォームで再利用、編集、共有しやすくします。

主な機能:

  • DOC/DOCX変換:PDFドキュメントを編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
  • 書式の保持:変換プロセス中に元のレイアウト、テキスト、および書式を保持します。
  • バッチ処理:複数のPDFファイルを一度に変換します。
  • カスタム変換オプション:Enhanced Flowのような異なるモードで変換プロセスを微調整し、より良いレイアウトを実現します。

PDFをDOC/DOCXに変換する方法

PDFドキュメントをDOC/DOCX形式に変換するには、次の手順に従います:

  1. DocConverterクラスのインスタンスを作成します。
  2. 変換プロセスを構成するためにDocConversionOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して結果のDOC/DOCXファイルの出力ファイルパスを追加します。
  5. Processメソッドを実行して変換を実行します。
 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // 出力形式をDOCXに設定
 5    ConversionMode = ConversionMode.EnhancedFlow // レイアウトと書式を最適化
 6};
 7
 8// 入力PDFファイルを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Wordドキュメントのパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 変換を処理
15docConverter.Process(options);

カスタムオプションを使用したPDFをDOCへの変換

PDFからDOCコンバータプラグインは、変換プロセスをカスタマイズするためのいくつかのオプションを提供します。変換中のPDFのレイアウトや構造の扱いを制御するために、異なるモードから選択できます。

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // 出力形式をDOCに設定
 5    ConversionMode = ConversionMode.Precise // 元のPDFレイアウトをできるだけ忠実に保持
 6};
 7
 8// 入力PDFファイルを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 出力Wordドキュメントのパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 変換を処理
15docConverter.Process(options);

PDFをDOC/DOCXにバッチ処理で変換する

PDFからDOCコンバータはバッチ処理をサポートしており、複数のPDFファイルを一度に変換することができます。以下はバッチ変換の例です:

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// 複数の入力PDFファイルを追加
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 結果のDOCXファイルの出力ファイルパスを追加
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// バッチ変換を処理
16docConverter.Process(options);

PDFからJPEGへのコンバータ

Documentize PDFからJPEGへのコンバータ for .NETは、PDFドキュメントを高品質なJPEG画像に変換するための強力なツールです。このプラグインは、PDFページを広く使用されている画像形式に変換することで、コンテンツをプラットフォーム間でよりアクセスしやすくするように設計されています。

主な機能:

  • PDFをJPEGに変換: 全PDFドキュメントまたは特定のページを簡単にJPEG画像に変換します。
  • カスタム解像度: 高品質な出力のために解像度(例:300 dpi)を調整します。
  • ページ範囲: 変換する特定のページや範囲を選択します。
  • バッチ処理: 複数のPDFページまたは全ドキュメントを一度に変換します。
  • 迅速な変換: 最小限の労力で迅速かつ効率的なプロセスです。

PDFページをJPEGに変換する方法

PDFドキュメントをJPEG画像に変換するには、以下の手順に従います:

  1. Jpegクラスのインスタンスを作成します。
  2. 変換プロセスを構成するためにJpegOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用してJPEG画像の出力ファイルパスを指定します。
  5. Processメソッドを実行してPDFページをJPEG画像に変換します。
 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 入力PDFファイルを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// JPEG画像の出力ディレクトリを指定  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// PDFからJPEGへの変換を処理  
12converter.Process(options);  

PDFからJPEGへの変換のカスタマイズ

解像度を調整したり、ページ範囲を選択したり、画像品質を設定することで、変換プロセスをカスタマイズできます。ここでは、300 dpiでPDFの最初のページを変換する方法を示します:

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 出力解像度を300 dpiに設定し、最初のページのみを変換  
 6options.OutputResolution = 300;  
 7options.PageRange = new PageRange(1);  
 8
 9// 入力パスと出力パスを追加  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
12
13// 変換を処理  
14converter.Process(options);  

PDFからJPEGへの変換のバッチ処理

PDFからJPEGへのコンバータプラグインは、バッチ処理をサポートしており、PDFから複数のページを個別のJPEGファイルに変換できます。

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 入力PDFファイルを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 各ページの出力パスを設定  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));  
11
12// バッチ変換を処理  
13converter.Process(options);  

変換結果の扱い方

Processメソッドは、変換結果に関する情報を保持するResultContainerオブジェクトを返します。以下のように、変換されたJPEGファイルのパスを印刷できます:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// JPEG画像の出力パスを印刷  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDFをPNGに変換するツール

Documentize PDFをPNGに変換するツール for .NET は、PDF文書を高品質のPNG画像に変換するための高度なツールです。このプラグインは、PDFページを広くサポートされている画像形式に変換することで、コンテンツをより多様性のある、アクセス可能で、共有しやすいものにするために設計されています。

主な特徴:

  • PDFをPNGに変換: PDF文書全体や特定のページを迅速かつ効率的にPNG画像に変換します。
  • カスタマイズ可能な解像度: 高品質の画像出力のために、希望するDPI(例:300 DPI)を設定します。
  • バッチ処理: 複数のPDFページや文書全体を一度に変換します。
  • 簡単な出力管理: 各変換されたPNGファイルの出力ディレクトリを指定します。
  • 迅速な変換: 迅速で効率的で、設定に最小限の手間を要します。

PDFをPNGに変換する方法

PDF文書をPNG画像に変換するには、以下の手順に従います:

  1. Pngクラスのインスタンスを作成します。
  2. 変換プロセスを構成するために PngOptionsのインスタンスを作成します。
  3. AddInputメソッドを使用して、入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して、PNG画像の出力ディレクトリを指定します。
  5. Processメソッドを実行して、PDFページをPNG画像に変換します。
 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 入力PDFファイルを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
 7
 8// PNG画像の出力ディレクトリを指定  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// PDFをPNG変換を処理  
12converter.Process(options);  

PDFをPNG変換のカスタマイズ

解像度を調整したり、特定のページを選択することで、変換をカスタマイズできます。たとえば、PDFの最初のページのみを300 DPIで変換するには:

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 出力解像度を300 DPIに設定  
 6options.OutputResolution = 300;  
 7
 8// 最初のページのみを変換  
 9options.PageRange = new PageRange(1);  
10
11// 入力と出力のパスを追加  
12options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
14
15// 変換を処理  
16converter.Process(options);  

PDFをPNG変換のバッチ処理

PDFをPNGに変換するツールプラグインは、バッチ処理もサポートしており、複数のページや文書全体を個別のPNGファイルに変換できます。

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 入力PDFファイルを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 各ページの出力パスを設定  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));  
11
12// バッチ変換を処理  
13converter.Process(options);  

変換結果の処理

変換を処理した後、Processメソッドは変換結果を含むResultContainerオブジェクトを返します。PNG画像の出力パスを以下のようにプリントすることができます:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// PNG画像の出力パスをプリント  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDF to TIFF コンバータ

Documentize PDF to TIFF コンバータ for .NET は、PDF ドキュメントを高品質の TIFF 画像に変換するために設計された強力なツールです。このプラグインは、さまざまなプラットフォームでコンテンツにアクセスできるようにし、優れた忠実性と柔軟性を維持します。

主な機能:

  • PDF を TIFF に変換: PDF ドキュメント全体または特定のページを簡単に TIFF 画像に変換します。
  • カスタム解像度: 優れた品質の出力のために解像度(例:300 dpi)を調整します。
  • マルチページ TIFF: 複数の PDF ページを 1 つのマルチページ TIFF ファイルに結合します。
  • ページ範囲: 特定のページまたは範囲を変換して正確な結果を得ます。
  • バッチ処理: 複数の PDF ドキュメントまたはページを一度に変換します。
  • 迅速な変換: 最小限の労力で迅速かつ効率的なプロセスを提供します。

PDF ページを TIFF に変換する方法

PDF ドキュメントを TIFF 画像に変換するには、次のステップに従ってください:

  1. TiffConverter クラスのインスタンスを作成します。
  2. 変換プロセスを設定するために PdfToTiffOptions のインスタンスを作成します。
  3. AddInput メソッドを使用して入力 PDF ファイルを追加します。
  4. AddOutput メソッドを使用して TIFF 画像の出力ファイルパスを指定します。
  5. Process メソッドを実行して PDF ページを TIFF 画像に変換します。
 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 入力 PDF ファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// TIFF 画像の出力ファイルを指定
 8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
 9
10// PDF から TIFF への変換を処理
11converter.Process(options);

PDF から TIFF への変換をカスタマイズする

解像度を調整したり、マルチページ出力を有効にしたり、ページ範囲を選択することで、変換プロセスをカスタマイズできます。ここでは、PDF の最初のページを 300 dpi で TIFF ファイルに変換する方法を示します:

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 出力解像度を 300 dpi に設定し、最初のページのみを変換
 5options.OutputResolution = 300;
 6options.PageList = new List<int> { 1 };
 7
 8// 入力と出力のパスを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 変換を処理
13converter.Process(options);

マルチページ TIFF 作成

PDF to TIFF コンバータ プラグインは、マルチページ TIFF の生成をサポートしており、複数の PDF ページを 1 つの TIFF ファイルに結合して効率的なアーカイブや印刷が可能です。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions
 3{
 4    MultiPage = true // マルチページ TIFF 出力を有効にする
 5};
 6
 7// 入力 PDF ファイルを追加
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// マルチページ TIFF の出力ファイルを指定
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 変換を処理
14converter.Process(options);

PDF から TIFF への変換のバッチ処理

PDF to TIFF コンバータ プラグインは、バッチ処理もサポートしており、複数の PDF ページまたはドキュメント全体を同時に個別の TIFF ファイルに変換できます。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 入力 PDF ファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 個々のページの出力パスを設定
 8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// バッチ変換を処理
12converter.Process(options);

変換結果の処理方法

Process メソッドは、変換結果の詳細を提供する ResultContainer オブジェクトを返します。変換された TIFF ファイルのパスを次のように出力できます:

1ResultContainer resultContainer = converter.Process(options);
2
3// TIFF 画像の出力パスを表示
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6    Console.WriteLine(result.Data.ToString());
7}

HTML コンバータ

Documentize HTML Converter for .NET は、PDF と HTML フォーマット間で文書を変換する強力な機能を提供し、ウェブアプリケーション、アーカイブ、およびレポート生成に最適です。リソースとレイアウトを処理するための複数のオプションを備えており、コンバータはさまざまなプロジェクト要件に適応します。

主な機能

PDF から HTML への変換

PDF ファイルを HTML に変換して、ウェブベースの表示や HTML フォーマットが好まれるアプリケーションへの統合を容易にします。

HTML から PDF への変換

HTML コンテンツを高品質な PDF に変換し、印刷可能なレポートの生成、ウェブコンテンツのアーカイブ、または共有可能な文書フォーマットの作成に最適です。


詳細ガイド

PDF を HTML に変換する

PDF を HTML に変換するには:

  1. コンバータを初期化する: HtmlConverter のインスタンスを作成します。
  2. 変換オプションを設定する: PdfToHtmlOptions を使用して出力をカスタマイズし、埋め込みリソースまたは外部リソースのいずれかを選択します。
  3. 入力および出力パスを定義する: 入力 PDF と出力 HTML のパスを設定します。
  4. 変換を実行する: Process メソッドを呼び出してファイルを変換します。

例: 埋め込みリソースを持つ PDF を HTML に変換

// ステップ 1: HTML コンバータを初期化する
var converter = new HtmlConverter();

// ステップ 2: PDF から HTML への変換オプションを設定する
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);

// ステップ 3: ファイルパスを設定する
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));

// ステップ 4: 変換を実行する
converter.Process(options);

PDF から HTML への変換のための利用可能なオプション

  • SaveDataType:

    • FileWithEmbeddedResources: すべてのリソースが埋め込まれた単一の HTML ファイルを生成します。
    • FileWithExternalResources: リソースを別々に保存し、大きな HTML ファイルに最適です。
  • 出力カスタマイズ:

    • BasePath: HTML ドキュメント内のリソースのベースパスを設定します。
    • IsRenderToSinglePage: PDF のすべてのコンテンツを単一の HTML ページに描画することをオプションで可能にします。

HTML を PDF に変換する

HTML ドキュメントを PDF に変換するには、次の手順に従います:

  1. コンバータを初期化する: HtmlConverter のインスタンスを作成します。
  2. PDF オプションを設定する: HtmlToPdfOptions を使用してレイアウトとメディア設定を定義します。
  3. パスを指定する: 入力 HTML および出力 PDF のファイルパスを設定します。
  4. 変換を実行する: Process メソッドを実行して変換を完了します。

例: HTML を PDF に変換

// ステップ 1: HTML コンバータを初期化する
var converter = new HtmlConverter();

// ステップ 2: HTML から PDF への変換オプションを設定する
var options = new HtmlToPdfOptions();

// ステップ 3: ファイルパスを設定する
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));

// ステップ 4: 変換を実行する
converter.Process(options);

HTML から PDF への変換のための追加オプション

  • メディアタイプ:

    • HtmlMediaType.Print: 印刷に適した PDF を生成するために最適です。
    • HtmlMediaType.Screen: デジタルビュー用に設計されたコンテンツを変換する際に使用します。
  • レイアウト調整:

    • PageLayoutOption: HTML コンテンツが PDF レイアウトにどのように適合するかを調整します。ScaleToPageWidth などで、コンテンツを PDF 幅に合わせることができます。
    • IsRenderToSinglePage: 必要に応じて、すべての HTML コンテンツを単一の PDF ページに描画できるようにします。

このコンバータは、ウェブコンテンツに基づいて PDF レポートを生成することから、ウェブベースのアクセシビリティのために PDF ドキュメントのアーカイブを変換することまで、さまざまなアプリケーションに対応しています。より高度な設定については、完全な Documentize ドキュメントを参照してください。

FAQs

This FAQ provides comprehensive information regarding the features and functionalities of Documentize .NET Plugins, covering aspects like PDF conversion, form handling, and table of contents (TOC) generation.


General Questions

1. What is Documentize for .NET?

Documentize for .NET is a powerful library for managing and processing PDF documents programmatically. It includes plugins for converting PDFs into various formats, editing PDF forms, adding digital signatures, generating TOCs, and ensuring PDF/A compliance for long-term archival.

2. How do I install Documentize plugins for .NET?

You can install the Documentize plugins by downloading assembly files from the official website or fetching packages directly from NuGet. Detailed installation instructions are available within each plugin’s documentation.


PDF Conversion Plugins

3. How can I convert a PDF document to a Word (DOC/DOCX) file?

To convert a PDF document into Word format using the PDF to DOC Converter:

  1. Instantiate the PdfDoc class.
  2. Create a PdfToDocOptions object to configure conversion options.
  3. Add input PDF and output DOC/DOCX file paths.
  4. Call the Process method to execute the conversion.

4. How do I convert PDF pages into JPEG images?

Using the PDF to JPEG Converter:

  1. Create an instance of the Jpeg class.
  2. Set conversion options (e.g., resolution, page range) via JpegOptions.
  3. Add input/output file paths.
  4. Call the Jpeg.Process method to run the conversion.

5. How do I convert a PDF to PNG?

To convert a PDF into PNG format:

  1. Create an instance of the Png class and a PngOptions object.
  2. Add the input PDF and specify the output folder.
  3. Set options such as resolution (e.g., 300 DPI).
  4. Call the Process method to generate PNG images.

6. How do I convert a PDF to Excel (XLS/XLSX)?

For converting PDF to Excel:

  1. Instantiate the PdfXls class.
  2. Use PdfToXlsOptions to configure input/output paths and conversion options.
  3. Call the Process method to start the conversion.

7. How do I convert a PDF to HTML?

To convert PDF documents into HTML:

  1. Create an instance of the PdfHtml class.
  2. Configure conversion options with PdfToHtmlOptions or HtmlToPdfOptions.
  3. Add input/output paths and call the Process method.

PDF Form Handling

8. How can I edit PDF forms with the Form Editor?

The PDF Form Editor provides capabilities to:

  • Add fields (FormEditorAddOptions).
  • Update fields (FormEditorSetOptions).
  • Remove fields (FormRemoveSelectedFieldsOptions). After configuring the form fields, run the Process method.

9. How do I flatten PDF forms?

To flatten form fields:

  1. Instantiate the FormFlattener class.
  2. Use FormFlattenAllFieldsOptions to flatten all fields or FormFlattenSelectedFieldsOptions to target specific fields.
  3. Add input/output files and call the Process method.

10. How can I export data from PDF forms?

To export form data, use the PDF Form Exporter. Create a FormExporterValuesToCsvOptions object, specify form field conditions, and run the Process method to export the data into CSV format.


PDF/A and TOC Management

11. How do I convert a PDF to PDF/A format?

For converting PDFs into PDF/A:

  1. Use the PdfAConverter class.
  2. Configure the PDF/A version (e.g., PDF/A-3B) in PdfAConvertOptions.
  3. Add input/output paths and call the Process method.

12. How do I generate a Table of Contents (TOC) in a PDF?

To create a TOC:

  1. Create an instance of the TocGenerator class.
  2. Use TocOptions to define TOC parameters.
  3. Add input/output files and run the Process method.

Signature Handling

13. How can I digitally sign a PDF document?

To add a digital signature:

  1. Instantiate the Signature class.
  2. Use SignOptions to configure the PFX file, password, and signature details (e.g., reason, contact info).
  3. Add input/output files and run the Process method.

Additional Features

14. Can I split PDF files using Documentize?

Yes, using the PDF Splitter:

  1. Instantiate the Splitter class.
  2. Configure split options using SplitOptions.
  3. Add input/output paths and call the Process method.

15. How do I merge multiple PDF files into one?

To merge PDFs:

  1. Instantiate the Merger class.
  2. Add input PDFs and specify an output file via MergeOptions.
  3. Run the Process method to merge the files.

16. Is Documentize limited to working with PDFs only?

While Documentize primarily focuses on PDF manipulation, it also supports conversions to and from formats such as DOC, XLS, HTML, JPEG, and PNG.


Licensing and Compatibility

17. What are the system requirements for using Documentize plugins?

Documentize supports:

  • Operating Systems: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), and Linux.
  • Frameworks: .NET Framework 4.0 to 8.0.
  • IDE: Compatible with various versions of Visual Studio.

18. How do I set license keys for Documentize?

To activate a plugin, reference Documentize in your project and set the license keys before calling any methods. Refer to the specific plugin’s documentation for detailed instructions.

19. Where can I find more examples and documentation for Documentize plugins?

Complete API documentation and examples can be found on the Documentize website or through the NuGet packages within your development environment.


 日本語