Overview

Documentize は、.NET アプリケーション内で PDF ドキュメントを管理するための SDK を提供する包括的なプラットフォームです。これらの SDK は、PDF 処理に関連する複雑なタスクを簡素化し、ドキュメントのワークフローを改善し、ユーザーにとって直感的で効率的なものにします。以下はその主な機能の概要です:

コア機能

  • PDF 変換:

    • PDF を Microsoft Word (DOC/DOCX)、Excel (XLS/XLSX)、HTML、JPEG、PNG などの複数のフォーマットに変換します。
    • 長期保管と保存基準の遵守に理想的な PDF/A 形式への変換をサポートします。
  • ドキュメント操作:

    • PDF の結合と分割: 複数の PDF ファイルを簡単に統合したり、大きなドキュメントをより扱いやすい小さな部分に分割したりします。
    • PDF の最適化: コンテンツの品質を損なうことなく、ファイルサイズを削減するために PDF ドキュメントを圧縮および強化します。
  • テキスト抽出:

    • 構造化データと非構造化データフォーマットの両方をサポートし、正確にテキストを抽出します。
  • デジタル署名:

    • PDF ドキュメントにデジタル署名を行い、その真正性と完全性を保証し、機密ファイルに対してセキュリティと信頼を提供します。

専門 SDK

  • PDF to DOC Converter: PDF コンテンツを正確に編集可能な Word ドキュメントに変換し、フォーマットとレイアウトを維持します。
  • PDF to Excel Converter: PDF から表データを抽出し、さらにデータ分析のために Excel スプレッドシートに変換します。
  • ChatGPT 統合: ChatGPT とのインタラクションを可能にし、PDF 内に会話型 AI の応答を埋め込んでユニークなドキュメントの拡張を提供します。

使用法と互換性

Documentize SDK は、.NET アプリケーション へのシームレスな統合のために構築されており、WindowsmacOS、および Linux を含む複数のプラットフォームをサポートしています。これらの SDK は、さまざまなドキュメント処理要件に応える柔軟で強力な API を提供し、高いパフォーマンスと信頼性を確保します。

SDK およびプロジェクトへの統合に関する詳細情報は、公式ウェブサイト をご覧ください。

Overviewのサブセクション

インストール

Documentize SDKは、さまざまな開発環境や好みに合わせた複数の方法でインストールできます。以下はDocumentizeをインストールするための推奨方法です。

1. NuGet(推奨方法)

NuGetはDocumentizeをインストールするための最も簡潔で推奨される方法であり、常に最新のバージョンとアップデートを開発環境内で直接取得できます。このインストール方法の詳細については、NuGetを使用してDocumentize SDKをインストールする方法を確認してください。

2. MSIインストーラー

MSIインストーラーは、DocumentizeのDLLをシステムに直接インストールしたい方にとって便利なオプションです。この方法は、DLLファイルを手動で管理することなく、複数のプロジェクトでDocumentizeを使用したい開発者に最適です。このインストール方法の詳細については、MSIを使用してDocumentize SDKをインストールする方法を確認してください。

3. ZIPアーカイブ

手動でのアプローチを好む開発者のために、ZIPアーカイブにはDocumentizeのDLLが含まれており、これを抽出してプロジェクトに直接追加できます。このインストール方法の詳細については、ZIPを使用してDocumentize SDKをインストールする方法を確認してください。

2025/07/25

インストールのサブセクション

System Requirements

Documentize SDKsは、.NETアプリケーションと統合するように設計されており、さまざまなオペレーティングシステムと開発環境をサポートしています。以下は主要なシステム要件です。

サポートされているオペレーティングシステム

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003からWindows Server 2022 (x64, x86)
  • クラウド: Microsoft Azure

macOS

  • macOS 10.12 (Sierra)以降

Linux

  • 複数のLinuxディストリビューションと互換性があります:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Android 8.0 (Oreo)以降をサポートしています。

開発環境

  • Microsoft Visual Studio:
    • Visual Studio 2010以降(2019および2022を含む)
  • .NETプラットフォームをターゲットとした任意の開発環境をサポートします。

サポートされている.NETフレームワーク

  • .NET Framework 4.0以上
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

追加の注意事項

  • Adobe AcrobatはDocumentize SDKsを実行するためには必要ありませんが、PDFを表示するために推奨されます。
2025/07/25

Declaration

Documentize.com SDKは、.NETアプリケーション内で使用する際にフルトラストの権限セットを必要とします。この権限レベルは、SDKがレジストリ設定、システムファイルにアクセスしたり、フォントを解析したりするなどの特定のシステムレベルの操作を実行するために不可欠です。

フルトラストが必要な理由

Documentize SDKは、.NETのコアシステムクラスを利用しており、以下の理由からしばしば昇格された権限が必要です:

  • レジストリアクセス: 一部の操作では、システムレジストリの読み取りまたは書き込みが必要な場合があります。
  • システムファイル: フォントの処理やファイル操作の実行など、特定のタスクにはアプリケーションの仮想ディレクトリを超えるシステムファイルへのアクセスが必要です。

ミディアムトラスト環境の制限

ミディアムトラストセキュリティを強制するホスティング環境では、いくつかの重要な権限が制限または利用できなくなります。このため、そのような環境ではSDKが正しく機能しない可能性があります。ミディアムトラストの下で適用される制限は以下の通りです:

  • OleDbPermission: ADO.NET管理OLE DBデータプロバイダーを使用してデータベースにアクセスすることはできません。
  • EventLogPermission: Windowsイベントログへのアクセスは禁止されています。
  • ReflectionPermission: リフレクションの使用が禁止され、特定の動的操作に影響を与える可能性があります。
  • RegistryPermission: システムレジストリへのアクセスが拒否されています。
  • WebPermission: 通信は、<trust>要素に設定された事前定義されたアドレスまたは範囲に制限されています。
  • FileIOPermission: アプリケーションの仮想ディレクトリ内のファイルへのアクセスに制限されています。
2025/07/25

非Windows環境

Documentize SDKsは**.NET Standard 2.0**をサポートしており、Linuxやその他の非Windows環境で動作する.NET Coreアプリケーションで使用できます。最適なパフォーマンスと正しいテキストレンダリングを保証するために、以下の手順に従ってください。

Linuxの推奨セットアップ

1. libgdiplusパッケージをインストール

このパッケージはPDFのレンダリングと処理に必要なGDI+機能を提供します。ターミナルで以下のコマンドを実行してインストールできます:

sudo apt-get install libgdiplus

2. Microsoft互換フォントをインストール

正しいテキストレンダリングのために、以下のコマンドを使用してMicrosoft TrueTypeフォントをインストールします:

sudo apt-get install ttf-mscorefonts-installer

これらのフォントは/usr/share/fonts/truetype/msttcorefontsディレクトリに置く必要があります。システムが異なるディレクトリにフォントを保存している場合は、Documentize SDKsを使用する前にコード内でパスを更新してください:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));

ヒント

これらのインストールが完了し、フォントパスが正しく設定されていることを確認することで、Linuxやその他の非Windowsシステム上でDocumentize SDKsのパフォーマンスを最大化できます。

2025/07/25

ライセンスと評価

Documentize for .NETを評価する

Documentize製品の使用を開始すると、無料の評価ライセンスですぐに利用可能です。このライセンスにより、開発者や企業は購入前にDocumentizeの機能を探検、テスト、およびアプリケーションへの統合ができます。

評価ライセンスとは?

評価ライセンスは、すべてのDocumentize製品に含まれる無制限のトライアルモードです。これにより、実際のシナリオで製品の機能を完全に評価するために、ほとんどのコア機能にアクセスできます。ドキュメントの生成、編集、変換を行うかどうかに関係なく、パフォーマンスとスタックとの統合をテストできます。

評価ライセンスの主な機能

  • インストール不要 – Documentize製品をダウンロードしてすぐに使用開始できます。
  • 🧪 コア機能を探求 – ドキュメントの変換、操作、エクスポートなどの重要な機能をテストします。
  • 💻 開発者フレンドリー – プルーフ・オブ・コンセプト(POC)、統合テスト、または技術評価に最適です。
  • 🔁 簡単にアップグレード – 実装を変更することなく、いつでも完全なライセンスに切り替えます。

フルライセンスにアップグレードするには、次のコードを追加します:

License.Set("path_to_your_license_file.lic");

評価モードの制限

評価ライセンスは広範なアクセスを提供しますが、ライセンス製品を保護するためにいくつかの制限があります。

  • 生成されたPDFドキュメントのすべてのページには透かしが入ります。
  • 評価版では、ドキュメントの最初の4ページのみ処理できます。
  • 評価ライセンスは、プロダクションまたは商業展開を目的としていません。

制限なしで完全にアクセスするには、有効なDocumentizeライセンスを購入する必要があります。それをプロジェクト内で適用してください。

評価ライセンスの使用方法

特別な設定は必要ありません。希望のDocumentize SDKをダウンロードし、それを使用し始めるだけです。ライセンスファイルが適用されていない場合、製品は自動的に評価モードで実行されます。

有効なライセンスでの動作をテストするには、一時的なフル機能のライセンスをリクエストして、詳細な評価を行うこともできます。

評価ライセンスを使用すべき場合

次のような場合には評価ライセンスを使用するべきです。

  • Documentizeの機能を初めて探索している場合。
  • アプリケーションやプラットフォームとの互換性を確認したい場合。
  • 購入前にプロトタイプやプルーフ・オブ・コンセプトを構築する必要がある場合。
  • ドキュメント自動化ソリューションを比較している場合。

今日からDocumentizeを始めよう

Documentize製品をリスクなしで評価し、どのようにドキュメントワークフローを改善できるか確認しましょう。プロダクションに移行する準備ができたら、フルライセンスへのアップグレードは迅速でシームレスです。

📘 サポートが必要ですか?当社のドキュメンテーションを訪れるか、お問い合わせください。

2025/08/15

Developer's Guide

PDF Converter

PDF to HTML

Documentizeの.NETツールを使用してPDFをHTMLに変換します。レイアウトとフォーマットを保持し、一貫性のあるプロフェッショナルな結果を得ることができます。

PDF to DOC

Documentizeの.NETツールでPDFをWord文書に変換—編集が容易になるように書式と構造を保持します。

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF to HTML

Documentizeの.NETツールを使用してPDFをHTMLに変換します。レイアウトとフォーマットを保持し、一貫性のあるプロフェッショナルな結果を得ることができます。

PDF to DOC

Documentizeの.NETツールでPDFをWord文書に変換—編集が容易になるように書式と構造を保持します。

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF to JPEG

Documentizeの.NETツールを使用してPDFをJPEG画像に変換します。文書から高品質の画像を簡単に抽出します。

PDF to PDF/A

Documentizeの.NETツールを使用してPDFをPDF/A形式に変換—長期的なアーカイブと遵守を簡単に実現します。

PDF to PNG

Documentizeの.NETツールを使用してPDFをPNG画像に変換します。ウェブやグラフィック用途のために高品質な画像を抽出します。

PDF to TIFF

Documentizeの.NETツールを使用してPDFをTIFF画像に変換します。プロフェッショナルな文書管理のために高解像度の画像を抽出します。

PDF to XLS

Documentizeの.NETツールを使用してPDFをExcelに変換します。テーブルとデータを迅速に抽出し、シームレスな分析と処理を実現します。

PDF Manager

Merge PDF

Documentizeの.NETツールを使用してPDFを簡単にマージ—複数のファイルを1つに結合し、品質と構造を維持します。

Split PDF

Documentizeの.NETツールを使ってPDFを手軽に分割—ページを抽出し、新しいファイルを作成し、正確に文書を管理します

Optimize PDF

Documentizeの.NETツールを使用して、PDFを簡単に最適化—ファイルサイズを削減し、パフォーマンスを向上させ、品質を維持

Add Table

Documentizeの.NETツールを使用して、プロフェッショナルなPDFテーブルを生成します—レイアウト、スタイル、およびデータを簡単にカスタマイズできます。

Merge PDF

Documentizeの.NETツールを使用してPDFを簡単にマージ—複数のファイルを1つに結合し、品質と構造を維持します。

Split PDF

Documentizeの.NETツールを使ってPDFを手軽に分割—ページを抽出し、新しいファイルを作成し、正確に文書を管理します

Optimize PDF

Documentizeの.NETツールを使用して、PDFを簡単に最適化—ファイルサイズを削減し、パフォーマンスを向上させ、品質を維持

Add Table

Documentizeの.NETツールを使用して、プロフェッショナルなPDFテーブルを生成します—レイアウト、スタイル、およびデータを簡単にカスタマイズできます。

Add TOC

PDF文書の整理とナビゲーションを向上させるために、目次 (TOC) を動的に生成します

Use ChatGPT

AIを使用してDocumentizeのChatGPT統合を用いてPDFを強化し、インテリジェントにコンテンツを生成、編集、分析します。

PDF セキュリティ

Encrypt

Documentizeの.NETツールを使用してPDFファイルを暗号化し、機密情報を保護してください。

Decrypt

Documentizeを使用してPDFファイルを復号化し、ドキュメントを開きます。

サイン

Documentizeの.NETツールを使ってPDFファイルにデジタル署名を付ける—安全性、信頼性、コンプライアンスを簡単に確保します。

Encrypt

Documentizeの.NETツールを使用してPDFファイルを暗号化し、機密情報を保護してください。

Decrypt

Documentizeを使用してPDFファイルを復号化し、ドキュメントを開きます。

サイン

Documentizeの.NETツールを使ってPDFファイルにデジタル署名を付ける—安全性、信頼性、コンプライアンスを簡単に確保します。

PDF抽出ツール

テキスト抽出

Documentize の .NET ツールを使用して PDF ドキュメントからテキストを正確に抽出し、コンテンツを簡単に取得、処理、分析できます。

画像の抽出

.NET アプリケーションから PDF ドキュメントの画像を手軽に抽出

テキスト抽出

Documentize の .NET ツールを使用して PDF ドキュメントからテキストを正確に抽出し、コンテンツを簡単に取得、処理、分析できます。

画像の抽出

.NET アプリケーションから PDF ドキュメントの画像を手軽に抽出

プロパティの抽出 / メタデータ

Documentize を使用して C#/.NET で PDF からメタデータを正確に抽出

フォームデータのエクスポート

PDF フォーム(AcroForms)からデータを抽出し、C#/.NET を使用して CSV などの他の形式にエクスポートします

PDF フォーム

フォームフィールドのフラッテン化

インタラクティブな PDF フォームを編集不可なドキュメントに変換し、許可されていない改ざんから保護します

フォームフィールドのフラッテン化

インタラクティブな PDF フォームを編集不可なドキュメントに変換し、許可されていない改ざんから保護します

2025/07/25

Developer's Guideのサブセクション

PDF Converter

PDF to HTML

Documentizeの.NETツールを使用してPDFをHTMLに変換します。レイアウトとフォーマットを保持し、一貫性のあるプロフェッショナルな結果を得ることができます。

PDF to DOC

Documentizeの.NETツールでPDFをWord文書に変換—編集が容易になるように書式と構造を保持します。

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF to JPEG

Documentizeの.NETツールを使用してPDFをJPEG画像に変換します。文書から高品質の画像を簡単に抽出します。

PDF to PDF/A

Documentizeの.NETツールを使用してPDFをPDF/A形式に変換—長期的なアーカイブと遵守を簡単に実現します。

PDF to PNG

Documentizeの.NETツールを使用してPDFをPNG画像に変換します。ウェブやグラフィック用途のために高品質な画像を抽出します。

PDF to TIFF

Documentizeの.NETツールを使用してPDFをTIFF画像に変換します。プロフェッショナルな文書管理のために高解像度の画像を抽出します。

PDF to XLS

Documentizeの.NETツールを使用してPDFをExcelに変換します。テーブルとデータを迅速に抽出し、シームレスな分析と処理を実現します。

PDF Converterのサブセクション

PDF to HTML

Documentize PDF Converter for .NET は、ドキュメントをPDFからHTML形式に変換するための堅牢な機能を提供し、ウェブアプリケーション、アーカイブ、レポート生成に最適です。リソースとレイアウトの処理に関する複数のオプションを備えたこのコンバータは、さまざまなプロジェクト要件に適応します。

PDFをHTMLに変換する

PDFファイルをHTMLに変換して、ウェブベースの表示やHTML形式が優先されるアプリケーションへの統合を行います。

  1. オプションを設定: PdfToHtmlOptionsを使用して出力をカスタマイズし、埋め込みリソースまたは外部リソースを選択します。
  2. 入力と出力のパスを定義: 入力PDFと出力HTMLのパスを設定します。
  3. 変換を実行: PdfConverterConvertメソッドを呼び出してファイルを変換します。

例:埋め込みリソースを使用してPDFをHTMLに変換する

1  
2// 埋め込みリソースを持つファイルとして出力データ型を設定するPdfToHtmlOptionsオブジェクトを作成  
3var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);  
4// 入力ファイルパスを追加  
5options.AddInput(new FileDataSource("path_to_input.pdf"));  
6// 出力ファイルパスを設定  
7options.AddOutput(new FileDataSource("path_to_output.html"));  
8// プロセスを実行  
9PdfConverter.Convert(options);  

PDFをHTMLに変換するための利用可能なオプション

  • SaveDataType:
    • FileWithEmbeddedResources: すべてのリソースが埋め込まれた単一のHTMLファイルを生成します。
    • FileWithExternalResources: リソースを別々に保存し、大きなHTMLファイルに最適です。

PDF to DOC

Documentize PDF Converter for .NETは、PDF文書をDOCまたはDOCX形式に変換するために設計された強力なツールです。このプラグインは、PDFページを編集可能なMicrosoft Word文書にシームレスに変換し、複数のプラットフォームでコンテンツを再利用、編集、および共有しやすくします。

PDFをDOC/DOCXに変換する方法

PDF文書をDOC/DOCX形式に変換するには、以下の手順に従ってください。

  1. PdfToDocOptionsのインスタンスを作成して、変換プロセスを構成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して、結果ファイルの出力ファイルパスを追加します。
  4. Convertメソッドを実行して変換を実行します。
1// 指示を設定するためにPdfToDocOptionsオブジェクトを作成
2var options = new PdfToDocOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 処理を実行
8PdfConverter.Convert(options);

カスタムオプションでPDFをDOCに変換する

PDF to DOC Converterプラグインは、変換プロセスをカスタマイズするためのいくつかのオプションを提供します。異なるモードの中から選択して、変換中にPDFのレイアウトと構造の操作方法を制御できます。

 1// 指示を設定するためにPdfToDocOptionsオブジェクトを作成
 2var options = new PdfToDocOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ファイルパスを設定
 6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
 7// モードを設定
 8options.Mode = DocConversionMode.Flow;
 9// 処理を実行
10PdfConverter.Convert(options);

主な特徴:

  • DOC/DOCX変換: PDF文書を編集可能なMicrosoft Word形式(DOCまたはDOCX)に変換します。
  • 書式の維持: 変換プロセス中に元のレイアウト、テキスト、および書式を保持します。
  • カスタム変換オプション: より良いレイアウトのためにEnhanced Flowのような異なるモードで変換プロセスを微調整します。

HTML to PDF

Documentize PDF Converter for .NET は、ウェブアプリケーション、アーカイブ、レポート生成に最適なHTMLからPDF形式へのドキュメント変換のための強力な機能を提供します。リソースとレイアウトを扱うための複数のオプションを使用して、コンバータはさまざまなプロジェクト要件に適応します。

HTMLをPDFに変換する

HTMLコンテンツを高品質のPDFに変換します。印刷可能なレポートの生成、ウェブコンテンツのアーカイブ、共有可能なドキュメント形式の作成に最適です。 HTMLドキュメントをPDFに変換するには、以下の手順に従ってください。

  1. オプションの設定: HtmlToPdfOptionsを使用してレイアウトとメディア設定を定義します。
  2. パスの指定: 入力HTMLおよび出力PDFファイルのパスを設定します。
  3. 変換の実行: PdfConverterConvertメソッドを実行してファイルを変換します。

例: HTMLをPDFに変換する

1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);

HTMLからPDFへの変換のための追加オプション

  • メディアタイプ:

    • HtmlMediaType.Print: 印刷に適したPDFを生成するのに最適です。
    • HtmlMediaType.Screen: デジタル表示用に設計されたコンテンツを変換する際に使用します。
  • レイアウト調整:

    • PageLayoutOption: HTMLコンテンツがPDFレイアウトにどのようにフィットするかを調整します。例えば、ScaleToPageWidthを使用してコンテンツがPDFの幅にスケールするようにします。
    • IsRenderToSinglePage: 必要に応じて、全てのHTMLコンテンツを一つのPDFページにレンダリングすることを可能にします。

このコンバータは、ウェブコンテンツに基づくPDFレポートの生成から、ウェブベースのアクセシビリティのためのPDFドキュメントのアーカイブ変換まで、さまざまなアプリケーションに対応することができます。より高度な設定については、完全なDocumentizeドキュメントを参照してください。

PDF to JPEG

Documentize PDF Converter for .NET は、PDF文書を高品質のJPEG画像に変換するための強力なツールです。このプラグインは、PDFページを広く使用されている画像形式に変換することで、プラットフォーム間でコンテンツをよりアクセスしやすくします。

PDFページをJPEGに変換する方法

PDF文書をJPEG画像に変換するには、以下の手順に従ってください。

  1. PdfToJpegOptions のインスタンスを作成して、変換プロセスを設定します。
  2. AddInput メソッドを使用して、入力PDFファイルを追加します。
  3. AddOutput メソッドを使用して、JPEG画像の出力ディレクトリパスを設定します。
  4. Convert メソッドを実行して、PDFページをJPEG画像に変換します。
1// PdfToJpegOptionsオブジェクトを作成して指示を設定
2var options = new PdfToJpegOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 出力ディレクトリパスを設定
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// プロセスを実行
8PdfConverter.Convert(options);

PDFからJPEG変換のカスタマイズ

解像度の調整、ページ範囲の選択、または画像品質の設定で、変換プロセスをカスタマイズできます。以下は、200 DPIでPDFの最初のページを変換する方法です:

 1// PdfToJpegOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToJpegOptions();
 3// 最初のページのみ処理
 4options.PageList = [1];
 5// 出力解像度を200 DPIに設定
 6options.OutputResolution = 200;
 7// 出力品質を50に設定
 8options.Quality = 50;
 9// 入力ファイルパスを追加
10options.AddInput(new FileDataSource("path_to_input.pdf"));
11// 出力ディレクトリパスを設定
12options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
13// プロセスを実行
14PdfConverter.Convert(options);

ディレクトリを使用せず、またはストリームの形式で結果を取得する方法

Convert メソッドは、変換結果に関する情報を保持する ResultContainer オブジェクトを返します。以下のように、変換されたJPEGファイルのストリームを取得できます。

 1// PdfToJpegOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToJpegOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// プロセスを実行
 6var results = PdfConverter.Convert(options);
 7// ストリーム結果を取得
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主な機能:

  • PDFをJPEGに変換: 文書全体や特定のページを簡単にJPEG画像に変換します。
  • カスタム解像度: 出力の高品質のために解像度(例: 300 dpi)を調整します。
  • ページセット: 変換する特定のページを選択します。
  • 迅速な変換: 最小限の労力で迅速かつ効率的なプロセス。

PDF to PDF/A

Documentize PDF Converter for .NET は、PDFドキュメントをPDF/A形式に変換するために設計された強力なツールであり、コンテンツが長期的なアーカイブ基準を満たすことを保証します。このプラグインは、PDF/A準拠のための既存のPDFドキュメントの検証もサポートしており、変換と検証機能を1つのソリューションで提供します。

PDFをPDF/Aに変換する方法

PDFドキュメントをPDF/A形式に変換するには、次の手順を実行します。

  1. 変換を設定するための PdfToPdfAOptions のインスタンスを作成します。
  2. 必要なPDF/Aバージョンを指定します(例: PDF/A-3B)。
  3. AddInput メソッドを使用して入力PDFファイルを追加します。
  4. AddOutput メソッドを使用して生成されるPDF/Aの出力ファイルを追加します。
  5. Convert メソッドを呼び出して変換を実行します。
 1// 変換プロセスを設定するためのオプションクラスを作成します
 2var options = new PdfToPdfAOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// ソースファイルを追加します
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // 実際のファイルパスに置き換えてください
 9
10// 変換されたファイルを保存するパスを追加します
11options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
12
13// 変換を実行します
14PdfConverter.Convert(options);

PDF/A準拠の検証

PdfAValidateOptions クラスを使用して既存のPDFファイルのPDF/A準拠を検証できます。

 1// 検証プロセスを設定するためのオプションクラスを作成します
 2var options = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// 検証する1つまたは複数のファイルを追加します
 8options.AddInput(new FileDataSource("path_to_your_first_pdf_file.pdf")); // 実際のファイルパスに置き換えてください
 9options.AddInput(new FileDataSource("path_to_your_second_pdf_file.pdf"));
10// 必要に応じて追加のファイルを追加します
11
12// 検証を実行し、結果を取得します
13var resultContainer = PdfConverter.Validate(options);
14
15// 各ファイルの検証結果について resultContainer.ResultCollection プロパティを確認します:
16for (var i = 0; i < resultContainer.ResultCollection.Count; i++)
17{
18    var result = resultContainer.ResultCollection[i];
19    var validationResult = (PdfAValidationResult) result.Data;
20    var isValid = validationResult.IsValid; // i 番目の文書の検証結果
21}

主な機能:

  • PDF/Aに変換: PDFファイルをPDF/A形式(PDF/A-1a、PDF/A-2b、PDF/A-3bなど)にシームレスに変換し、アーカイブ基準の遵守を確保します。
  • PDF/A準拠の検証: 既存のPDFドキュメントがPDF/A基準に準拠しているかを確認し、準拠していない場合は問題を特定します。
  • 効率的なワークフロー: 高速で信頼性のある変換プロセスで時間と労力を最小限に抑えます。

PDF to PNG

Documentize PDF Converter for .NETは、PDFドキュメントを高品質なPNG画像に変換するための高度なツールです。このプラグインは、PDFページを広くサポートされている画像形式に変換することで、コンテンツをより多用途でアクセスしやすく、共有しやすくするように設計されています。

PDFをPNGに変換する方法

PDFドキュメントをPNG画像に変換するには、次の手順に従います。

  1. コンバージョンプロセスを設定するためにPdfToPngOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用してPNG画像の出力ディレクトリパスを設定します。
  4. Convertメソッドを実行してPDFページをPNG画像に変換します。
1// 指示を設定するためにPdfToPngOptionsオブジェクトを作成
2var options = new PdfToPngOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 出力ディレクトリパスを設定
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// プロセスを実行
8PdfConverter.Convert(options);

PDFからPNGへの変換のカスタマイズ

解像度を調整し、特定のページを選択することで変換をカスタマイズできます。たとえば、PDFの最初のページだけを200 DPIで変換するには:

 1// 指示を設定するためにPdfToPngOptionsオブジェクトを作成
 2var options = new PdfToPngOptions()
 3// 最初のページのみを処理
 4options.PageList = [1];
 5// 出力解像度を200 DPIに設定
 6options.OutputResolution = 200;
 7// 入力ファイルパスを追加
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 出力ディレクトリパスを設定
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// プロセスを実行
12PdfConverter.Convert(options);

変換結果の処理

Convertメソッドは、変換結果に関する情報を保持するResultContainerオブジェクトを返します。以下のように、変換されたPNGファイルのストリームを取得できます:

 1// 指示を設定するためにPdfToJpegOptionsオブジェクトを作成
 2var options = new PdfToPngOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// プロセスを実行
 6var results = PdfConverter.Convert(options);
 7// ストリーム結果を取得
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主な機能:

  • PDFをPNGに変換: PDFドキュメント全体または特定のページを迅速かつ効率的にPNG画像に変換します。
  • カスタマイズ可能な解像度: 高品質な画像出力のために希望のDPI(例:300DPI)を設定します。
  • ページセット: 変換する特定のページを選択します。
  • 簡単な出力管理: 変換された各PNGファイルの出力ディレクトリを指定します。
  • 迅速な変換: 高速で効率的で、設定に最小限の労力がかかります。

PDF to TIFF

Documentize PDF Converter for .NET は、PDF文書を高品質のTIFF画像に変換するために設計された強力なツールです。このプラグインは、素晴らしい忠実度と多様性を維持しながら、さまざまなプラットフォームでコンテンツにアクセスできるようにします。 解像度の調整、複数ページ出力の有効化、またはページの選択によって変換プロセスをカスタマイズできます。

PDFをTIFFに変換する方法

PDF文書をTIFF画像に変換するには、次の手順に従います:

  1. PdfToTiffOptionsのインスタンスを作成して、変換プロセスを構成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用してTIFF画像の出力ファイルパスを指定します。
  4. Convertメソッドを実行してPDFページをTIFF画像に変換します。
1// PdfToTiffOptionsオブジェクトを作成して指示を設定
2var options = new PdfToTiffOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ディレクトリパスを設定
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// プロセスを実行
8PdfConverter.Convert(options);

PDFからTIFFへの変換のページとDPIのカスタマイズ

400 DPIでPDFの2ページをTIFFファイルに変換する方法は次の通りです:

 1// PdfToTiffOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToTiffOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ディレクトリパスを設定
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// ページを設定
 8options.PageList = [1, 3];
 9// 結果の画像解像度を設定
10options.OutputResolution = 400;
11// プロセスを実行
12PdfConverter.Convert(options);

マルチページTIFFの作成

このプラグインは、マルチページTIFFの生成をサポートしており、複数のPDFページを1つのTIFFファイルにまとめて、効率的なアーカイブまたは印刷を可能にします。

 1// PdfToTiffOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToTiffOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ディレクトリパスを設定
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// マルチページTIFF出力を有効にする
 8options.MultiPage = true;
 9// プロセスを実行
10PdfConverter.Convert(options);

PDFからTIFFへの変換のページとDPIのカスタマイズ

400 DPIでPDFの2ページをTIFFファイルに変換する方法は次の通りです:

 1// PdfToTiffOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToTiffOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ディレクトリパスを設定
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 圧縮とカラーデプスを設定
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// プロセスを実行
11PdfConverter.Convert(options);

変換結果の処理方法

Convert メソッドは、変換結果の詳細を提供する ResultContainer オブジェクトを返します。以下のように、変換されたTIFFファイルのストリームを取得できます:

 1// PdfToTiffOptionsオブジェクトを作成して指示を設定
 2var options = new PdfToTiffOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// プロセスを実行
 6var results = PdfConverter.Convert(options);
 7// ストリーム結果を取得
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主な機能:

  • PDFをTIFFに変換: PDF文書全体または特定のページをTIFF画像に簡単に変換できます。
  • カスタム解像度: 優れた品質の出力のために解像度(例:300 dpi)を調整できます。
  • マルチページTIFF: 複数のPDFページを1つのマルチページTIFFファイルにまとめます。
  • ページの設定: 特定のページを選択して変換します。
  • 迅速な変換: 最小限の労力で迅速かつ効率的なプロセス。

PDF to XLS

Documentize PDF Converter for .NETは、PDFドキュメントをExcelスプレッドシート(XLSX/XLS/CSV/XLSM/ODS)に変換するための多用途で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的かつ編集可能なスプレッドシートにシームレスに変換し、データの操作、分析、共有を簡素化できます。

PDFをExcelに変換する方法

PDFドキュメントをExcelファイル(XLSX)に変換するには、次の手順に従います。

  1. PdfToXlsOptionsクラスを使用して変換設定を構成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して出力ファイルパスを指定します。
  4. Convertメソッドを実行して変換を開始します。
1// 指示を設定するためのPdfToXlsOptionsオブジェクトを作成
2var options = new PdfToXlsOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルパスを設定
6options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));
7// 処理を実行
8PdfConverter.Convert(options);

PDFからExcelへの変換のカスタマイズ

PdfToXlsOptionsクラスを使用すると、変換プロセスをカスタマイズできます。たとえば、PDFをXLSファイルに変換し、高度なフォーマットオプションを有効にするには:

 1// 指示を設定するためのPdfToXlsOptionsオブジェクトを作成
 2var options = new PdfToXlsOptions();
 3// 入力ファイルパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// XLSフォーマットを指定
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// 出力ファイルパスを設定
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 処理を実行
12PdfConverter.Convert(options);

サポートされている出力形式

PdfToXlsOptions.ExcelFormat列挙体は、さまざまな出力形式を提供します:

  • XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
  • XLSM: マクロ対応Excelフォーマット。
  • CSV: カンマ区切り値。
  • ODS: オープンドキュメントスプレッドシート。
  • XMLSpreadSheet2003: Excel 2003 XML (.xls)ファイル形式。

主な機能:

  • 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換。
  • コンテンツの保持: 元の構造、レイアウト、フォーマットを維持。
  • 高度なフォーマット: 空の列を挿入したり、ワークシートの数を最小限に抑えたりできます。

PDF Manager

Merge PDF

Documentizeの.NETツールを使用してPDFを簡単にマージ—複数のファイルを1つに結合し、品質と構造を維持します。

Split PDF

Documentizeの.NETツールを使ってPDFを手軽に分割—ページを抽出し、新しいファイルを作成し、正確に文書を管理します

Optimize PDF

Documentizeの.NETツールを使用して、PDFを簡単に最適化—ファイルサイズを削減し、パフォーマンスを向上させ、品質を維持

Add Table

Documentizeの.NETツールを使用して、プロフェッショナルなPDFテーブルを生成します—レイアウト、スタイル、およびデータを簡単にカスタマイズできます。

Add TOC

PDF文書の整理とナビゲーションを向上させるために、目次 (TOC) を動的に生成します

Use ChatGPT

AIを使用してDocumentizeのChatGPT統合を用いてPDFを強化し、インテリジェントにコンテンツを生成、編集、分析します。

PDF Managerのサブセクション

Merge PDF

Documentize PDF Manager for .NETは、複数のPDF文書を1つのファイルにマージするために設計された多目的ツールです。PDFファイルの統合を簡素化し、ドキュメントが効率的にマージされ、コンテンツの一貫性を維持します。このプラグインは、マージされたドキュメントを最適化するために、フォントや画像などの内部リソースを処理します。

PDFをマージする方法

複数のPDF文書を1つのファイルにマージするには、次の手順を実行します。

  1. マージプロセスを構成するためにMergeOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して出力PDFファイルを追加します。
  4. PdfManagerクラスのMergeメソッドを使用してマージを実行します。
1// 指示を設定するためにMergeOptionsオブジェクトを作成
2var options = new MergeOptions();
3// 入力ファイルパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 出力ファイルパスを設定
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// プロセスを実行
9PdfManager.Merge(options);

バッチマージの取り扱い方法

PDF Mergerプラグインは、大規模なPDF文書のバッチ処理を最適化しています。バッチ処理機能を活用することで、数百のPDFを1回の操作でマージでき、効率的で迅速なドキュメント管理が可能です。

  1. Mergerクラスのインスタンスを作成します。
  2. すべての入力PDFファイルをMergeOptionsクラスに追加します。
  3. 出力パスを指定します。
  4. Processメソッドを呼び出してバッチ内のすべてのファイルをマージします。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// マージのために大量のPDFを追加
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 出力ファイルパスを指定
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// バッチマージを実行
14merger.Process(mergeOptions);

主な機能:

  • 複数のPDFをマージ: 複数のPDFファイルを簡単に1つに結合します。
  • リソース最適化: マージ中に重複するフォントや画像を削除します。
  • バッチ処理: 一度に大量のPDF文書をマージします。

Split PDF

Documentize PDF Manager for .NETは、大きなPDF文書をより小さく、管理しやすいファイルに分割するプロセスを簡素化する強力なツールです。個々のページを抽出する必要がある場合や、特定のセクションに文書を分割する必要がある場合、このプラグインを使用すると効率的かつ最小限の労力で実現できます。

PDFを分割する方法

PDF文書を個々のページに分割するには、次の手順に従ってください。

  1. 分割オプションを設定するためにSplitOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して各分割ページの出力ファイルを追加します。
  4. PdfManagerクラスのSplitメソッドを実行して文書を分割します。
1// Create SplitOptions object to set instructions
2var options = new SplitOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file paths
6options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
8// Perform the process
9PdfManager.Split(options);

主な機能:

  • ページごとにPDFを分割: PDF文書を個々のページに分解します。
  • カスタム分割オプション: 要件に応じて分割プロセスを設定します。
  • 整理された出力: 各分割ページやセクションの出力ファイルを簡単に管理します。

Optimize PDF

Documentize PDF Manager for .NETは、先進的な最適化技術を通じてPDFドキュメントを強化する包括的なプラグインです。ファイルサイズを削減し、ページを回転させ、コンテンツをトリミングし、ドキュメントのサイズを調整するのに役立ちます。これらの操作により、PDFファイルの品質と管理性が向上し、保管、共有、および表示が容易になります。

Optimize PDF

以下の手順は、品質を維持しながらPDFドキュメントのファイルサイズを削減する方法を示しています。

  1. OptimizeOptionsオブジェクトを作成して最適化設定を構成します。
  2. 入力PDFファイルを追加し、最適化されたファイルの出力場所を設定します。
  3. PdfManagerOptimizeメソッドを実行して最適化を行います。
1// Create OptimizeOptions object to set instructions
2var options = new OptimizeOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Optimize(options);

Rotate PDF

RotateOptionsクラスを使用して、PDFファイル内のページの向きを調整します。

  1. RotateOptionsオブジェクトを作成し、回転角度を構成します。
  2. 入力PDFファイルを追加し、出力ファイルの場所を指定します。
  3. SetRotationメソッドを使用して回転角度を設定します(例:90度)。
  4. PdfManagerRotateメソッドを実行します。
 1// Create RotateOptions object to set instructions
 2var options = new RotateOptions();
 3// Set new Rotation
 4options.Rotation = Rotation.On90;
 5// Add input file path
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Rotate(options);

Resize PDF

PDFドキュメントをリサイズするには、ResizeOptionsクラスを使用して新しいページサイズを指定します。

  1. ResizeOptionsオブジェクトを作成し、ページサイズを定義します。
  2. 入力ファイルを追加し、希望する出力場所を設定します。
  3. SetPageSizeメソッドを使用して新しいサイズを指定します(例:A4)。
  4. PdfManagerResizeメソッドを実行します。
 1// Create ResizeOptions object to set instructions
 2var options = new ResizeOptions();
 3// Set new PageSize
 4options.PageSize = PageSize.A3;
 5// Add input file path
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Resize(options);

Compress PDF

使用されていないページリソースを排除し、同一のアセットを結合し、冗長なオブジェクトを破棄することで、可能な場合はPDFドキュメントを圧縮します。

  1. CompressOptionsオブジェクトを作成して最適化設定を構成します。
  2. 入力ファイルを追加し、出力ファイルの場所を指定します。
  3. SetCropBoxメソッドを使用してクロップ範囲を定義します。
  4. PdfManagerCompressメソッドを実行します。
1// Create CompressOptions object to set instructions
2var options = new CompressOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Compress(options);

主な機能:

  • 最適化: 品質を損なうことなくPDFファイルのサイズを削減します。
  • 回転: PDFページの向きを調整します。
  • リサイズ: ページを特定の寸法にリサイズします(例:A4、レター)。
  • 圧縮: ドキュメントから未使用のページリソースやオブジェクトを削除します。

Add Table

Documentize PDF Manager for .NET は、PDFドキュメントにテーブルを統合するプロセスを簡素化するために設計された多目的プラグインです。データを整理する場合、フォームを設計する場合、またはドキュメントの可読性を向上させる場合でも、このプラグインは正確性と効率を維持しながらプロセスを簡素化します。その直感的なAPIは、単一のドキュメント処理とバッチ処理のワークフローの両方をサポートしており、構造化データを扱う開発者にとって不可欠なツールです。

PDFにテーブルを作成する

TableOptions クラスを使用してPDFに構造化されたテーブルを作成する手順は次のとおりです:

  1. TableOptions オブジェクトを設定してテーブルの構造、内容、入出力ファイルを定義します。
  2. PDFにテーブル、行、およびセルを追加します。
  3. AddTable メソッドを使用してテーブル生成プロセスを完了します。

以下は例です:

 1// テーブルオプションを設定する
 2var options = new TableOptions();
 3options.InsertPageBefore(1)
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("Name")
 7            .AddCell().AddParagraph("Age")
 8        .AddRow()
 9            .AddCell().AddParagraph("Bob")
10            .AddCell().AddParagraph("12")
11        .AddRow()
12            .AddCell().AddParagraph("Sam")
13            .AddCell().AddParagraph("20")
14        .AddRow()
15            .AddCell().AddParagraph("Sandy")
16            .AddCell().AddParagraph("26")
17        .AddRow()
18            .AddCell().AddParagraph("Tom")
19            .AddCell().AddParagraph("12")
20        .AddRow()
21            .AddCell().AddParagraph("Jim")
22            .AddCell().AddParagraph("27");
23// 入力ファイルパスを追加
24options.AddInput(new FileDataSource("path_to_input.pdf"));
25// 出力ファイルパスを設定
26options.AddOutput(new FileDataSource("path_to_output.pdf"));
27// 処理を実行
28PdfManager.AddTable(options);

テーブルの配置ページを設定する

2ページ目の後にPDFにテーブルを作成する手順は以下のとおりです: 以下は例です:

 1var options = new TableOptions();
 2options.InsertPageBefore(2) // 2ページ目の前にテーブルを追加
 3   .AddTable()
 4        .AddRow()
 5            .AddCell().AddParagraph("Name")
 6            .AddCell().AddParagraph("Age")
 7// 入力ファイルパスを追加
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 出力ファイルパスを設定
10options.AddOutput(new FileDataSource("path_to_output.pdf"));
11// 処理を実行
12PdfManager.AddTable(options);

テーブルのレイアウトと構造のカスタマイズ

プラグインは、行の高さ、列の幅、およびセルの配置を含むテーブル構造の調整に柔軟性を提供します。これらのカスタマイズオプションを使用して、ドキュメントのレイアウトやスタイリングニーズに合わせたテーブルを設計できます。

主な機能:

  • 動的テーブル作成:PDFドキュメント内で構造化されたテーブルを簡単に生成します。
  • ページ配置:PDF内の特定の場所にテーブルを正確に挿入します。
  • カスタマイズ可能なレイアウト:テーブル構造、セルの配置、およびスタイルを調整します。

Add TOC

Documentize PDF Manager for .NET は、目次 (TOC) を動的に生成することで、PDF文書の整理とナビゲーションを向上させるために設計された強力なプラグインです。このプラグインは、PDFにTOCを追加するプロセスを簡素化し、文書をよりナビゲートしやすく、管理しやすくします。

PDFのTOCを生成する方法

PDFファイルに目次を作成するには、以下の手順に従います。

  1. TOC生成設定を構成するために TocOptions のインスタンスを作成します。
  2. Title プロパティを使用してタイトルを設定します。
  3. Headings.Add メソッドを使用してTOCの見出しをデザインします。
  4. AddInput メソッドを使用して入力PDFファイルを追加します。
  5. AddOutput メソッドを使用してTOCを含む出力PDFファイルを指定します。
  6. AddTableOfContents メソッドを呼び出してTOCを生成します。
 1// TocOptionsオブジェクトを作成して指示を設定
 2var options = new TocOptions();
 3// タイトルを設定
 4options.Title = "My Table of Contents";
 5// 見出しをデザイン
 6options.Headings.Add(new TocHeading("Introduction", 2));
 7options.Headings.Add(new TocHeading("Chapter I", 3));
 8options.Headings.Add(new TocHeading("Chapter II", 4));
 9options.Headings.Add(new TocHeading("Chapter III", 5));
10// 入力ファイルパスを追加
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 出力ファイルパスを設定
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// プロセスを実行
15PdfManager.AddTableOfContents(options);

PDFのTOCにブックマークを生成する

ブックマーク生成には ‘GenerateBookmarks’ プロパティを使用できます。

 1// TocOptionsオブジェクトを作成して指示を設定
 2var options = new TocOptions();
 3// タイトルを設定
 4options.Title = "My Table of Contents";
 5// ブックマークにリンクを生成
 6options.GenerateBookmarks = true;
 7// 見出しをデザイン
 8options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 9options.Headings.Add(new TocHeading("Chapter I", 3, true, 1));
10options.Headings.Add(new TocHeading("Chapter II", 4, true, 1));
11options.Headings.Add(new TocHeading("Example A", 4, true, 2));
12options.Headings.Add(new TocHeading("Example B", 4, true, 2));
13options.Headings.Add(new TocHeading("Example C", 4, true, 2));
14options.Headings.Add(new TocHeading("Example D", 4, true, 2));
15options.Headings.Add(new TocHeading("Chapter III", 5, true, 1));
16// 入力ファイルパスを追加
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 出力ファイルパスを設定
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// プロセスを実行
21PdfManager.AddTableOfContents(options);

結果をストリームとして取得する方法

 1// TocOptionsオブジェクトを作成して指示を設定
 2var options = new TocOptions();
 3// タイトルを設定
 4options.Title = "My Table of Contents";
 5// 見出しをデザイン
 6options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 7// 入力ファイルパスを追加
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 9// 出力ストリームを設定 
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// プロセスを実行
14PdfManager.AddTableOfContents(options);

TOCの見出しをカスタマイズする

TocHeading クラスを修正することで、目次の見出しをカスタマイズできます。例えば、‘GenerateNumbering’ を使用したり、手動で行うことができます。 ページ上のリンクに使用される ‘PageNumber’ プロパティや、レベルプロパティも使用できます。

 1var heading = new TocHeading();
 2heading.Text = "Intro";
 3heading.PageNumber = 5;
 4heading.GenerateNumbering = true;
 5heading.Level = 2;
 6
 7var tocOptions = new TocOptions();
 8options.Headings.Add(heading);
 9// 入力ファイルと出力ファイルを追加
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// カスタマイズされたオプションでTOCを生成
14PdfManager.AddTableOfContents(tocOptions);

主な機能:

  • 動的TOC生成: 見出しやブックマークに基づいて自動的に生成されたエントリを使用して、任意のPDFファイルのTOCを作成します。
  • カスタマイズ: スタイル、フォーマット、深さのレベルを含むTOCの外観と構造を制御します。
  • 効率的なワークフロー: 特に大規模または複雑な文書のTOCを手動で作成する時間を最小限に抑えます。

Use ChatGPT

Documentize PDF Manager for .NETプラグインは、ChatGPT APIをPDFアプリケーションに統合するための強力なツールです。このプラグインを使用すると、開発者は入力メッセージに基づいてチャット応答を生成し、出力をPDF形式で保存できるため、PDF文書内で直接会話インターフェースや分析レポートを作成するのに適しています。

チャット応答の生成

ChatGPTプラグインを使用してチャット応答を生成し、PDFファイルに保存するには、以下の手順に従ってください。

  1. リクエストオプションを設定するためにChatGptRequestOptionsクラスのインスタンスを作成します。
  2. 入力および出力のPDFファイルを追加します。
  3. APIキーを設定し、最大トークン数やChatGPTモデルのクエリなどのパラメータを指定します。
  4. CreatePdfByChatGptRequestAsyncメソッドを実行して、チャット完了を生成します。
 1var options = new ChatGptRequestOptions();
 2// 出力ファイルパスを設定
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf")); 
 4options.ApiKey = "Your API key."; // APIにアクセスするためにキーを提供する必要があります。
 5options.MaxTokens = 1000; // チャット完了で生成する最大トークン数です。
 6
 7// リクエストメッセージを追加。
 8options.Messages.Add(new Message
 9{
10    Content = "You are a helpful assistant.",
11    Role = Role.System
12});
13options.Messages.Add(new Message
14{
15    Content = "What is the biggest pizza diameter ever made?",
16    Role = Role.User
17});
18
19// リクエストを処理する。
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT APIのチャット完了オブジェクト。

システムおよびユーザーメッセージの追加

よりインタラクティブな会話を作成するために、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは会話の文脈を形成するのに役立ちます。

  1. ChatGPTの文脈を設定するシステムメッセージを追加します。
  2. 会話用のユーザーの入力を表すユーザーメッセージを追加します。
 1var options = new ChatGptRequestOptions();
 2// 出力ファイルパスを設定
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 4
 5// PDFテキストソースを追加します。
 6// 複数のソースがある場合、各ドキュメントからのテキストはリクエストメッセージコレクションに
 7// "user"の役割を持つ別々のメッセージとして追加されます。
 8options.AddInput(new FileDataSource("TextSource.pdf"));
 9
10options.ApiKey = "Your API key."; // APIにアクセスするためにキーを提供する必要があります。
11options.MaxTokens = 1000; // チャット完了で生成する最大トークン数です。
12
13// リクエストメッセージを追加します。
14// この場合、Content = "You are a helpful assistant."というシステムメッセージはデフォルトで追加されます。
15// クエリメッセージの役割はデフォルトで"ユーザー"です。
16options.Query = "Provided text の中にいくつの文字がありますか?";
17
18// リクエストを処理する。
19var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
20
21var fileResultPath = result.ResultCollection[0].Data;
22var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT APIのチャット完了オブジェクト。

主な機能:

  • チャット完了: カスタム入力に基づいてChatGPT APIを使用して応答を生成します。
  • システムとユーザーメッセージ: 動的な会話を作成するために、システムの文脈とユーザーの入力の両方を提供します。
  • PDF出力: 生成されたチャット完了を構造化されたPDFファイルに保存して、さらなる利用ができます。
  • 非同期処理: チャット完了を非同期に処理して、応答性のあるアプリケーションを保証します。

PDF セキュリティ

Encrypt

Documentizeの.NETツールを使用してPDFファイルを暗号化し、機密情報を保護してください。

Decrypt

Documentizeを使用してPDFファイルを復号化し、ドキュメントを開きます。

サイン

Documentizeの.NETツールを使ってPDFファイルにデジタル署名を付ける—安全性、信頼性、コンプライアンスを簡単に確保します。

PDF セキュリティのサブセクション

Encrypt

Documentize PDF Security for .NETは、暗号化、復号化、および署名機能を提供することでPDF文書のセキュリティを強化するために設計された強力なツールです。それは、あなたの機密情報が機密のままとどまり、無許可のアクセスから保護されることを保証します。

PDFを暗号化する方法

PDF文書を暗号化するには、次の手順に従います:

  1. 希望するユーザーおよびオーナーのパスワードを持つEncryptOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して出力PDFファイルを追加します。
  4. PdfSecurityクラスのEncryptメソッドを使用して暗号化を実行します。
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);

キーフィーチャー:

  • PDFドキュメントを暗号化: ユーザーおよびオーナーパスワードを追加することでPDFファイルを保護します。
  • 自動化: .NETアプリケーションに暗号化および復号化を統合し、自動化されたワークフローを実現します。
  • コンプライアンス: ドキュメントが文書セキュリティに関する業界標準を満たしていることを確認します。

Decrypt

Documentize PDF Security for .NETは、暗号化、復号化、および署名機能を提供することにより、PDFドキュメントのセキュリティを強化するために設計された強力なツールです。これにより、機密情報が非公開であり、無許可のアクセスから保護されていることが保証されます。

PDFを復号化する方法

PDFドキュメントを復号化するには、以下の手順に従います。

  1. 必要なパスワードを持つDecryptionOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputメソッドを使用して出力PDFファイルを追加します。
  4. PdfSecurityクラスのDecryptメソッドを使用して暗号化を実行します。
1// Create DecryptOptions object to set instructions
2var options = new DecryptOptions("123456");
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Decrypt(options);

主な機能:

  • PDFドキュメントの復号化: 必要に応じてPDFから暗号化を解除します。
  • 自動化: 自動化されたワークフローのために、暗号化と復号化を.NETアプリケーションに統合します。
  • コンプライアンス: ドキュメントが業界標準のドキュメントセキュリティに準拠していることを確認します。

サイン

Documentize PDF Security for .NETプラグインは、ユーザーがPDF文書にデジタル署名を付けることを可能にします。署名を追加し、信頼性を確保し、PDFコンテンツを保護するためのスムーズなプロセスを提供します。このプラグインは、可視および不可視の署名をサポートし、署名の位置、理由、連絡先情報などのカスタマイズオプションを提供します。

PDF文書への署名方法

PFXファイルを使用してPDF文書に署名するには、次の手順に従います。

  1. PFXファイルのパスとパスワードを使用してSignOptionsクラスのインスタンスを作成します。
  2. 入力PDFと出力ファイルをオプションに追加します。
  3. Signメソッドを実行して署名を適用します。
1// 設定をするためのSignOptionsオブジェクトを作成
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 入力ファイルのパスを追加
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 出力ファイルのパスを設定
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 処理を実行
8PdfSecurity.Sign(options);

ストリームを使用してPFXファイルを署名する方法

ファイルパスの代わりにストリームとして提供されるPFX証明書を使用してPDFに署名することもできます。これにより、証明書の保存を柔軟に扱うことができます。

1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 処理を実行
6PdfSecurity.Sign(options);

不可視署名を適用する方法

文書に署名を表示せずに文書を保護する不可視署名を追加するには、単にVisibleプロパティをfalseに設定します。

  1. SignOptionsのインスタンスを作成します。
  2. Visiblefalseに設定します。
  3. 入力ファイルと出力ファイルを追加します。
  4. Signを呼び出して不可視署名を適用します。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 不可視署名を設定
5signOptions.Visible = false;
6// 処理を実行
7PdfSecurity.Sign(options);

PDF文書の署名に追加オプションを使用する方法

署名をPFXファイルに追加する際に、理由、連絡先、場所、ページ番号のような追加オプションを使用できます。

  1. PFXファイルのパスとパスワードを使用してSignOptionsクラスのインスタンスを作成します。
  2. 入力PDFと出力ファイルをオプションに追加します。
  3. オプションの値を設定します。
  4. Signメソッドを実行して署名を適用します。
 1// 設定をするためのSignOptionsオブジェクトを作成
 2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 3// 入力ファイルのパスを追加
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 出力ファイルのパスを設定
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// 任意のパラメータ
 8options.Reason = "my Reason";
 9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// 処理を実行
13PdfSecurity.Sign(options);

PDFにタイムスタンプを追加する方法

PDF文書に安全なタイムスタンプを追加するには、次の手順に従います。

  1. タイムスタンプ処理を設定するためにAddTimestampOptionsのインスタンスを作成します。
  2. AddInputメソッドを使用して入力PDFファイルを追加します。
  3. AddOutputを使用して出力ファイルのパスを設定します。
  4. Signメソッドを使用してタイムスタンプ処理を実行します。
1// 設定をするためのSignOptionsオブジェクトを作成
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// 入力ファイルのパスを追加
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 出力ファイルのパスを設定
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 処理を実行
9PdfSecurity.Sign(options);

タイムスタンプサーバーでのカスタム認証の使用方法

タイムスタンプサーバーに接続する際に基本認証情報を提供することができます。これにより、ユーザー名とパスワードを必要とするサーバーと認証することができます。

1// 認証付きでタイムスタンプオプションを設定
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");

主な特徴:

  • PDF文書にデジタル署名を付ける: 可視または不可視のデジタル署名で文書を保護します。
  • PFXサポート: PFX証明書を使用してPDFファイルに署名します。
  • カスタマイズ可能なオプション: 理由、場所、連絡先の詳細など署名設定を構成します。
  • 可視および不可視の署名: 署名が文書に表示されるかどうかを選択できます。
  • カスタマイズ可能なタイムスタンプサーバー: カスタムタイムスタンプサーバーのURLや認証情報を使用できます。

PDF抽出ツール

テキスト抽出

Documentize の .NET ツールを使用して PDF ドキュメントからテキストを正確に抽出し、コンテンツを簡単に取得、処理、分析できます。

画像の抽出

.NET アプリケーションから PDF ドキュメントの画像を手軽に抽出

プロパティの抽出 / メタデータ

Documentize を使用して C#/.NET で PDF からメタデータを正確に抽出

フォームデータのエクスポート

PDF フォーム(AcroForms)からデータを抽出し、C#/.NET を使用して CSV などの他の形式にエクスポートします

PDF抽出ツールのサブセクション

テキスト抽出

Documentize PDF Extractor for .NET は、PDF ドキュメントからテキストを抽出する作業を簡素化します。純粋なテキスト、ローモードのテキスト、またはプレーンテキストが必要な場合でも、このプラグインは、フォーマットを保持するか除外するかを選択しながら、効率的にテキストを抽出できます。

How to Extract Text from PDF file

PDF ファイルからテキストを抽出するには、次の手順を実行します。

  1. ExtractTextOptions のインスタンスを作成し、入力ファイル パスを設定します。
  2. Extract メソッドを実行してテキストを抽出します。
1// Create ExtractTextOptions object to set input file path
2var options = new ExtractTextOptions("path_to_your_pdf_file.pdf");
3// Perform the process and get the extracted text
4var textExtracted = PdfExtractor.Extract(options);

How to Extract Text from PDF stream

PDF ストリームからテキストを抽出するには、次の手順を実行します。

  1. ExtractTextOptions のインスタンスを作成し、入力ストリームを設定します。
  2. Extract メソッドを実行してテキストを抽出します。
1// Create ExtractTextOptions object to set input stream
2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
3var options = new ExtractTextOptions(stream);
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);

Text Extraction Modes

ExtractTextOptions は 3 つの抽出モードを提供し、ニーズに合わせた柔軟な選択が可能です。

  1. Pure Mode: スペースや配置を含む元の書式を保持します。
  2. Raw Mode: 書式なしでテキストを抽出し、ローデータの処理に適しています。
  3. Flatten Mode: PDF コンテンツを座標に基づくテキスト フラグメントとして表現します。
1// Create ExtractTextOptions object to set input file path and TextFormattingMode
2var options = new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure);
3// Perform the process and get the extracted text
4var textExtracted = PdfExtractor.Extract(options);

How to Extract Text from PDF file in the shortest possible style

1// Perform the process and get the extracted text
2var textExtracted = PdfExtractor.Extract(new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure));

Key Features:

  • Pure Mode: 元の書式を保持したままテキストを抽出します。
  • Raw Mode: 書式なしでテキストを抽出します。
  • Flatten Mode: 特殊文字や書式を除外してテキストを抽出します。

画像の抽出

Documentize PDF Extractor for .NET プラグインは、PDF ドキュメントから画像を簡単に抽出できるようにします。PDF ファイルをスキャンし、埋め込まれた画像を特定し、元の品質と形式を保ったまま抽出します。このツールは視覚コンテンツのアクセシビリティを向上させ、PDF から画像を取得するプロセスを効率化します。

PDF から画像を抽出する方法

PDF ファイルから画像を抽出するには、以下の手順を実行します。

  1. ExtractImagesOptions クラスのインスタンスを作成します。
  2. AddInput メソッドで入力ファイルパスをオプションに追加します。
  3. AddOutput メソッドで画像の出力ディレクトリパスを設定します。
  4. プラグインで画像抽出処理を実行します。
  5. 結果コンテナから抽出された画像を取得します。
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

フォルダを使用せずにストリームへ画像を抽出する方法

PdfExtractor プラグインはストリームへの保存をサポートしており、テンポラリフォルダを使用せずに PDF ファイルから画像をストリームに抽出できます。

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

主な機能

  • 埋め込み画像の抽出: PDF ドキュメントから画像を特定して抽出します。
  • 画像品質の保持: 抽出された画像は元の品質を維持します。
  • 柔軟な出力: 抽出した画像を好みの形式や場所に保存できます。

プロパティの抽出 / メタデータ

Documentize PDF Extractor for .NET は、PDF 文書からメタデータを抽出する作業を簡素化します。
利用可能なプロパティの例: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。

PDF ファイルからメタデータを抽出する方法

この例では、PDF ファイルからプロパティ (Title、Author、Subject、Keywords、Number of Pages) を抽出する手順を示します。
PDF 文書からメタデータを抽出するには、次の手順を実行します。

  1. ExtractPropertiesOptions のインスタンスを作成し、抽出オプションと入力 PDF ファイルを設定します。
  2. PdfExtractorExtract メソッドを実行してメタデータを抽出します。
  3. PdfProperties を使用して抽出されたプロパティにアクセスします。
 1// Create ExtractPropertiesOptions object to set input file
 2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
 3// Perform the process and get Properties
 4var pdfProperties = PdfExtractor.Extract(options);
 5var filename = pdfProperties.FileName;
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

PDF ストリームからメタデータを抽出する方法

ストリームは任意のタイミングで開くことができます。

 1// Create ExtractPropertiesOptions object to set input stream
 2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
 3var options = new ExtractPropertiesOptions(stream);
 4// Perform the process and get Properties
 5var pdfProperties = PdfExtractor.Extract(options);
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

最も簡潔なスタイルで PDF ファイルからメタデータを抽出する方法

1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

主な機能:

  • 利用可能なメタデータ: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。

フォームデータのエクスポート

The Documentize PDF Extractor for .NET plugin provides a seamless way to extract and export data from PDF forms (AcroForms) into other formats like CSV. This dynamic tool simplifies the process of retrieving form field values, allowing for easy data management, transfer, and analysis.

How to Export Form Data from PDF

To export form data from a PDF to CSV, follow these steps:

  1. Create an instance of the ExtractImagesOptions class.
  2. Define export options using the FormExporterValuesToCsvOptions class.
  3. Add input PDF files and specify the output CSV file.
  4. Run the Extract method to perform the export.
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);

Key Features:

  • Export Form Data: Extract data from PDF forms (AcroForms) into CSV or other formats.
  • Data Filtering: Use predicates to filter specific form fields for export based on criteria like field type or page number.
  • Flexible Output: Save exported data for analysis or transfer to spreadsheets, databases, or other document formats.

PDF フォームのサブセクション

フォームフィールドのフラッテン化

The Documentize PDF Form for .NET プラグインは、インタラクティブな PDF フォームを編集不可なドキュメントに変換し、許可されていない改ざんから保護するよう設計されています。このツールはフォームフィールドを静的なコンテンツに変換し、PDF ドキュメントのセキュリティを向上させます。契約書や合意書、フォームフィールドが変更されてはいけないあらゆる文書を保護する際に特に有用です。

PDF のフォームフィールドをフラッテン化する方法

PDF ドキュメントのフォームフィールドをフラッテン化するには、次の手順に従ってください。

  1. FlattenFieldsOptions クラスのインスタンスを作成します。
  2. オプションに入力ファイルと出力ファイルを追加します。
  3. Flatten メソッドを呼び出してフラッテン化を実行します。
1// Create FlattenFieldsOptions object to set instructions
2var options = new FlattenFieldsOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfForm.Flatten(options);

PDF のすべてのフィールドを取得する方法

ドキュメントに含まれるフィールド数や情報を取得できます。

1// Get Fields Names
2var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));

PDF の最初のフィールド以外すべてをフラッテン化する方法

フィールドの位置や名前などの条件に基づいて、特定のフォームフィールドだけを選択的にフラッテン化できます。

 1// Get Fields Names
 2var fieldNames = PdfForm.GetFieldNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));
 3// Create FlattenFieldsOptions object to set instructions
 4var options = new FlattenFieldsOptions();
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// Skip 1 field.
 8options.SkipFields.Add(fieldNames[0]);
 9// Perform the process
10PdfForm.Flatten(options);

主な機能:

  • すべてのフォームフィールドをフラッテン化: インタラクティブなフォームフィールドを編集不可の静的コンテンツに変換します。
  • 選択したフィールドのみフラッテン化: PDF 内の特定のフィールドだけをフラッテン化し、他のフィールドは編集可能なままにします。
  • フィールド名の取得: PDF 内のフィールド名を取得します。

FAQs

このFAQでは、Documentize .NET Pluginsの機能や特性に関する包括的な情報を提供し、PDF変換、フォーム処理、目次(TOC)生成などの側面を取り上げています。


一般的な質問

1. Documentize for .NETとは何ですか?

Documentize for .NETは、プログラムを通じてPDF文書を管理・処理するための強力なライブラリです。PDFをさまざまな形式に変換したり、PDFフォームを編集したり、デジタル署名を追加したり、TOCを生成したり、長期的なアーカイブのためのPDF/A準拠を確保したりできます。

2. Documentizeのプラグインをどうやってインストールしますか?

公式ウェブサイトからアセンブリファイルをダウンロードするか、NuGetから直接パッケージを取得することで、Documentizeプラグインをインストールできます。各プラグインのドキュメント内に詳細なインストール手順があります。


PDF変換プラグイン

3. PDF文書をWord(DOC/DOCX)ファイルに変換するにはどうすればよいですか?

PDF to DOC Converterを使用してPDF文書をWord形式に変換するには:

  1. PdfDocクラスをインスタンス化します。
  2. 変換オプションを設定するためのPdfToDocOptionsオブジェクトを作成します。
  3. 入力PDFと出力DOC/DOCXファイルのパスを追加します。
  4. 変換を実行するためにProcessメソッドを呼び出します。

4. PDFページをJPEG画像に変換するにはどうすればよいですか?

PDF to JPEG Converterを使用して:

  1. Jpegクラスのインスタンスを作成します。
  2. JpegOptionsを介して変換オプション(解像度、ページ範囲など)を設定します。
  3. 入力/出力ファイルのパスを追加します。
  4. Jpeg.Processメソッドを呼び出して変換を実行します。

5. PDFをPNGに変換するにはどうすればよいですか?

PDFをPNG形式に変換するには:

  1. PngクラスのインスタンスとPngOptionsオブジェクトを作成します。
  2. 入力PDFを追加し、出力フォルダーを指定します。
  3. 解像度(例:300 DPI)などのオプションを設定します。
  4. PNG画像を生成するためにProcessメソッドを呼び出します。

6. PDFをExcel(XLS/XLSX)に変換するにはどうすればよいですか?

PDFをExcelに変換するには:

  1. PdfXlsクラスをインスタンス化します。
  2. PdfToXlsOptionsを使用して入力/出力パスおよび変換オプションを設定します。
  3. 変換を開始するためにProcessメソッドを呼び出します。

7. PDFをHTMLに変換するにはどうすればよいですか?

PDF文書をHTMLに変換するには:

  1. PdfHtmlクラスのインスタンスを作成します。
  2. PdfToHtmlOptionsまたはHtmlToPdfOptionsで変換オプションを設定します。
  3. 入力/出力パスを追加し、Processメソッドを呼び出します。

PDFフォーム処理

8. フォームエディタでPDFフォームを編集するにはどうすればよいですか?

PDF Form Editorは、以下の機能を提供します:

  • フィールドを追加する(FormEditorAddOptions)。
  • フィールドを更新する(FormEditorSetOptions)。
  • フィールドを削除する(FormRemoveSelectedFieldsOptions)。 フォームフィールドを設定したら、Processメソッドを実行します。

9. PDFフォームをフラット化するにはどうすればよいですか?

フォームフィールドをフラット化するには:

  1. FormFlattenerクラスをインスタンス化します。
  2. すべてのフィールドをフラット化するためにFormFlattenAllFieldsOptionsを使用するか、特定のフィールドをターゲットにするためにFormFlattenSelectedFieldsOptionsを使用します。
  3. 入力/出力ファイルを追加し、Processメソッドを呼び出します。

10. PDFフォームからデータをエクスポートするにはどうすればよいですか?

フォームデータをエクスポートするには、PDF Form Exporterを使用します。 FormExporterValuesToCsvOptionsオブジェクトを作成し、フォームフィールドの条件を指定し、データをCSV形式でエクスポートするためにProcessメソッドを実行します。


PDF/AおよびTOC管理

11. PDFをPDF/A形式に変換するにはどうすればよいですか?

PDFをPDF/Aに変換するには:

  1. PdfAConverterクラスを使用します。
  2. PdfAConvertOptionsでPDF/Aのバージョン(例:PDF/A-3B)を設定します。
  3. 入力/出力パスを追加し、Processメソッドを呼び出します。

12. PDF内に目次(TOC)を生成するにはどうすればよいですか?

目次を作成するには:

  1. TocGeneratorクラスのインスタンスを作成します。
  2. TocOptionsを使用してTOCのパラメータを定義します。
  3. 入力/出力ファイルを追加し、Processメソッドを実行します。

署名処理

13. PDF文書にデジタル署名を追加するにはどうすればよいですか?

デジタル署名を追加するには:

  1. Signatureクラスをインスタンス化します。
  2. SignOptionsを使用してPFXファイル、パスワード、および署名の詳細(理由、連絡先情報など)を設定します。
  3. 入力/出力ファイルを追加し、Processメソッドを実行します。

追加機能

14. Documentizeを使用してPDFファイルを分割できますか?

はい、PDF Splitterを使用して:

  1. Splitterクラスをインスタンス化します。
  2. SplitOptionsを使用して分割オプションを設定します。
  3. 入力/出力パスを追加し、Processメソッドを呼び出します。

15. 複数のPDFファイルを1つに結合するにはどうすればよいですか?

PDFを結合するには:

  1. Mergerクラスをインスタンス化します。
  2. 入力PDFを追加し、MergeOptionsを介して出力ファイルを指定します。
  3. ファイルを結合するためにProcessメソッドを実行します。

16. DocumentizeはPDFのみを処理する制限がありますか?

Documentizeは主にPDF操作に焦点を当てていますが、DOC、XLS、HTML、JPEG、PNGなどのフォーマットへの変換もサポートしています。


ライセンスと互換性

17. Documentizeプラグインを使用するためのシステム要件は何ですか?

Documentizeは以下をサポートします:

  • オペレーティングシステム: Windows 7-11、Windows Server 2003-2022、macOS (10.12+)、Linux。
  • フレームワーク: .NET Framework 4.0から8.0。
  • IDE: Visual Studioのさまざまなバージョンと互換性があります。

18. Documentizeのライセンスキーを設定するにはどうすればよいですか?

プラグインをアクティブにするには、プロジェクトでDocumentizeを参照し、任意のメソッドを呼び出す前にライセンスキーを設定します。詳細な手順は特定のプラグインのドキュメントを参照してください。

19. Documentizeプラグインのさらなる例やドキュメントはどこで見つけられますか?

完全なAPIドキュメントや例は、Documentizeのウェブサイトまたは開発環境内のNuGetパッケージを通じて見つけることができます。


 日本語