PDF Converter
Documentize の .NET ツールで HTML を PDF に変換し、レイアウトと書式を保持して一貫したプロフェッショナルな結果を実現します。
Documentize の .NET ツールで PDF を HTML に変換し、レイアウトとフォーマットを保持して一貫したプロフェッショナルな結果を実現します。
Documentize の .NET ツールで PDF を Word ドキュメントに変換します。書式と構造を保持し、簡単に編集可能です。
Documentize の .NET ツールを使って PDF を JPEG 画像に変換 — ドキュメントから高品質な画像を手軽に抽出します。
Documentize の .NET ツールで PDF を PDF/A 形式に変換し、長期保存とコンプライアンスを簡単に実現します。
Convert PDFs to PNG images with Documentize's .NET tools—extract high-quality images for web and graphic use.
Documentize の .NET ツールを使用して PDF を TIFF 画像に変換し、プロフェッショナルな文書管理のために高解像度画像を抽出します。
Documentize の .NET ツールで PDF を Excel に変換—テーブルやデータを素早く抽出し、シームレスな分析と処理を実現します。
PDF Converterのサブセクション
HTML を PDF に変換
The Documentize PDF Converter for .NET provides robust capabilities for converting documents between HTML to PDF format, ideal for web applications, archiving, and report generation. With multiple options for handling resources and layouts, the converter adapts to various project requirements.
Converting HTML to PDF
Transform HTML content into high-quality PDFs, perfect for generating printable reports, archiving web content, or creating shareable document formats.
To convert an HTML document to a PDF, follow these steps:
- Configure Options: Use
HtmlToPdfOptions to define layout and media settings. - Specify Paths: Set input HTML and output PDF file paths.
- Execute the Conversion: Run the
Convert method of PdfConverter to convert the file.
Example: Convert HTML to PDF
1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);
Additional Options for HTML to PDF Conversion
Media Type:
HtmlMediaType.Print: Ideal for generating PDFs suited for printing.HtmlMediaType.Screen: Use when converting content designed for digital viewing.
Layout Adjustments:
PageLayoutOption: Adjusts how HTML content fits the PDF layout, like ScaleToPageWidth to ensure the content scales to the PDF width.IsRenderToSinglePage: Enables rendering the entire HTML content on a single PDF page if needed for concise presentations.
This converter is versatile for a variety of applications, from generating PDF reports based on web content to converting archives of PDF documents for web-based accessibility. For more advanced configurations, refer to the full Documentize documentation.
PDF を HTML に変換
Documentize PDF Converter for .NET は、PDF 文書を HTML 形式に変換するための強力な機能を提供し、Web アプリケーション、アーカイブ、レポート生成に最適です。リソースやレイアウトの取り扱いオプションが多数用意されており、さまざまなプロジェクト要件に合わせて変換プロセスを調整できます。
PDF を HTML に変換する
PDF ファイルを HTML に変換して、Web ベースでの閲覧や HTML 形式が好まれるアプリケーションへの統合を可能にします。
- オプションの設定:
PdfToHtmlOptions を使用して出力をカスタマイズし、埋め込みリソースまたは外部リソースのいずれかを選択します。 - 入力と出力のパスを定義: 入力 PDF と出力 HTML のパスを設定します。
- 変換の実行:
PdfConverter の Convert メソッドを呼び出してファイルを変換します。
例: 埋め込みリソースで PDF を HTML に変換
1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);
PDF から HTML への変換で使用できるオプション
- SaveDataType:
FileWithEmbeddedResources: すべてのリソースが埋め込まれた単一の HTML ファイルを生成します。FileWithExternalResources: リソースを個別に保存し、大きな HTML ファイルに適しています。
PDFからDOCへ
The Documentize PDF Converter for .NET は、PDF ドキュメントを DOC 形式に変換するために設計された強力なツールです。このコンポーネントは PDF ページを編集可能な Microsoft Word ドキュメントへシームレスに変換し、複数のプラットフォームでコンテンツを再利用、編集、共有しやすくします。
How to Convert PDF to DOC
PDF ドキュメントを DOC 形式に変換するには、次の手順に従ってください。
PdfToDocOptions のインスタンスを作成し、変換プロセスを構成します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで結果ファイルの出力パスを指定します。Convert メソッドを実行して変換を実行します。
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Perform the process
8PdfConverter.Convert(options);
Converting PDF to DOC with Custom Options
PDF to DOC Converter プラグインは、変換プロセスをカスタマイズするためのさまざまなオプションを提供します。PDF のレイアウトと構造を変換時にどのように処理するかを制御するモードを選択できます。
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Set Mode
8options.Mode = DocConversionMode.Flow;
9// Perform the process
10PdfConverter.Convert(options);
Key Features:
- DOC Conversion: PDF ドキュメントを編集可能な Microsoft Word フォーマット(DOC)に変換します。
- Maintain Formatting: 変換プロセス中に元のレイアウト、テキスト、書式を保持します。
PDF を JPEG に変換
The Documentize PDF Converter for .NET は、PDF ドキュメントを高品質な JPEG 画像に変換する強力なツールです。このコンポーネントは、PDF ページを汎用的な画像形式に変換することで、コンテンツをさまざまなプラットフォームでより利用しやすくします。
PDF ページを JPEG に変換する方法
PDF ドキュメントを JPEG 画像に変換するには、次の手順を実行します。
PdfToJpegOptions のインスタンスを作成し、変換プロセスの設定を行います。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで JPEG 画像の出力ディレクトリパスを指定します。Convert メソッドを実行して、PDF ページを JPEG 画像に変換します。
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
PDF から JPEG への変換をカスタマイズする
解像度の調整、ページ範囲の選択、画像品質の設定などで変換プロセスをカスタマイズできます。例えば、PDF の最初のページを 200 DPI で変換するには次のようにします。
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Process only the first page
4options.PageList = [1];
5// Set output resolution to 200 DPI
6options.OutputResolution = 200;
7// Set output quality to 50
8options.Quality = 50;
9// Add input File path
10options.AddInput(new FileData("path_to_input.pdf"));
11// Set output Directory path
12options.AddOutput(new DirectoryData("path_to_output_directory"));
13// Perform the process
14PdfConverter.Convert(options);
ディレクトリを使用せずに、またはストリーム形式で結果を取得する方法
Convert メソッドは、変換結果に関する情報を保持する ResultContainer オブジェクトを返します。変換された JPEG ファイルのストリームは以下のように取得できます。
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主な機能:
- PDF を JPEG に変換: PDF 全体または特定のページを簡単に JPEG 画像に変換します。
- カスタム解像度: 高品質な出力のために解像度(例: 300 dpi)を調整できます。
- ページセット: 変換対象のページを選択できます。
- 高速変換: 手間を最小限に抑えた高速かつ効率的な処理を実現します。
PDF を PDF/A に変換
The Documentize PDF Converter for .NET は、PDF ドキュメントを PDF/A 形式に変換し、長期保存基準に準拠した状態を保つための強力なツールです。このコンポーネントは、既存の PDF ドキュメントの PDF/A コンプライアンスを検証する機能もサポートしており、変換と検証の両方を一つのソリューションで提供します。
How to Convert PDF to PDF/A
PDF ドキュメントを PDF/A 形式に変換するには、以下の手順に従います。
PdfToPdfAOptions のインスタンスを作成し、変換設定を構成します。- 目的の PDF/A バージョン(例: PDF/A-3B)を指定します。
AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで変換後の PDF/A の出力ファイルを指定します。Convert メソッドを呼び出して変換を実行します。
1// Create the options class to set up the conversion process
2var options = new PdfToPdfAOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Add the source file
8options.AddInput(new FileData("path_to_your_pdf_file.pdf")); // replace with your actual file path
9
10// Add the path to save the converted file
11options.AddOutput(new FileData("path_to_the_converted_file.pdf"));
12
13// Run the conversion
14PdfConverter.Convert(options);
Validating PDF/A Compliance
PdfAValidateOptions クラスを使用して、既存の PDF ファイルの PDF/A コンプライアンスを検証できます。
1// Create the options class to set up the validation process
2var options = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Add one or more files to be validated
8options.AddInput(new FileData("path_to_your_first_pdf_file.pdf")); // replace with your actual file path
9options.AddInput(new FileData("path_to_your_second_pdf_file.pdf"));
10// add more files as needed
11
12// Run the validation and get results
13var resultContainer = PdfConverter.Validate(options);
14
15// Check the resultContainer.ResultCollection property for validation results for each file:
16foreach (var result in resultContainer.ResultCollection)
17{
18 var validationResult = (PdfAValidationResult) result.Data;
19 var isValid = validationResult.IsValid; // Validation result for document
20}
Key Features:
- Convert to PDF/A: PDF ファイルを PDF/A 形式(PDF/A-1a、PDF/A-2b、PDF/A-3b など)にシームレスに変換し、保存基準への準拠を確保します。
- Validate PDF/A Compliance: 既存の PDF ドキュメントが PDF/A 標準に適合しているかチェックし、問題がある場合は特定します。
- Efficient Workflow: 高速で信頼性の高い変換プロセスにより、時間と労力を最小限に抑えます。
PDF to PNG
Documentize PDF Converter for .NET は、PDF 文書を高品質な PNG 画像へ変換できる高度なツールです。このコンポーネントは、PDF ページを広くサポートされている画像フォーマットに変換することで、コンテンツをより汎用的に、アクセスしやすく、共有しやすくします。
PDF を PNG に変換する方法
PDF 文書を PNG 画像に変換するには、次の手順に従います。
- 変換プロセスを構成するために
PdfToPngOptions のインスタンスを作成します。 AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで PNG 画像の出力ディレクトリパスを設定します。Convert メソッドを実行して、PDF ページを PNG 画像に変換します。
1 // Create PdfToPngOptions object to set instructions
2 var options = new PdfToPngOptions();
3 // Add input File path
4 options.AddInput(new FileData("path_to_input.pdf"));
5 // Set output Directory path
6 options.AddOutput(new DirectoryData("path_to_output_directory"));
7 // Perform the process
8 PdfConverter.Convert(options);
PDF から PNG への変換をカスタマイズする
解像度を調整したり、特定のページだけを選択したりして、変換をカスタマイズできます。たとえば、PDF の最初のページだけを 200 DPI で変換する場合は次のようにします。
1 // Create PdfToPngOptions object to set instructions
2 var options = new PdfToPngOptions()
3 // Process only the first page
4 options.PageList = [1];
5 // Set output resolution to 200 DPI
6 options.OutputResolution = 200;
7 // Add input File path
8 options.AddInput(new FileData("path_to_input.pdf"));
9 // Set output Directory path
10 options.AddOutput(new DirectoryData("path_to_output_directory"));
11 // Perform the process
12 PdfConverter.Convert(options);
変換結果の取り扱い
Convert メソッドは変換結果に関する情報を保持した ResultContainer オブジェクトを返します。変換された PNG ファイルのストリームは以下のように取得できます。
1 // Create PdfToJpegOptions object to set instructions
2 var options = new PdfToPngOptions();
3 // Add input File path
4 options.AddInput(new FileData("path_to_input.pdf"));
5 // Perform the process
6 var results = PdfConverter.Convert(options);
7 // Get stream results
8 foreach (var result in results.ResultCollection)
9 {
10 var streamResultPage1 = result.ToStream();
11 }
主な機能:
- PDF を PNG に変換: PDF 全体または特定のページを素早く効率的に PNG 画像へ変換します。
- 解像度のカスタマイズ: 高品質な画像出力のために任意の DPI(例: 300 DPI)を設定できます。
- ページ指定: 変換対象のページを選択できます。
- 出力管理が簡単: 変換された PNG ファイルごとに出力ディレクトリを指定できます。
- 高速変換: 設定が簡単で、迅速かつ効率的に変換を実行できます。
PDF to TIFF
Documentize PDF Converter for .NET は、PDF 文書を高品質な TIFF 画像に変換する強力なツールです。このコンポーネントは、優れた忠実度と汎用性を保ちつつ、コンテンツをさまざまなプラットフォームで利用できるようにします。
解像度の調整、マルチページ出力の有効化、ページの選択などで変換プロセスをカスタマイズできます。
PDF を TIFF に変換する方法
PDF 文書を TIFF 画像に変換するには、以下の手順に従います。
PdfToTiffOptions のインスタンスを作成し、変換プロセスを設定します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで TIFF 画像の出力パスを指定します。Convert メソッドを実行して、PDF ページを TIFF 画像に変換します。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
PDF から TIFF への変換でページと DPI をカスタマイズする
PDF の 2 ページを 400 DPI で TIFF ファイルに変換する例です。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Pages
8options.PageList = [1, 3];
9// Set result image Resolution
10options.OutputResolution = 400;
11// Perform the process
12PdfConverter.Convert(options);
マルチページ TIFF の作成
このプラグインはマルチページ TIFF の生成をサポートしており、複数の PDF ページを 1 つの TIFF ファイルに結合して、効率的なアーカイブや印刷が可能です。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Enable Multi-Page TIFF output
8options.MultiPage = true;
9// Perform the process
10PdfConverter.Convert(options);
PDF から TIFF への変換でページと DPI をカスタマイズする
PDF の 2 ページを 400 DPI で TIFF ファイルに変換する例です(圧縮と色深度の設定を含む)。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Compression and ColorDepth
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// Perform the process
11PdfConverter.Convert(options);
変換結果の扱い方
Convert メソッドは ResultContainer オブジェクトを返し、変換結果に関する詳細を提供します。以下のように変換された TIFF ファイルのストリームを取得できます。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主な機能
- PDF を TIFF に変換:PDF 全体または特定のページを簡単に TIFF 画像に変換します。
- カスタム解像度:解像度(例:300 dpi)を調整して、品質の高い出力を実現します。
- マルチページ TIFF:複数の PDF ページを 1 つのマルチページ TIFF ファイルに結合できます。
- ページ選択:変換対象のページを選択できます。
- 高速変換:最小限の手間で迅速かつ効率的に変換できます。
PDF を XLS に変換
The Documentize PDF Converter for .NET は、PDF ドキュメントを Excel スプレッドシート (XLSX/XLS/CSV/XLSM/ODS) に変換するための多機能で強力なツールです。このコンポーネントを活用することで、開発者は静的な PDF データを動的かつ編集可能なスプレッドシートへシームレスに変換でき、データ操作、分析、共有が簡単になります。
PDF を Excel に変換する方法
PDF ドキュメントを Excel ファイル (XLSX) に変換するには、以下の手順を実行します。
PdfToXlsOptions クラスを使用して変換設定を構成します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで出力ファイルのパスを指定します。Convert メソッドを実行して変換を開始します。
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);
PDF から Excel への変換をカスタマイズする
PdfToXlsOptions クラスを使って変換プロセスをカスタマイズできます。たとえば、PDF を XLS ファイルに変換し、詳細な書式設定オプションを有効にする場合は次のようにします。
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Specify XLS format
6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
7options.InsertBlankColumnAtFirst = true;
8options.MinimizeTheNumberOfWorksheets = true;
9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);
サポートされている出力フォーマット
PdfToXlsOptions.ExcelFormat enum は以下の出力フォーマットを提供します:
- XLSX: Office Open XML (.xlsx) ファイル形式 (デフォルト)。
- XLSM: マクロ対応 Excel 形式。
- CSV: カンマ区切り値。
- ODS: Open Document Spreadsheet。
- XMLSpreadSheet2003: Excel 2003 XML (.xls) ファイル形式。
主な機能
- 柔軟な変換オプション: PDF ファイルを XLSX、XLS、CSV などの形式に変換。
- コンテンツ保持: 元の構造、レイアウト、書式を維持。
- 高度な書式設定: 空白列の挿入やシート数の最小化が可能。
PDF Manager
Documentize の .NET ツールを使って PDF を簡単に結合 — 複数のファイルを 1 つにまとめ、品質と構造を保持します。
Documentize の .NET ツールで PDF を簡単に分割 — ページを抽出し、新しいファイルを作成し、正確にドキュメントを管理
Documentize PDF ManagerでPDFドキュメントを簡単に圧縮
Documentize PDF Manager で PDF ドキュメントのページサイズを簡単にリサイズ
Documentize PDF Manager で PDF ドキュメントのページを簡単に回転できます
Documentize の .NET ツールを使って、PDF を簡単に最適化しましょう—ファイルサイズを削減し、パフォーマンスを向上させ、品質を維持します
Documentize の .NET ツールでプロフェッショナルな PDF テーブルを生成 — レイアウト、スタイル、データを簡単にカスタマイズできます。
PDF ドキュメントの組織化とナビゲーションを向上させ、目次 (TOC) を動的に生成します
Documentize の ChatGPT 統合を使用して AI で PDF を強化し、コンテンツをインテリジェントに生成、編集、分析します。
PDF Managerのサブセクション
PDF を結合
The Documentize PDF Manager for .NET is a versatile tool designed to merge multiple PDF documents into a single file. It simplifies the consolidation of PDF files, ensuring your documents are merged efficiently and maintaining consistency across content. The component handles internal resources such as fonts and images to optimize the merged document.
PDF の結合方法
To merge multiple PDF documents into a single file, follow these steps:
- Create an instance of
MergeOptions to configure the merging process. - Add input PDF files using the
AddInput method. - Add output PDF file using
AddOutput method. - Execute the merge using the
Merge method of PdfManager class.
1// Create MergeOptions object to set instructions
2var options = new MergeOptions();
3// Add input file paths
4options.AddInput(new FileData("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileData("path_to_your_pdf_file_2.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfManager.Merge(options);
主な機能:
- Merge Multiple PDFs: Easily combine multiple PDF files into one.
- Resource Optimization: Removes duplicate fonts and images during merging.
- Batch Processing: Merge large batches of PDF documents in one go.
Split PDF
Documentize PDF Manager for .NET は、大きな PDF ドキュメントを小さく扱いやすいファイルに分割するプロセスを簡素化する強力なツールです。個別ページの抽出や、ドキュメントを特定のセクションに分割したい場合でも、このコンポーネントを使えば効率的かつ最小限の手間で実現できます。
How to Split PDF
PDF ドキュメントを個別ページに分割するには、以下の手順に従います。
SplitOptions のインスタンスを作成して、分割オプションを設定します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで各分割ページの出力ファイルを追加します。PdfManager クラスの Split メソッドを実行して、ドキュメントを分割します。
1// Create SplitOptions object to set instructions
2var options = new SplitOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file paths
6options.AddOutput(new FileData("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileData("path_to_result_pdf_file_2.pdf"));
8// Perform the process
9PdfManager.Split(options);
Key Features:
- Split PDF by Page: PDF ドキュメントを個別ページに分割します。
- Custom Split Options: 要件に合わせて分割プロセスを設定できます。
- Organized Output: 各分割ページまたはセクションの出力ファイルを簡単に管理できます。
Compress PDF
PDF Manager は、先進的な最適化手法を通じて PDF ドキュメントを強化する包括的なツールです。これらの操作により PDF ドキュメントを圧縮し、保存、共有、閲覧を容易にします。
PDF の圧縮
未使用のページリソースの削除、同一資産の統合、冗長オブジェクトの破棄により、可能な限り PDF ドキュメントを圧縮します。
- 圧縮設定を構成するために
CompressOptions オブジェクトを作成します。 - 入力ファイルを追加し、出力ファイルの場所を指定します。
SetCropBox メソッドを使用してクロップ領域を定義します。PdfManager の Compress メソッドを実行します。
1// Create CompressOptions object to set instructions
2var options = new CompressOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Compress(options);
主な機能:
- 圧縮: 文書から未使用のページリソースやオブジェクトを削除します。
PDFのページサイズを変更
PDF Manager クラスを使用して PDF ドキュメントのページサイズをリサイズできます。ResizeOptions を作成し、希望するページサイズを設定してリサイズ処理を実行します。結果の PDF は新しい寸法を反映し、特定の要件に合わせて調整されます。
PDF のリサイズ
PDF ドキュメントのリサイズには、ResizeOptions クラスを使用して新しいページサイズを指定します。
- ページサイズを定義するために ResizeOptions オブジェクトを作成します。
- 入力ファイルを追加し、出力先を設定します。
SetPageSize メソッドで新しいサイズ(例: A4)を指定します。PdfManager の Resize メソッドを実行します。
1// Create ResizeOptions object to set instructions
2var options = new ResizeOptions();
3// Set new PageSize
4options.PageSize = PageSize.A3;
5// Add input file path
6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
7// Set output file path
8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
9// Perform the process
10PdfManager.Resize(options);
主な機能:
- リサイズ: ページを特定の寸法に変更
- 利用可能なサイズ: A0、A1、A2、A3、A4、A5、A6、B5、Letter、Legal、Ledger、11x17 インチ。
PDFのページを回転
PDF Manager クラスを使用して PDF ドキュメントのページを回転できます。RotateOptions を作成した後、目的のページ角度を設定し、処理を実行します。結果の PDF は新しい寸法が反映され、特定の要件に合わせて調整されます。
PDF を回転
RotateOptions クラスを使用して PDF ファイル内のページの向きを調整します。
- RotateOptions オブジェクトを作成し、回転角度を設定します。
- 入力 PDF ファイルを追加し、出力ファイルの場所を指定します。
- SetRotation メソッド(例: 90 度)で回転角度を設定します。
PdfManager の Rotate メソッドを実行します。
1// Create RotateOptions object to set instructions
2var options = new RotateOptions();
3// Set new Rotation
4options.Rotation = Rotation.On90;
5// Add input file path
6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
7// Set output file path
8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
9// Perform the process
10PdfManager.Rotate(options);
主な機能:
- Rotation: PDF ページの向きを調整します。
PDFの最適化
The PDF Manager は、高度な最適化技術で PDF 文書を強化する包括的なツールです。ファイルサイズの削減、ページの回転、コンテンツのトリミング、文書のサイズ変更を支援するよう設計されています。これらの操作により、PDF ファイルの品質と管理性が向上し、保存、共有、閲覧が容易になります。最適化、または Web 用のリニアライズは、ウェブブラウザーでのオンライン閲覧に適した PDF ファイルにするプロセスを指します。
PDF の最適化
次の手順は、品質を維持しながら PDF 文書のファイルサイズを削減して最適化する方法を示しています。
- OptimizeOptions オブジェクトを作成して最適化設定を構成します。
- 入力 PDF ファイルを追加し、最適化されたファイルの出力先を設定します。
PdfManager の Optimize メソッドを実行して最適化を実行します。
1// Create OptimizeOptions object to set instructions
2var options = new OptimizeOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Optimize(options);
主な機能:
- 最適化: 品質を損なうことなく PDF ファイルサイズを削減します。
テーブルの追加
Documentize PDF Manager for .NET は、PDF ドキュメントにテーブルを組み込む作業を効率化する汎用コンポーネントです。データの整理、フォームの設計、ドキュメントの可読性向上など、さまざまなシナリオで正確かつ迅速にテーブル作成をサポートします。
テーブル付き PDF の作成
TableOptions クラスを使用して PDF に構造化されたテーブルを作成する手順は次のとおりです。
TableOptions オブジェクトを設定し、テーブルの構造・内容・入出力ファイルを定義します。- テーブル、行、セルを PDF に追加します。
AddTable メソッドでテーブル生成プロセスを完了します。
例として以下をご覧ください。
1// Configure table options
2var options = new TableOptions();
3options.InsertPageBefore(1)
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("Name")
7 .AddCell().AddParagraph("Age")
8 .AddRow()
9 .AddCell().AddParagraph("Bob")
10 .AddCell().AddParagraph("12")
11 .AddRow()
12 .AddCell().AddParagraph("Sam")
13 .AddCell().AddParagraph("20")
14 .AddRow()
15 .AddCell().AddParagraph("Sandy")
16 .AddCell().AddParagraph("26")
17 .AddRow()
18 .AddCell().AddParagraph("Tom")
19 .AddCell().AddParagraph("12")
20 .AddRow()
21 .AddCell().AddParagraph("Jim")
22 .AddCell().AddParagraph("27");
23// Add input file path
24options.AddInput(new FileData("path_to_input.pdf"));
25// Set output file path
26options.AddOutput(new FileData("path_to_output.pdf"));
27// Perform the process
28PdfManager.AddTable(options);
テーブルのページ指定
PDF の 2 ページ目の前にテーブルを作成する手順は以下の通りです。例を示します。
1// Configure table options
2var options = new TableOptions();
3options.InsertPageBefore(2) // Add table before page 2
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("Name")
7 .AddCell().AddParagraph("Age");
8// Add input file path
9options.AddInput(new FileData("path_to_input.pdf"));
10// Set output file path
11options.AddOutput(new FileData("path_to_output.pdf"));
12// Perform the process
13PdfManager.AddTable(options);
主な機能
- 動的テーブル作成: PDF ドキュメント内に構造化されたテーブルを手軽に生成。
- ページ配置: PDF の任意の位置に正確にテーブルを挿入。
- レイアウトカスタマイズ: テーブル構造、セルの配置、スタイリングを自由に調整。
TOC を追加
The Documentize PDF Manager for .NET is a powerful component designed to enhance the organization and navigation of PDF documents by dynamically generating a Table of Contents (TOC). This component simplifies the process of adding TOCs to your PDFs, making documents easier to navigate and manage.
PDF の目次を生成する方法
PDF ファイルに目次を作成するには、次の手順を実行します。
TocOptions のインスタンスを作成し、目次生成設定を構成します。Title プロパティでタイトルを設定します。Headings.Add メソッドで目次の見出しを設計します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput メソッドで目次付きの出力 PDF ファイルを指定します。AddTableOfContents メソッドを呼び出して目次を生成します。
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Design Headings
6options.Headings.Add(new TocHeading("Introduction", 2));
7options.Headings.Add(new TocHeading("Chapter I", 3));
8options.Headings.Add(new TocHeading("Chapter II", 4));
9options.Headings.Add(new TocHeading("Chapter III", 5));
10// Add input file path
11options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
12// Set output file path
13options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
14// Perform the process
15PdfManager.AddTableOfContents(options);
PDF の目次にブックマークを生成する
ブックマーク生成には GenerateBookmarks プロパティを使用できます。
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Generate links in bookmarks
6options.GenerateBookmarks = true;
7// Design Headings
8options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
9options.Headings.Add(new TocHeading("Chapter I", 3, true, 1));
10options.Headings.Add(new TocHeading("Chapter II", 4, true, 1));
11options.Headings.Add(new TocHeading("Example A", 4, true, 2));
12options.Headings.Add(new TocHeading("Example B", 4, true, 2));
13options.Headings.Add(new TocHeading("Example C", 4, true, 2));
14options.Headings.Add(new TocHeading("Example D", 4, true, 2));
15options.Headings.Add(new TocHeading("Chapter III", 5, true, 1));
16// Add input file path
17options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
18// Set output file path
19options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
20// Perform the process
21PdfManager.AddTableOfContents(options);
結果をストリームとして取得する方法
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Design Headings
6options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
7// Add input file path
8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
9// Set output stream
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamData(outputStream));
12options.CloseOutputStreams = false;
13// Perform the process
14PdfManager.AddTableOfContents(options);
TOC 見出しのカスタマイズ
TocHeading クラスを変更することで、目次の見出しをカスタマイズできます。たとえば GenerateNumbering を使用したり、手動で設定したりできます。
PageNumber プロパティはページへのリンクに使用されます。Level プロパティも利用可能です。
1// Create TocOptions object to set instructions
2var heading = new TocHeading();
3heading.Text = "Intro";
4heading.PageNumber = 5;
5heading.GenerateNumbering = true;
6heading.Level = 2;
7var tocOptions = new TocOptions();
8options.Headings.Add(heading);
9// Add input and output files
10tocOptions.AddInput(new FileData("path_to_your_pdf_file.pdf"));
11tocOptions.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
12// Generate the TOC with customized options
13PdfManager.AddTableOfContents(tocOptions);
主な機能
- 動的 TOC 生成: 見出しやブックマークに基づいてエントリを自動生成し、任意の PDF ファイルに目次を作成します。
- カスタマイズ: スタイル、書式設定、階層の深さなど、目次の外観と構造を自由に制御できます。
- 効率的なワークフロー: 大規模または複雑な文書でも、手動で目次を作成する時間を最小限に抑えます。
Use ChatGPT
The Documentize PDF Manager for .NET plugin は、ChatGPT API を PDF アプリケーションに統合するよう設計された強力なツールです。このプラグインにより、開発者は入力メッセージに基づいてチャット応答を生成し、その出力を PDF 形式で保存できるため、PDF ドキュメント内で対話型インターフェイスや分析レポートを直接作成するのに適しています。
Generate Chat Responses
ChatGPT プラグインを使用してチャット応答を生成し、PDF ファイルに保存するには、次の手順に従ってください。
ChatGptRequestOptions クラスのインスタンスを作成し、リクエストオプションを構成します。- 入力および出力の PDF ファイルを追加します。
- API キーを設定し、最大トークン数や ChatGPT モデルへのクエリなどのパラメータを指定します。
CreatePdfByChatGptRequestAsync メソッドを実行して、チャット完了を生成します。
1var options = new ChatGptRequestOptions();
2// Set output file path
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4options.ApiKey = "Your API key."; // You need to provide the key to access the API.
5options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
6
7// Add the request messages.
8options.Messages.Add(new Message
9{
10 Content = "You are a helpful assistant.",
11 Role = Role.System
12});
13options.Messages.Add(new Message
14{
15 Content = "What is the biggest pizza diameter ever made?",
16 Role = Role.User
17});
18
19// Process the request.
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.
Adding System and User Messages
よりインタラクティブな会話を作成するために、システムメッセージとユーザーメッセージの両方を追加できます。これらのメッセージは会話のコンテキストを形成するのに役立ちます。
- ChatGPT のコンテキストを設定するシステムメッセージを追加します。
- 会話のユーザー入力を表すユーザーメッセージを追加します。
1var options = new ChatGptRequestOptions();
2// Set output file path
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4
5// Add the PDF text source.
6// In case of multiple sources, the text from each document will be added to the request message collection
7// as a separate message with the role "user".
8options.AddInput(new FileData("TextSource.pdf"));
9
10options.ApiKey = "Your API key."; // You need to provide the key to access the API.
11options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
12
13// Add the request message.
14// In this case, the system message with Content = "You are a helpful assistant." is added by default.
15// The role of the query message is "user" by default.
16options.Query = "How many letters in the provided text?";
17
18// Process the request.
19var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
20
21var fileResultPath = result.ResultCollection[0].Data;
22var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.
Key Features:
- Chat Completions: カスタム入力に基づき ChatGPT API を使用して応答を生成します。
- System & User Messages: システムコンテキストとユーザー入力の両方を提供し、動的な会話を実現します。
- PDF Output: 生成されたチャット完了を構造化された PDF ファイルとして保存し、後続の利用が可能です。
- Asynchronous Processing: 非同期でチャット完了を処理し、アプリケーションの応答性を確保します。
PDF セキュリティのサブセクション
暗号化
Documentize PDF Security for .NET は、暗号化、復号化、署名機能を提供し、PDF ドキュメントのセキュリティを強化する強力なツールです。機密情報が機密に保たれ、許可されていないアクセスから保護されます。
PDF を暗号化する方法
PDF ドキュメントを暗号化するには、次の手順に従います。
- ユーザー パスワードと所有者パスワードを設定した
EncryptOptions のインスタンスを作成 します。 AddInput メソッドで入力 PDF ファイルを追加 します。AddOutput メソッドで出力 PDF ファイルを追加 します。PdfSecurity クラスの Encrypt メソッドを使用して暗号化を実行 します。
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);
主な機能:
- PDF ドキュメントの暗号化:ユーザー パスワードと所有者パスワードを設定して PDF ファイルを保護します。
- 自動化:暗号化および復号化を .NET アプリケーションに組み込んで、ワークフローを自動化できます。
- コンプライアンス:業界標準の文書セキュリティ要件を満たすようにドキュメントを保護します。
復号
The Documentize PDF Security for .NET is a powerful tool designed to enhance the security of your PDF documents by providing encryption, decryption and signing capabilities. It ensures that your sensitive information remains confidential and protected from unauthorized access.
PDF を復号する方法
- Create an instance of
DecryptionOptions with the necessary password. - Add the input PDF file using the
AddInput method. - Add the output PDF file using
AddOutput method. - Execute the encryption using the
Decrypt method of PdfSecurity class.
1// Create DecryptOptions object to set instructions
2var options = new DecryptOptions("123456");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Decrypt(options);
主な機能:
- Decrypt PDF Documents: Remove encryption from PDFs when needed.
- Automation: Integrate encryption and decryption into your .NET applications for automated workflows.
- Compliance: Ensure your documents meet industry standards for document security。
署名
Documentize PDF Security for .NET コンポーネントは、ユーザーが PDF ドキュメントにデジタル署名を行えるようにします。署名の追加プロセスを簡素化し、真正性を保証し、PDF コンテンツを保護します。コンポーネントは、表示可能な署名と非表示の署名の両方をサポートし、署名の位置、理由、連絡先情報などをカスタマイズするオプションを提供します。
PDF ドキュメントの署名方法
PFX ファイルを使用して PDF ドキュメントに署名するには、次の手順に従います。
- PFX ファイルのパスとパスワードを指定して
SignOptions クラスのインスタンスを作成します。 - 入力 PDF と出力ファイルをオプションに追加します。
Sign メソッドを実行して署名を適用します。
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Sign(options);
PFX ファイルをストリームで使用する方法
ファイルパスの代わりにストリームとして提供された PFX 証明書を使用して PDF に署名することも可能です。これにより、証明書の保存方法を柔軟に取り扱えます。
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
5// Perform the process
6PdfSecurity.Sign(options);
非表示署名の適用方法
ドキュメント上に署名を表示せずに文書を保護する非表示署名を追加するには、Visible プロパティを false に設定します。
SignOptions のインスタンスを作成します。Visible を false に設定します。- 入出力ファイルを追加します。
Sign を呼び出して非表示署名を適用します。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4// Configure invisible signature
5signOptions.Visible = false;
6// Perform the process
7PdfSecurity.Sign(options);
PDF ドキュメント署名の追加オプションの使用方法
署名時に Reason、Contact、Location、PageNumber などの追加オプションを設定できます。
- PFX ファイルのパスとパスワードで
SignOptions クラスのインスタンスを作成します。 - 入力 PDF と出力ファイルをオプションに追加します。
- 各種オプションに値を設定します。
Sign メソッドを実行して署名を適用します。
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Optional parameters
8options.Reason = "my Reason";
9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// Perform the process
13PdfSecurity.Sign(options);
PDF にタイムスタンプを追加する方法
PDF ドキュメントに安全なタイムスタンプを追加する手順は次のとおりです。
AddTimestampOptions のインスタンスを作成 してタイムスタンピングプロセスを設定します。AddInput メソッドで入力 PDF ファイルを追加します。AddOutput で出力ファイルのパスを設定します。Sign メソッドでタイムスタンピングを実行します。
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// Add input file path
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfSecurity.Sign(options);
タイムスタンプサーバーでカスタム認証を使用する方法
タイムスタンプサーバーに接続する際に基本認証情報を提供できます。これにより、ユーザー名とパスワードが必要なサーバーに認証できます。
1// Configure the timestamping options with authentication
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");
主な機能
- PDF ドキュメントのデジタル署名:表示可能または非表示のデジタル署名で文書を保護します。
- PFX のサポート:PFX 証明書を使用して PDF ファイルに署名できます。
- カスタマイズ可能なオプション:理由、場所、連絡先情報などの署名設定を構成できます。
- 表示・非表示署名:署名を文書上に表示するかどうかを選択できます。
- カスタムタイムスタンプサーバー:独自のタイムスタンプサーバー URL と認証資格情報を使用できます。
PDF抽出ツールのサブセクション
テキスト抽出
Documentize PDF Extractor for .NET は、PDF ドキュメントからテキストを抽出する作業を簡素化します。純粋なテキスト、ローモードのテキスト、またはプレーンテキストが必要な場合でも、このプラグインは、フォーマットを保持するか除外するかを選択しながら、効率的にテキストを抽出できます。
PDF ファイルからテキストを抽出するには、次の手順を実行します。
ExtractTextOptions のインスタンスを作成し、入力ファイル パスを設定します。Extract メソッドを実行してテキストを抽出します。
1// Create ExtractTextOptions object to set input file path
2var options = new ExtractTextOptions("path_to_your_pdf_file.pdf");
3// Perform the process and get the extracted text
4var textExtracted = PdfExtractor.Extract(options);
PDF ストリームからテキストを抽出するには、次の手順を実行します。
ExtractTextOptions のインスタンスを作成し、入力ストリームを設定します。Extract メソッドを実行してテキストを抽出します。
1// Create ExtractTextOptions object to set input stream
2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
3var options = new ExtractTextOptions(stream);
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
ExtractTextOptions は 3 つの抽出モードを提供し、ニーズに合わせた柔軟な選択が可能です。
- Pure Mode: スペースや配置を含む元の書式を保持します。
- Raw Mode: 書式なしでテキストを抽出し、ローデータの処理に適しています。
- Flatten Mode: PDF コンテンツを座標に基づくテキスト フラグメントとして表現します。
1// Create ExtractTextOptions object to set input file path and TextFormattingMode
2var options = new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure);
3// Perform the process and get the extracted text
4var textExtracted = PdfExtractor.Extract(options);
1// Perform the process and get the extracted text
2var textExtracted = PdfExtractor.Extract(new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure));
Key Features:
- Pure Mode: 元の書式を保持したままテキストを抽出します。
- Raw Mode: 書式なしでテキストを抽出します。
- Flatten Mode: 特殊文字や書式を除外してテキストを抽出します。
画像を抽出
The Documentize PDF Extractor for .NET プラグインを使用すると、PDF ドキュメントから画像を簡単に抽出できます。PDF ファイルをスキャンし、埋め込まれた画像を特定して、元の品質と形式を保ったまま抽出します。このツールはビジュアルコンテンツへのアクセス性を向上させ、PDF から画像を取得するプロセスを効率化します。
PDF から画像を抽出する方法
PDF ファイルから画像を抽出するには、次の手順に従ってください。
ExtractImagesOptions クラスのインスタンスを作成します。AddInput メソッドを使用して入力ファイルパスをオプションに追加します。AddOutput メソッドで画像の出力ディレクトリパスを設定します。- プラグインで画像抽出処理を実行します。
- 結果コンテナから抽出された画像を取得します。
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();
フォルダを使用せずにストリームへ画像を抽出する方法
PdfExtractor プラグインはストリームへの保存をサポートしており、テンポラリフォルダを使用せずに PDF ファイルから画像をストリームへ抽出できます。
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
主な機能
- 埋め込み画像の抽出: PDF ドキュメントから画像を特定し抽出します。
- 画像品質の維持: 抽出された画像は元の品質を保ちます。
- 柔軟な出力: 好みの形式や場所に抽出画像を保存できます。
プロパティの抽出 / メタデータ
Documentize PDF Extractor for .NET は、PDF 文書からメタデータを抽出する作業を簡素化します。
利用可能なプロパティの例: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。
PDF ファイルからメタデータを抽出する方法
この例では、PDF ファイルからプロパティ (Title、Author、Subject、Keywords、Number of Pages) を抽出する手順を示します。
PDF 文書からメタデータを抽出するには、次の手順を実行します。
ExtractPropertiesOptions のインスタンスを作成し、抽出オプションと入力 PDF ファイルを設定します。PdfExtractor の Extract メソッドを実行してメタデータを抽出します。PdfProperties を使用して抽出されたプロパティにアクセスします。
1// Create ExtractPropertiesOptions object to set input file
2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
3// Perform the process and get Properties
4var pdfProperties = PdfExtractor.Extract(options);
5var filename = pdfProperties.FileName;
6var title = pdfProperties.Title;
7var author = pdfProperties.Author;
8var subject = pdfProperties.Subject;
9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;
PDF ストリームからメタデータを抽出する方法
ストリームは任意のタイミングで開くことができます。
1// Create ExtractPropertiesOptions object to set input stream
2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
3var options = new ExtractPropertiesOptions(stream);
4// Perform the process and get Properties
5var pdfProperties = PdfExtractor.Extract(options);
6var title = pdfProperties.Title;
7var author = pdfProperties.Author;
8var subject = pdfProperties.Subject;
9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;
最も簡潔なスタイルで PDF ファイルからメタデータを抽出する方法
1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));
主な機能:
- 利用可能なメタデータ: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。
フォームデータのエクスポート
Documentize PDF Extractor for .NET プラグインは、PDF フォーム(AcroForms)からデータを抽出し、CSV などの他の形式へシームレスにエクスポートする手段を提供します。このダイナミックなツールは、フォームフィールドの値を取得するプロセスを簡素化し、データ管理・転送・分析を容易にします。
PDF から CSV へフォームデータをエクスポートする方法
PDF から CSV へフォームデータをエクスポートするには、以下の手順に従ってください。
ExtractImagesOptions クラスのインスタンスを作成します。FormExporterValuesToCsvOptions クラスを使用してエクスポートオプションを定義します。- 入力 PDF ファイルを追加し、出力 CSV ファイルを指定します。
Extract メソッドを実行してエクスポートを実行します。
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);
PDF から TSV へフォームデータをエクスポートする方法
区切り文字にタブを使用します。
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions();
3//Set Delimiter
4options.Delimiter = '\t';
5//Add Field Names to result
6options.AddFieldName = true;
7// Add input file path
8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
9// Set output file path
10options.AddOutput(new FileData("path_to_result_csv_file.tsv"));
11// Perform the process
12PdfExtractor.Extract(options);
主な機能
- フォームデータのエクスポート: PDF フォーム(AcroForms)から CSV などの形式へデータを抽出します。
- データフィルタリング: フィールドタイプやページ番号などの条件に基づき、エクスポート対象のフォームフィールドを述語でフィルタリングできます。
- 柔軟な出力: エクスポートしたデータをスプレッドシート、データベース、または他の文書形式へ分析・転送できるように保存します。