概述

Documentize 是一个全面的平台，提供用于管理 .NET 应用程序中 PDF 文档的 SDK。这些 SDK 简化了与 PDF 处理相关的复杂任务，增强了文档工作流程，使其对用户更加直观和高效。以下是其主要功能的概述：

核心功能

PDF 转换：
- 将 PDF 转换为多种格式，如 Microsoft Word (DOC/DOCX)、Excel (XLS/XLSX)、HTML、JPEG 和 PNG。
- 支持将 PDF 转换为 PDF/A 格式，适用于长期归档和符合保存标准。
文档操作：
- 合并和分割 PDF：轻松组合多个 PDF 文件或将大型文档拆分为更小、更易于管理的部分。
- 优化 PDF：压缩和增强 PDF 文档以减少文件大小，同时不影响内容质量。
文本提取：
- 精确提取文本，支持结构化和非结构化数据格式。
数字签名：
- 对 PDF 文档进行数字签名，以确保其真实性和完整性，为敏感文件提供安全性和信任。

专用 SDK

PDF 转 DOC 转换器：准确地将 PDF 内容转换为可编辑的 Word 文档，同时保留格式和布局。
PDF 转 Excel 转换器：从 PDF 中提取表格数据，并将其转换为 Excel 电子表格，以便进行进一步的数据分析。
ChatGPT 集成：使与 ChatGPT 的交互成为可能，将会话 AI 响应嵌入 PDF 中，以实现独特的文档增强。

使用与兼容性

Documentize SDK 旨在无缝集成到 .NET 应用程序 中，支持包括 Windows、macOS 和 Linux 在内的多个平台。这些 SDK 提供灵活且强大的 API，可以满足多样的文档处理需求，同时确保高性能和可靠性。

有关 SDK 及其与项目集成的详细信息，请访问官方网站。

安装

Documentize SDK 可以通过多种方法安装，针对不同的开发环境和偏好。以下是推荐的 Documentize 安装方式：

1. NuGet（首选方法）

NuGet 是安装 Documentize 最直接和首选的方法，确保您始终在开发环境中拥有最新版本和更新。有关此安装方法的更多详细信息，请查看如何使用 NuGet 安装 Documentize SDK。

2. MSI 安装程序

如果您希望将 Documentize DLL 直接安装到系统中，MSI 安装程序是一个方便的选项。这种方法非常适合希望在多个项目中使用 Documentize 的开发者，而无需手动管理 DLL 文件。有关此安装方法的更多详细信息，请查看如何使用 MSI 安装 Documentize SDK。

3. ZIP 归档

对于喜欢手动操作的开发者，ZIP 归档包含 Documentize DLL，可以直接提取并添加到您的项目中。有关此安装方法的更多详细信息，请查看如何使用 ZIP 安装 Documentize SDK。

系统要求

Documentize SDK 旨在与 .NET 应用程序集成，并支持多种操作系统和开发环境。以下是主要系统要求：

支持的操作系统

Windows

Windows 7 (x64, x86)
Windows 8, 8.1 (x64, x86)
Windows 10 (x64, x86)
Windows 11 (x64, x86)
Windows Server 2003 到 Windows Server 2022 (x64, x86)
云: Microsoft Azure

macOS

macOS 10.12 (Sierra) 及更高版本

Linux

兼容多种 Linux 发行版:
- Ubuntu (16.04, 18.04, 20.04, 22.04)
- CentOS (7, 8)
- Debian (9, 10)
- OpenSUSE (Leap 15+, SLES 12+)

Android

支持 Android 8.0 (Oreo) 及更高版本。

开发环境

Microsoft Visual Studio:
- Visual Studio 2010 及更高版本（包括 2019 和 2022）
支持任何以 .NET 平台为目标的开发环境。

支持的 .NET 框架

.NET Framework 4.0 及更高版本
.NET Standard 2.0 (.NET Core 3.1+)
.NET 6.0, .NET 7.0, .NET 8.0

其他说明

运行 Documentize SDK 不需要 Adobe Acrobat，但建议使用 Adobe Acrobat 查看 PDF 文件。

声明

Documentize.com SDK 在 .NET 应用程序中使用时需要完全信任权限集。此权限级别对于 SDK 执行某些系统级操作至关重要，例如访问注册表设置、系统文件和解析字体。

为什么需要完全信任

Documentize SDK 利用核心 .NET 系统类，这些类通常需要提升的权限，原因如下：

注册表访问：某些操作可能需要读取或写入系统注册表。
系统文件：访问超出应用程序虚拟目录的系统文件可能对于某些任务是必要的，例如处理字体或执行文件操作。

中级信任环境的限制

在强制执行中级信任安全的托管环境中，几个重要权限受到限制或不可用。这可能会阻止 SDK 在此类环境中正常运行。在中级信任下适用以下限制：

OleDbPermission：不能使用 ADO.NET 管理的 OLE DB 数据提供程序来访问数据库。
EventLogPermission：禁止访问 Windows 事件日志。
ReflectionPermission：阻止使用反射，这可能会影响某些动态操作。
RegistryPermission：拒绝访问系统注册表。
WebPermission：通信限制在 <trust> 元素中配置的预定义地址或范围内。
FileIOPermission：对文件的访问限制在应用程序的虚拟目录内。

Non-Windows Environment

Documentize SDKs 支持 .NET Standard 2.0，这使得它们可以在运行于Linux或其他非Windows环境的.NET Core应用程序中使用。为了确保最佳性能和正确的文本渲染，请按照以下步骤操作：

License and Evaluation

评估 Documentize for .NET

当您开始使用 Documentize 产品时，可以立即使用免费的评估许可证。此许可证允许开发人员和企业在购买之前探索、测试并将 Documentize 功能集成到他们的应用程序中。

什么是评估许可证？

评估许可证是每个 Documentize 产品中包含的内置无限期试用模式。它使您能够访问大多数核心功能，以便您可以在现实场景中充分评估产品的能力。无论您是在生成、编辑还是转换文档，都可以测试与您的技术栈的性能和集成。

评估许可证的关键特性

✅ 无需安装 – 只需下载并开始使用 Documentize 产品。
🧪 探索核心功能 – 测试文档转换、操作和导出等基本功能。
💻 面向开发者 – 适合概念验证 (POC)、集成测试或技术评估。
🔁 易于升级 – 随时切换到完整许可证，而无需更改您的实现。

如果您想升级到完整许可证，需要添加以下代码：

License.Set("path_to_your_license_file.lic");

评估模式的限制

虽然评估许可证提供广泛访问权限，但有一些限制旨在保护许可的产品：

所生成的 PDF 文档中的所有页面都有水印。
在评估版本中，您只能处理文档的前四页。
评估许可证不适用于生产或商业部署。

要获取没有限制的完全访问权限，您需要购买有效的 Documentize 许可证并在您的项目中应用它。

如何开始使用评估许可证

无需特殊设置。只需下载您想要的 Documentize SDK，并开始使用。如果未应用许可证文件，产品将自动以评估模式运行。

要测试有效许可证的行为，您也可以请求临时完整功能许可证以进行深入评估。

何时使用评估许可证

如果您满足以下条件，应使用评估许可证：

您第一次探索 Documentize 的功能。
您想确认与您的应用程序或平台的兼容性。
您需要在购买之前构建原型或概念验证。
您正在比较文档自动化解决方案。

今天就开始使用 Documentize

无风险评估 Documentize 产品，看看它们如何提升您的文档工作流程。当您准备好进入生产阶段时，升级到完整许可证的过程既快速又无缝。

📘 需要帮助吗？访问我们的文档或联系我们以获得帮助。

开发者指南

PDF Converter

PDF to HTML

使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式，以获得一致、专业的结果。

PDF to HTML

使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式，以获得一致、专业的结果。

PDF to DOC

使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。

HTML to PDF

使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式，以获得一致、专业的结果。

PDF to JPEG

使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。

PDF to PDF/A

使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。

PDF to PNG

使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。

PDF to TIFF

使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。

PDF to XLS

使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据，实现无缝分析和处理。

PDF Extractor

Extract Text

使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。

Extract Text

使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。

Extract Images

轻松从 .NET 应用程序中提取 PDF 文档中的图像

Export Form Data

从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式，如 CSV，使用 C# .NET

PDF Manager

Merge PDF

使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个，同时保持质量和结构。

Split PDF

轻松拆分PDF文档，使用Documentize的.NET工具—提取页面、创建新文件，以及精准管理文档

Merge PDF

使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个，同时保持质量和结构。

Split PDF

轻松拆分PDF文档，使用Documentize的.NET工具—提取页面、创建新文件，以及精准管理文档

Optimize PDF

使用Documentize的.NET工具轻松优化您的PDF——减小文件大小，提高性能，保持质量

Add Table

使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。

Add TOC

通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航

Use ChatGPT

使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。

PDF Security

Encrypt

使用 Documentize 的 .NET 工具加密您的 PDF 文件，以保护敏感信息。

Decrypt

使用 Documentize 的 .NET 工具解密您的 PDF 文件，以打开文档。

Encrypt

使用 Documentize 的 .NET 工具加密您的 PDF 文件，以保护敏感信息。

Decrypt

使用 Documentize 的 .NET 工具解密您的 PDF 文件，以打开文档。

Sign

使用 Documentize 的 .NET 工具数字签名 PDF 文件——轻松确保安全性、真实性和合规性。

PDF Form

PDF Form Flattener

将交互式 PDF 表单转换为不可编辑的文档，使其免受 unauthorized 修改

PDF Form Flattener

将交互式 PDF 表单转换为不可编辑的文档，使其免受 unauthorized 修改

PDF Converter

PDF to HTML

使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式，以获得一致、专业的结果。

PDF to DOC

使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。

HTML to PDF

使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式，以获得一致、专业的结果。

PDF to JPEG

使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。

PDF to PDF/A

使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。

PDF to PNG

使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。

PDF to TIFF

使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。

PDF to XLS

使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据，实现无缝分析和处理。

PDF to HTML

Documentize PDF Converter for .NET 提供强大的文档 PDF 转换为 HTML 格式的功能，适用于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项，转换器能够适应不同的项目要求。

转换 PDF 为 HTML

将 PDF 文件转换为 HTML，使文档可用于 Web 浏览或集成到更喜欢 HTML 格式的应用程序中。

配置选项：使用 PdfToHtmlOptions 自定义输出，选择嵌入资源或外部资源。
定义输入和输出路径：设置输入 PDF 和输出 HTML 的路径。
执行转换：调用 PdfConverter 的 Convert 方法来转换文件。

示例：使用嵌入资源将 PDF 转换为 HTML

1// 创建 PdfToHtmlOptions 对象，以将输出数据类型设置为带嵌入资源的文件
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.html"));
7// 执行处理
8PdfConverter.Convert(options);

可用于 PDF 转 HTML 转换的选项

SaveDataType：
- FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单个 HTML 文件。
- FileWithExternalResources: 将资源单独保存，适合大型 HTML 文件。

PDF to DOC

Documentize PDF Converter for .NET 是一个强大的工具，旨在将 PDF 文档转换为 DOC 或 DOCX 格式。此插件无缝地将 PDF 页面转换为可编辑的 Microsoft Word 文档，使内容在多个平台之间的重用、编辑和共享变得简单。

如何将 PDF 转换为 DOC/DOCX

要将 PDF 文档转换为 DOC/DOCX 格式，请按照以下步骤操作：

创建一个 PdfToDocOptions 的实例以配置转换过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出文件路径。
运行 Convert 方法以执行转换。

1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 执行操作
8PdfConverter.Convert(options);

使用自定义选项转换 PDF 到 DOC

PDF to DOC Converter 插件提供了多个选项，以自定义您的转换过程。您可以选择不同的模式，以控制在转换过程中 PDF 的布局和结构如何处理。

 1// 创建 PdfToDocOptions 对象以设置指令
 2var options = new PdfToDocOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出文件路径
 6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
 7// 设置模式
 8options.Mode = DocConversionMode.Flow;
 9// 执行操作
10PdfConverter.Convert(options);

主要特点：

DOC/DOCX 转换：将 PDF 文档转换为可编辑的 Microsoft Word 格式（DOC 或 DOCX）。
保持格式：在转换过程中保留原始布局、文本和格式。
自定义转换选项：通过不同模式微调转换过程，例如增强流模式，以获得更好的布局。

HTML to PDF

Documentize PDF Converter for .NET 提供强大的功能，用于在 HTML 和 PDF 格式之间转换文档，非常适合用于 Web 应用程序、归档和报告生成。凭借多种处理资源和布局的选项，转换器能够适应各种项目需求。

将 HTML 转换为 PDF

将 HTML 内容转换为高质量的 PDF，非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。要将 HTML 文档转换为 PDF，请按照以下步骤操作：

配置选项：使用 HtmlToPdfOptions 定义布局和媒体设置。
指定路径：设置输入 HTML 和输出 PDF 文件的路径。
执行转换：运行 PdfConverter 的 Convert 方法以转换文件。

示例：将 HTML 转换为 PDF

1// 创建 HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.html"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.pdf"));
7// 执行过程
8PdfConverter.Convert(options);

HTML 转 PDF 转换的其他选项

媒体类型：
- HtmlMediaType.Print：适合生成适合打印的 PDF。
- HtmlMediaType.Screen：在转换为设计用于数字观看的内容时使用。
布局调整：
- PageLayoutOption：调整 HTML 内容如何适应 PDF 布局，例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
- IsRenderToSinglePage：如果需要进行简洁的展示，可启用将整个 HTML 内容呈现在单个 PDF 页面上。

该转换器适用于多种应用，从基于 Web 内容生成 PDF 报告到转换 PDF 文档归档以便于 Web 可访问性。有关更高级的配置，请参考完整的 Documentize 文档。

PDF to JPEG

Documentize PDF Converter for .NET 是一款强大的工具，可以简化PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式，使您的内容在各平台上更易访问。

如何将PDF页面转换为JPEG

要将PDF文档转换为JPEG图像，请按照以下步骤操作：

创建一个PdfToJpegOptions实例以配置转换过程。
使用AddInput方法添加输入PDF文件。
使用AddOutput方法设置JPEG图像的输出目录路径。
运行Convert方法将PDF页面转换为JPEG图像。

1  
2// 创建PdfToJpegOptions对象以设置指令  
3var options = new PdfToJpegOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_input.pdf"));  
6// 设置输出目录路径  
7options.AddOutput(new DirectoryDataSource("path_to_output_directory"));  
8// 执行转换  
9PdfConverter.Convert(options);

自定义PDF到JPEG转换

您可以通过调整分辨率、选择页面范围或设置图像质量来定制转换过程。以下是如何以200 DPI转换PDF的第一页：

 1  
 2// 创建PdfToJpegOptions对象以设置指令  
 3var options = new PdfToJpegOptions();  
 4// 仅处理第一页  
 5options.PageList = [1];  
 6// 设置输出分辨率为200 DPI  
 7options.OutputResolution = 200;  
 8// 设置输出质量为50  
 9options.Quality = 50;  
10// 添加输入文件路径  
11options.AddInput(new FileDataSource("path_to_input.pdf"));  
12// 设置输出目录路径  
13options.AddOutput(new DirectoryDataSource("path_to_output_directory"));  
14// 执行转换  
15PdfConverter.Convert(options);

如何在没有目录的情况下获取结果，或以流的形式获取

Convert 方法返回一个 ResultContainer 对象，其中包含有关转换结果的信息。您可以获取已转换JPEG文件的流，如下所示：

 1  
 2// 创建PdfToJpegOptions对象以设置指令  
 3var options = new PdfToJpegOptions();  
 4// 添加输入文件路径  
 5options.AddInput(new FileDataSource("path_to_input.pdf"));  
 6// 执行转换  
 7var results = PdfConverter.Convert(options);  
 8// 获取流结果  
 9foreach (var result in results.ResultCollection)  
10{  
11    var streamResultPage1 = result.ToStream();  
12}

关键特性：

将PDF转换为JPEG：轻松将整个PDF文档或特定页面转换为JPEG图像。
自定义分辨率：调整分辨率（例如，300 dpi）以获得高质量输出。
页面设置：选择特定页面进行转换。
快速转换：快速高效的过程，最小化努力。

PDF to PDF/A

Documentize PDF Converter for .NET 是一个强大的工具，旨在将PDF文档转换为PDF/A格式，确保您的内容符合长期归档标准。该插件还支持验证现有PDF文档的PDF/A合规性，提供转换和验证功能于单一解决方案中。

如何将PDF转换为PDF/A

要将PDF文档转换为PDF/A格式，请按照以下步骤操作：

创建一个 PdfToPdfAOptions 的实例以配置转换。
指定所需的PDF/A版本（例如，PDF/A-3B）。
使用 AddInput 方法添加输入PDF文件。
使用 AddOutput 方法添加输出PDF/A文件。
调用 Convert 方法以执行转换。

 1// 创建选项类以设置转换过程
 2var options = new PdfToPdfAOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// 添加源文件
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // 替换为您的实际文件路径
 9
10// 添加转换后文件保存的路径
11options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
12
13// 运行转换
14PdfConverter.Convert(options);

验证PDF/A合规性

您可以使用 PdfAValidateOptions 类验证现有PDF文件的PDF/A合规性。

 1// 创建选项类以设置验证过程
 2var options = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// 添加要验证的一或多个文件
 8options.AddInput(new FileDataSource("path_to_your_first_pdf_file.pdf")); // 替换为您的实际文件路径
 9options.AddInput(new FileDataSource("path_to_your_second_pdf_file.pdf"));
10// 根据需要添加更多文件
11
12// 运行验证并获取结果
13var resultContainer = PdfConverter.Validate(options);
14
15// 检查 resultContainer.ResultCollection 属性以获取每个文件的验证结果：
16for (var i = 0; i < resultContainer.ResultCollection.Count; i++)
17{
18    var result = resultContainer.ResultCollection[i];
19    var validationResult = (PdfAValidationResult) result.Data;
20    var isValid = validationResult.IsValid; // 第 i 个文档的验证结果
21}

主要功能：

转换为PDF/A：将PDF文件无缝转换为PDF/A格式（如PDF/A-1a、PDF/A-2b、PDF/A-3b），以确保符合归档标准。
验证PDF/A合规性：检查现有PDF文档是否符合PDF/A标准，并识别不合规的问题。
高效工作流程：通过快速可靠的转换过程来最小化时间和精力。

PDF to PNG

Documentize PDF Converter for .NET 是一款先进的工具，可以将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式，使您的内容更加多样化、可访问，并且更易于分享。

如何将 PDF 转换为 PNG

要将 PDF 文档转换为 PNG 图像，请按照以下步骤操作：

创建一个 PdfToPngOptions 实例以配置转换过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法设置 PNG 图像的输出目录路径。
运行 Convert 方法将 PDF 页面转换为 PNG 图像。

1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);

自定义 PDF 到 PNG 转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如，要以 200 DPI 转换 PDF 的第一页：

 1// 创建 PdfToPngOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 仅处理第一页
 4options.PageList = [1];
 5// 设置输出分辨率为 200 DPI
 6options.OutputResolution = 200;
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行过程
12PdfConverter.Convert(options);

处理转换结果

Convert 方法返回一个 ResultContainer 对象，该对象保存有关转换结果的信息。您可以如下获取转换后的 PNG 文件的流：

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行过程
 6var results = PdfConverter.Convert(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点：

将 PDF 转换为 PNG：快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
可自定义的分辨率：设置所需的 DPI（例如，300 DPI）以获取高质量图像输出。
页面集：选择特定页面进行转换。
简单的输出管理：为每个转换后的 PNG 文件指定输出目录。
快速转换：快速、高效，配置所需的努力最小。

PDF to TIFF

Documentize PDF 转换器 for .NET 是一款强大的工具，旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件可确保您的内容在各种平台上可访问，同时保持出色的保真度和灵活性。您可以通过调整分辨率、启用多页输出或选择页面来自定义转换过程。

如何将 PDF 转换为 TIFF

要将 PDF 文档转换为 TIFF 图像，请按照以下步骤操作：

创建一个 PdfToTiffOptions 实例以配置转换过程。
使用 AddInput 方法添加输入的 PDF 文件。
使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
运行 Convert 方法将 PDF 页面转换为 TIFF 图像。

1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置页面
 8options.PageList = [1, 3];
 9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行过程
12PdfConverter.Convert(options);

多页 TIFF 创建

该插件支持多页 TIFF 生成，允许您将多个 PDF 页面合并为单个 TIFF 文件，以便高效归档或打印。

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 启用多页 TIFF 输出
 8options.MultiPage = true;
 9// 执行过程
10PdfConverter.Convert(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置压缩和色深
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行过程
11PdfConverter.Convert(options);

如何处理转换结果

Convert 方法返回一个 ResultContainer 对象，提供有关转换结果的详细信息。您可以获取转换后 TIFF 文件的流，如下所示：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行过程
 6var results = PdfConverter.Convert(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点：

将 PDF 转换为 TIFF: 轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
自定义分辨率: 调整分辨率（例如，300 dpi）以获得优质输出。
多页 TIFF: 将多个 PDF 页面合并为单个多页 TIFF 文件。
页面设置: 选择特定页面进行转换。
快速转换: 过程快速高效，尽量减少工作量。

PDF to XLS

Documentize PDF Converter for .NET 是一个多功能且强大的工具，可以将 PDF 文档转换为 Excel 电子表格（XLSX/XLS/CSV/XLSM/ODS）。通过利用这个插件，开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格，简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件（XLSX），请遵循以下步骤：

使用 PdfToXlsOptions 类配置转换设置。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法指定输出文件路径。
执行 Convert 方法以启动转换。

1  
2// 创建 PdfToXlsOptions 对象以设置指令  
3var options = new PdfToXlsOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
6// 设置输出文件路径  
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));  
8// 执行处理  
9PdfConverter.Convert(options);

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如，要将 PDF 转换为 XLS 文件并启用高级格式选项：

 1  
 2// 创建 PdfToXlsOptions 对象以设置指令  
 3var options = new PdfToXlsOptions();  
 4// 添加输入文件路径  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 6// 指定 XLS 格式  
 7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  
 8options.InsertBlankColumnAtFirst = true;  
 9options.MinimizeTheNumberOfWorksheets = true;  
10// 设置输出文件路径  
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));  
12// 执行处理  
13PdfConverter.Convert(options);

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式：

XLSX：Office Open XML (.xlsx) 文件格式（默认）。
XLSM：启用宏的 Excel 格式。
CSV：逗号分隔值。
ODS：开放文档电子表格。
XMLSpreadSheet2003：Excel 2003 XML (.xls) 文件格式。

主要特点：

灵活的转换选项：将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
内容保留：保持原始结构、布局和格式。
高级格式：插入空白列或最小化工作表数量。

PDF Extractor

Extract Text

使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。

Extract Images

轻松从 .NET 应用程序中提取 PDF 文档中的图像

Export Form Data

从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式，如 CSV，使用 C# .NET

Extract Text

Documentize PDF Extractor for .NET 使从 PDF 文档中提取文本变得简单。无论您需要纯文本、原始文本还是简洁文本，此插件都允许您高效地提取文本，同时根据您的需求保留格式或省略格式。

如何从 PDF 中提取文本

要从 PDF 文档中提取文本，请按照以下步骤操作：

创建一个 ExtractTextOptions 的实例以配置提取选项。
使用 AddInput 方法添加输入 PDF 文件。
运行 ExtractText 方法以提取文本。
使用 ResultContainer.ResultCollection 访问提取的文本。

1// 创建 ExtractTextOptions 对象以设置指令
2var options = new ExtractTextOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

文本提取模式

ExtractTextOptions 提供三种提取模式，根据您的需求提供灵活性。

纯模式：保留原始格式，包括空格和对齐。
原始模式：提取未经格式化的文本，适用于原始数据处理。
扁平模式：通过其坐标显示 PDF 内容的定位文本片段。

1// 创建 ExtractTextOptions 对象以设置 TextFormattingMode
2var options = new ExtractTextOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

主要特性：

纯模式：提取文本时保留其原始格式。
原始模式：提取文本时不进行任何格式化。
扁平模式：提取文本时不带特殊字符或格式。

Extract Images

Documentize PDF Extractor for .NET 插件使您能够轻松地从 PDF 文档中提取图像。它扫描您的 PDF 文件，识别嵌入的图像，并在保持其原始质量和格式的同时提取这些图像。该工具增强了视觉内容的可访问性，并简化了从 PDF 中检索图像的过程。

如何从 PDF 中提取图像

要从 PDF 文件中提取图像，请按照以下步骤操作：

创建 ExtractImagesOptions 类的实例。
使用 AddInput 方法将输入文件路径添加到选项中。
使用 AddOutput 方法设置图像的输出目录路径。
使用插件处理图像提取。
从结果容器中检索提取的图像。

 1// 创建 ExtractImagesOptions 以设置指令
 2var options = new ExtractImagesOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// 执行该过程
 8var results = PdfExtractor.ExtractImages(options);
 9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();

从 PDF 文件提取图像到流而不使用文件夹

PdfExtractor 插件支持保存到流，这使您能够从 PDF 文件中提取图像到流，而不使用临时文件夹。

 1// 创建 ExtractImagesOptions 以设置指令
 2var options = new ExtractImagesOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 不设置输出 - 它将结果写入流
 6// 执行该过程
 7var results = PdfExtractor.ExtractImages(options);
 8// 获取流
 9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

关键特点：

提取嵌入图像：识别并提取 PDF 文档中的图像。
保持图像质量：确保提取的图像保持其原始质量。
灵活输出：以您喜欢的格式或位置保存提取的图像。

Export Form Data

Documentize PDF Extractor for .NET 插件提供了一种无缝的方式来从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式，如 CSV。这个动态工具简化了检索表单字段值的过程，便于数据管理、传输和分析。

如何从 PDF 导出表单数据

要将表单数据从 PDF 导出到 CSV，请按照以下步骤操作：

创建 ExtractImagesOptions 类的实例。
使用 FormExporterValuesToCsvOptions 类定义导出选项。
添加输入 PDF 文件并指定输出 CSV 文件。
运行 Process 方法以执行导出。

1// 创建 ExtractFormDataToDsvOptions 对象以设置指令
2var options = new ExtractFormDataToDsvOptions(',', true);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// 执行处理
8PdfExtractor.ExtractFormData(options);

主要特性：

导出表单数据：将 PDF 表单 (AcroForms) 中的数据提取到 CSV 或其他格式。
数据过滤：使用谓词根据字段类型或页面号码等标准过滤特定表单字段以便导出。
灵活输出：将导出的数据保存以供分析，或转移到电子表格、数据库或其他文档格式。

PDF Manager

Merge PDF

使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个，同时保持质量和结构。

Split PDF

轻松拆分PDF文档，使用Documentize的.NET工具—提取页面、创建新文件，以及精准管理文档

Optimize PDF

使用Documentize的.NET工具轻松优化您的PDF——减小文件大小，提高性能，保持质量

Add Table

使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。

Add TOC

通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航

Use ChatGPT

使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。

Merge PDF

Documentize PDF 管理器 for .NET 是一个多功能工具，专为将多个 PDF 文档合并为一个文件而设计。它简化了 PDF 文件的整合，确保高效合并文档，并保持内容的一致性。该插件处理内部资源，如字体和图像，以优化合并后的文档。

如何合并 PDF

要将多个 PDF 文档合并为一个文件，请按照以下步骤操作：

创建 MergeOptions 实例以配置合并过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 PdfManager 类的 Merge 方法执行合并。

1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行过程
9PdfManager.Merge(options);

如何合并指定页面范围的 PDF

您也可以使用 MergeOptions 类合并输入 PDF 文件中的特定页面范围。这允许您将选定页面组合到最终输出文档中。

创建 Merger 类的实例。
使用 MergeOptions 配置页面范围。
添加具有指定页面范围的输入文件。
设置输出路径。
调用 Process 方法。

 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 合并输入 PDF 的特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行过程
12merger.Process(mergeOptions);

如何处理批量合并

PDF Merger 插件经过优化，以处理大量 PDF 文档。通过利用批处理功能，您可以在一次操作中合并数百个 PDF，确保高效和快速的文档管理。

实例化 Merger 类。
将所有输入 PDF 文件添加到 MergeOptions 类。
指定输出路径。
调用 Process 方法以合并批处理中的所有文件。

 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDF 进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

主要特点：

合并多个 PDF：轻松将多个 PDF 文件合并为一个。
资源优化：合并过程中移除重复的字体和图像。
批量处理：一次合并大量 PDF 文档。

Split PDF

Documentize PDF Manager for .NET 是一款强大的工具，可以简化将大型PDF文档拆分为更小、更易管理的文件的过程。无论您是需要提取单独的页面，还是将文档划分为特定的部分，该插件都能高效实现，并且付出最少的努力。

如何拆分PDF

要将PDF文档拆分为单独的页面，请按照以下步骤操作：

创建 SplitOptions 的实例以配置拆分选项。
使用 AddInput 方法添加输入PDF文件。
使用 AddOutput 方法为每个拆分页面添加输出文件。
在 PdfManager 类中运行 Split 方法以拆分文档。

1// 创建SplitOptions对象以设置指令
2var options = new SplitOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
8// 执行处理
9PdfManager.Split(options);

按页范围拆分PDF

您还可以通过指定页范围来拆分PDF。这允许您将特定部分或多个页面从PDF中提取到单独的文档中。

 1var splitter = new Splitter();
 2var splitOptions = new SplitOptions();
 3
 4// 添加输入PDF
 5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 定义页范围的输出（例如，页码 1-3）
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
 9
10// 处理拆分
11splitter.Process(splitOptions);

如何处理批量拆分

PDF Splitter 插件已针对处理大量PDF文档进行了优化。您可以利用批处理将数百个PDF拆分为单独的页面或部分。

 1var splitter = new Splitter();
 2var splitOptions = new SplitOptions();
 3
 4// 批量添加输入PDF文件
 5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 定义每个文件的输出
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);

主要特性：

按页面拆分PDF：将PDF文档拆解为单独的页面。
自定义拆分选项：根据您的需求配置拆分过程。
整齐的输出：轻松管理每个拆分页面或部分的输出文件。

Optimize PDF

Documentize PDF管理器 for .NET 是一个全面的插件，通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小、旋转页面、裁剪内容和调整文档大小。这些操作改善了PDF文件的质量和可管理性，使存储、共享和查看变得更加容易。

优化PDF

以下步骤演示如何通过减小PDF文档的文件大小而保持质量来优化PDF文档。

创建一个OptimizeOptions对象以配置优化设置。
添加输入PDF文件，并设置优化后文件的输出位置。
运行PdfManager的Optimize方法以执行优化。

1  
2// 创建OptimizeOptions对象以设置指令  
3var options = new OptimizeOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
6// 设置输出文件路径  
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));  
8// 执行处理  
9PdfManager.Optimize(options);

旋转PDF

使用RotateOptions类调整PDF文件中页面的方向。

创建一个RotateOptions对象并配置旋转角度。
添加输入PDF文件并指定输出文件位置。
使用SetRotation方法设置旋转角度（例如，90度）。
运行PdfManager的Rotate方法。

 1  
 2// 创建RotateOptions对象以设置指令  
 3var options = new RotateOptions();  
 4// 设置新的旋转  
 5options.Rotation = Rotation.On90;  
 6// 添加输入文件路径  
 7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 8// 设置输出文件路径  
 9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));  
10// 执行处理  
11PdfManager.Rotate(options);

调整PDF大小

要调整PDF文档的大小，可以使用ResizeOptions类指定文档的新页面大小。

创建一个ResizeOptions对象以定义页面大小。
添加输入文件并设置所需的输出位置。
使用SetPageSize方法指定新大小（例如，A4）。
运行PdfManager的Resize方法。

 1  
 2// 创建ResizeOptions对象以设置指令  
 3var options = new ResizeOptions();  
 4// 设置新的页面大小  
 5options.PageSize = PageSize.A3;  
 6// 添加输入文件路径  
 7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 8// 设置输出文件路径  
 9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));  
10// 执行处理  
11PdfManager.Resize(options);

压缩PDF

在可行的情况下，通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来压缩PDF文档。

创建一个CompressOptions对象以配置优化设置。
添加输入文件并指定输出文件位置。
使用SetCropBox方法定义裁剪区域。
运行PdfManager的Compress方法。

1  
2// 创建CompressOptions对象以设置指令  
3var options = new CompressOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
6// 设置输出文件路径  
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));  
8// 执行处理  
9PdfManager.Compress(options);

主要特点：

优化：在不损失质量的情况下减小PDF文件大小。
旋转：调整PDF页面的方向。
调整大小：将页面调整为特定尺寸（例如，A4、信纸）。
压缩：从文档中删除未使用的页面资源和对象。

Add Table

Documentize PDF 管理器 for .NET 是一个多功能插件，旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单还是改善文档可读性，这个插件都可以在保持精确和高效的同时简化这一过程。其直观的 API 支持单文档和批量处理工作流，使其成为处理结构化数据的开发人员必不可少的工具。

创建带有表格的 PDF

按照以下步骤使用 TableOptions 类在 PDF 中创建结构化表格：

配置 TableOptions 对象，以定义表格结构、内容和输入/输出文件。
将表格、行和单元格添加到您的 PDF 中。
使用 AddTable 方法完成表格生成过程。

这里是一个示例：

 1// 配置表格选项
 2var options = new TableOptions();
 3options.InsertPageBefore(1)
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("姓名")
 7            .AddCell().AddParagraph("年龄")
 8        .AddRow()
 9            .AddCell().AddParagraph("鲍勃")
10            .AddCell().AddParagraph("12")
11        .AddRow()
12            .AddCell().AddParagraph("山姆")
13            .AddCell().AddParagraph("20")
14        .AddRow()
15            .AddCell().AddParagraph("桑迪")
16            .AddCell().AddParagraph("26")
17        .AddRow()
18            .AddCell().AddParagraph("汤姆")
19            .AddCell().AddParagraph("12")
20        .AddRow()
21            .AddCell().AddParagraph("吉姆")
22            .AddCell().AddParagraph("27");
23// 添加输入文件路径
24options.AddInput(new FileDataSource("path_to_input.pdf"));
25// 设置输出文件路径
26options.AddOutput(new FileDataSource("path_to_output.pdf"));
27// 执行过程
28PdfManager.AddTable(options);

设置表格页码

按照以下步骤在 PDF 中的第 2 页后创建表格：这里是一个示例：

 1var options = new TableOptions();
 2options.InsertPageBefore(2) // 在第 2 页之前添加表格
 3   .AddTable()
 4        .AddRow()
 5            .AddCell().AddParagraph("姓名")
 6            .AddCell().AddParagraph("年龄")
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_output.pdf"));
11// 执行过程
12PdfManager.AddTable(options);

关键特性：

动态表格创建：轻松在 PDF 文档中生成结构化表格。
页面位置：精确地在 PDF 中的特定位置插入表格。
可自定义布局：调整表格结构、单元格对齐和样式。

Add TOC

Documentize PDF Manager for .NET 是一个强大的插件，旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。此插件简化了将 TOC 添加到 PDF 的过程，使文档更易于导航和管理。

如何为 PDF 生成 TOC

要在 PDF 文件中创建目录，按照以下步骤操作：

创建一个 TocOptions 实例以配置 TOC 生成设置。
使用 Title 属性设置标题。
使用 Headings.Add 方法设计 TOC 的标题。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法指定带有 TOC 的输出 PDF 文件。
调用 AddTableOfContents 方法生成 TOC。

 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 设计标题
 6options.Headings.Add(new TocHeading("引言", 2));
 7options.Headings.Add(new TocHeading("第一章", 3));
 8options.Headings.Add(new TocHeading("第二章", 4));
 9options.Headings.Add(new TocHeading("第三章", 5));
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 设置输出文件路径
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// 执行该过程
15PdfManager.AddTableOfContents(options);

在 PDF 的 TOC 中生成书签

您可以使用 ‘GenerateBookmarks’ 属性来生成书签。

 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 在书签中生成链接
 6options.GenerateBookmarks = true;
 7// 设计标题
 8options.Headings.Add(new TocHeading("引言", 2, false, 1));
 9options.Headings.Add(new TocHeading("第一章", 3, true, 1));
10options.Headings.Add(new TocHeading("第二章", 4, true, 1));
11options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
12options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
13options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
14options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
15options.Headings.Add(new TocHeading("第三章", 5, true, 1));
16// 添加输入文件路径
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 设置输出文件路径
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// 执行该过程
21PdfManager.AddTableOfContents(options);

如何将结果作为流获取

 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 设计标题
 6options.Headings.Add(new TocHeading("引言", 2, false, 1));
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 9// 设置输出流 
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// 执行该过程
14PdfManager.AddTableOfContents(options);

自定义 TOC 标题

您可以通过修改 TocHeading 类自定义目录标题。例如，您可以使用 ‘GenerateNumbering’ 或手动完成。用于页面链接的属性 ‘PageNumber’。您还可以使用 Level 属性。

 1var heading = new TocHeading();
 2heading.Text = "引言";
 3heading.PageNumber = 5;
 4heading.GenerateNumbering = true;
 5heading.Level = 2;
 6
 7var tocOptions = new TocOptions();
 8options.Headings.Add(heading);
 9// 添加输入和输出文件
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// 使用自定义选项生成 TOC
14PdfManager.AddTableOfContents(tocOptions);

关键特性：

动态 TOC 生成：为任何 PDF 文件创建目录，自动根据标题或书签生成条目。
自定义：控制 TOC 的外观和结构，包括样式、格式和深度级别。
高效工作流程：减少手动创建 TOC 的时间，尤其适用于大型或复杂文档。

Use ChatGPT

Documentize PDF Manager for .NET 插件是一个强大的工具，旨在将 ChatGPT API 与 PDF 应用程序集成。此插件允许开发人员根据输入消息生成聊天响应，并将输出保存为 PDF 格式，适合在 PDF 文档中直接创建对话界面或分析报告。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件，请按照以下步骤操作：

创建 ChatGptRequestOptions 类的实例以配置请求选项。
添加输入和输出的 PDF 文件。
设置 API 密钥，并指定参数，如最大标记数和 ChatGPT 模型的查询。
运行 CreatePdfByChatGptRequestAsync 方法以生成聊天完成。

 1var options = new ChatGptRequestOptions();
 2// 设置输出文件路径
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf")); 
 4options.ApiKey = "您的 API 密钥。"; // 您需要提供密钥以访问 API。
 5options.MaxTokens = 1000; // 生成聊天完成的最大标记数。
 6
 7// 添加请求消息。
 8options.Messages.Add(new Message
 9{
10    Content = "您是一个有用的助手。",
11    Role = Role.System
12});
13options.Messages.Add(new Message
14{
15    Content = "历史上最大的比萨饼直径是多少？",
16    Role = Role.User
17});
18
19// 处理请求。
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT API 聊天完成对象。

添加系统和用户消息

为了创建更互动的对话，您可以同时添加系统消息和用户消息。这些消息有助于塑造对话上下文。

添加设置 ChatGPT 上下文的系统消息。
添加表示用户输入的用户消息。

 1var options = new ChatGptRequestOptions();
 2// 设置输出文件路径
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 4
 5// 添加 PDF 文本源。
 6// 如果有多个源，则每个文档中的文本将作为角色为“用户”的单独消息添加到请求消息集合中。
 7options.AddInput(new FileDataSource("TextSource.pdf"));
 8
 9options.ApiKey = "您的 API 密钥。"; // 您需要提供密钥以访问 API。
10options.MaxTokens = 1000; // 生成聊天完成的最大标记数。
11
12// 添加请求消息。
13// 在这种情况下，系统消息的内容为 "您是一个有用的助手。" 默认添加。
14// 查询消息的角色默认是“用户”。
15options.Query = "提供文本中有多少个字母？";
16
17// 处理请求。
18var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
19
20var fileResultPath = result.ResultCollection[0].Data;
21var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT API 聊天完成对象。

关键特点：

聊天完成：根据自定义输入使用 ChatGPT API 生成响应。
系统和用户消息：提供系统上下文和用户输入以创建动态对话。
PDF 输出：将生成的聊天完成保存到结构化 PDF 文件中以供进一步使用。
异步处理：通过异步处理聊天完成确保响应式应用程序。

PDF Security

Encrypt

使用 Documentize 的 .NET 工具加密您的 PDF 文件，以保护敏感信息。

Decrypt

使用 Documentize 的 .NET 工具解密您的 PDF 文件，以打开文档。

Sign

使用 Documentize 的 .NET 工具数字签名 PDF 文件——轻松确保安全性、真实性和合规性。

Encrypt

Documentize PDF Security for .NET 是一款强大的工具，旨在通过提供加密、解密和签名功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密，并防止未经授权的访问。

如何加密 PDF

要加密 PDF 文档，请按照以下步骤操作：

创建 EncryptOptions 的实例，设置所需的用户和拥有者密码。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 PdfSecurity 类的 Encrypt 方法执行加密。

1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);

主要特点：

加密 PDF 文档：通过添加用户和拥有者密码来保护您的 PDF 文件。
自动化：将加密和解密集成到您的 .NET 应用程序中，以实现自动化工作流程。
合规性：确保您的文档符合行业标准的文档安全性。

Decrypt

Documentize PDF Security for .NET 是一款强大的工具，旨在通过提供加密、解密和签名功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密，并保护免受未经授权的访问。

如何解密 PDF

要解密 PDF 文档，请按照以下步骤进行操作：

创建 DecryptionOptions 的实例，并提供必要的密码。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 PdfSecurity 类的 Decrypt 方法执行解密。

1// 创建 DecryptOptions 对象以设置指令
2var options = new DecryptOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行过程
8PdfSecurity.Decrypt(options);

主要特点：

解密 PDF 文档：在需要时去除 PDF 的加密。
自动化：将加密和解密集成到您的 .NET 应用程序中，以实现自动化工作流。
合规性：确保您的文档符合行业标准的文档安全性。

Sign

Documentize PDF Security for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了一个简化的流程来添加签名，确保真实性并保护 PDF 内容。该插件支持可见和不可见签名，并提供选项自定义签名的位置、原因、联系信息等。

如何签署 PDF 文档

要使用 PFX 文件签署 PDF 文档，请按照以下步骤操作：

使用 PFX 文件路径和密码实例化 SignOptions 类。
将输入 PDF 和输出文件添加到选项中。
运行 Sign 方法以应用签名。

1// 创建 SignOptions 对象以设置指令
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行该过程
8PdfSecurity.Sign(options);

如何使用流处理 PFX 文件

您还可以使用作为流提供的 PFX 证书来签署 PDF，而不是文件路径。这允许更灵活地处理证书存储。

1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行该过程
6PdfSecurity.Sign(options);

如何应用不可见签名

要添加不可见签名（一种在文档上不显示签名的安全文档），只需将 Visible 属性设置为 false。

创建 SignOptions 的实例。
将 Visible 设置为 false。
添加输入和输出文件。
调用 Sign 以应用不可见签名。

1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置不可见签名
5signOptions.Visible = false;
6// 执行该过程
7PdfSecurity.Sign(options);

如何在 PDF 文档的签名中使用额外选项

您可以在向 PFX 文件添加签名时使用额外选项，如原因、联系方式、位置、页码。

使用 PFX 文件路径和密码实例化 SignOptions 类。
将输入 PDF 和输出文件添加到选项中。
设置选项的值。
运行 Sign 方法以应用签名。

 1// 创建 SignOptions 对象以设置指令
 2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出文件路径
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// 可选参数
 8options.Reason = "my Reason";
 9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// 执行该过程
13PdfSecurity.Sign(options);

如何向 PDF 添加时间戳

要向 PDF 文档添加安全时间戳，请按照以下步骤进行：

创建 AddTimestampOptions 的实例 以配置时间戳处理。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 设置输出文件路径。
使用 Sign 方法执行时间戳处理。

1// 创建 SignOptions 对象以设置指令
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行该过程
9PdfSecurity.Sign(options);

如何使用时间戳服务器的自定义身份验证

您可以在连接到时间戳服务器时提供基本身份验证凭据。这允许您与需要用户名和密码的服务器进行身份验证。

1// 使用身份验证配置时间戳选项
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");

主要特点：

数字签署 PDF 文档：使用可见或不可见的数字签名来保护您的文档。
PFX 支持：使用 PFX 证书签署 PDF 文件。
可自定义选项：配置签名设置，如原因、位置和联系方式。
可见和不可见签名：选择签名是否在文档上可见。
可自定义的时间戳服务器：使用自定义时间戳服务器 URL 和身份验证凭据。

PDF Form

PDF Form Flattener

将交互式 PDF 表单转换为不可编辑的文档，使其免受 unauthorized 修改

PDF Form Flattener

Documentize PDF Form Flattener for .NET 插件旨在将交互式 PDF 表单转换为不可编辑的文档，使其免受 unauthorized 修改。该工具将表单字段转变为静态内容，提高您 PDF 文档的安全性。特别适用于需要保护合同、协议或任何必须保持不变的表单字段的文档。

如何在 PDF 中展平表单字段

要在 PDF 文档中展平表单字段，请按照以下步骤进行：

创建 FormFlattenerOptions 类的实例。
将输入和输出文件添加到选项中。
调用 Process 方法执行展平操作。

1// 创建 FormFlattenerOptions 对象设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);

如何获取 PDF 中的所有字段

您可以获取文档中包含多少个字段的信息。

1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");

如何在 PDF 中展平除第一个字段外的所有内容

您可以根据字段的位置或名称等标准选择性地展平特定的表单字段。

 1// 获取字段名称
 2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
 3// 创建 FormFlattenerOptions 对象设置指令
 4var options = new FormFlattenerOptions();
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// 跳过 1 个字段。
 8options.SkipFields.Add(fieldNames[0]);
 9// 执行处理
10FormFlattener.Process(options);

主要特性：

展平所有表单字段：将交互式表单字段转换为不可编辑的静态内容。
选择性展平字段：可选择性地展平 PDF 中的特定字段，同时保持其他字段可编辑。
获取字段名称：获取 PDF 中的字段名称。

常见问题解答

此常见问题解答提供有关 Documentize .NET 插件 功能和特性的全面信息，涵盖 PDF 转换、表单处理和目录生成（TOC）等方面。

一般问题

1. 什么是 Documentize for .NET？

Documentize for .NET 是一个强大的库，用于以编程方式管理和处理 PDF 文档。它包括将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成目录以及确保长期归档的 PDF/A 合规性等功能的插件。

2. 如何安装 Documentize 插件 for .NET？

您可以通过从官方网站下载程序集文件或直接从 NuGet 获取软件包来安装 Documentize 插件。每个插件的文档中提供详细的安装说明。

PDF 转换插件

3. 如何将 PDF 文档转换为 Word（DOC/DOCX）文件？

要使用 PDF 到 DOC 转换器 将 PDF 文档转换为 Word 格式：

实例化 PdfDoc 类。
创建 PdfToDocOptions 对象以配置转换选项。
添加输入 PDF 和输出 DOC/DOCX 文件路径。
调用 Process 方法执行转换。

4. 如何将 PDF 页转换为 JPEG 图像？

使用 PDF 到 JPEG 转换器：

创建 Jpeg 类的实例。
通过 JpegOptions 设置转换选项（例如，分辨率，页面范围）。
添加输入/输出文件路径。
调用 Jpeg.Process 方法运行转换。

5. 如何将 PDF 转换为 PNG？

要将 PDF 转换为 PNG 格式：

创建 Png 类的实例和 PngOptions 对象。
添加输入 PDF 并指定输出文件夹。
设置选项，如分辨率（例如，300 DPI）。
调用 Process 方法生成 PNG 图像。

6. 如何将 PDF 转换为 Excel（XLS/XLSX）？

要将 PDF 转换为 Excel：

实例化 PdfXls 类。
使用 PdfToXlsOptions 配置输入/输出路径和转换选项。
调用 Process 方法开始转换。

7. 如何将 PDF 转换为 HTML？

要将 PDF 文档转换为 HTML：

创建 PdfHtml 类的实例。
使用 PdfToHtmlOptions 或 HtmlToPdfOptions 配置转换选项。
添加输入/输出路径并调用 Process 方法。

PDF 表单处理

8. 如何使用表单编辑器编辑 PDF 表单？

PDF 表单编辑器 提供以下功能：

添加字段（FormEditorAddOptions）。
更新字段（FormEditorSetOptions）。
删除字段（FormRemoveSelectedFieldsOptions）。配置表单字段后，运行 Process 方法。

9. 如何扁平化 PDF 表单？

要扁平化表单字段：

实例化 FormFlattener 类。
使用 FormFlattenAllFieldsOptions 扁平化所有字段或使用 FormFlattenSelectedFieldsOptions 定位特定字段。
添加输入/输出文件并调用 Process 方法。

10. 如何导出 PDF 表单中的数据？

要导出表单数据，请使用 PDF 表单导出器。创建 FormExporterValuesToCsvOptions 对象，指定表单字段条件，并运行 Process 方法将数据导出为 CSV 格式。

PDF/A 和 TOC 管理

11. 如何将 PDF 转换为 PDF/A 格式？

要将 PDF 转换为 PDF/A：

使用 PdfAConverter 类。
在 PdfAConvertOptions 中配置 PDF/A 版本（例如，PDF/A-3B）。
添加输入/输出路径并调用 Process 方法。

12. 如何在 PDF 中生成目录（TOC）？

要创建 TOC：

创建 TocGenerator 类的实例。
使用 TocOptions 定义 TOC 参数。
添加输入/输出文件并运行 Process 方法。

签名处理

13. 如何对 PDF 文档进行数字签名？

要添加数字签名：

实例化 Signature 类。
使用 SignOptions 配置 PFX 文件、密码和签名详细信息（例如，原因、联系信息）。
添加输入/输出文件并运行 Process 方法。

附加功能

14. 我可以使用 Documentize 拆分 PDF 文件吗？

可以，使用 PDF 拆分器：

实例化 Splitter 类。
使用 SplitOptions 配置拆分选项。
添加输入/输出路径并调用 Process 方法。

15. 如何将多个 PDF 文件合并为一个？

要合并 PDF：

实例化 Merger 类。
添加输入 PDF，并通过 MergeOptions 指定输出文件。
运行 Process 方法合并文件。

16. Documentize 是否仅限于处理 PDF？

虽然 Documentize 主要专注于 PDF 操作，但它也支持与 DOC、XLS、HTML、JPEG 和 PNG 等格式之间的转换。

许可和兼容性

17. 使用 Documentize 插件的系统要求是什么？

Documentize 支持：

操作系统：Windows 7-11，Windows Server 2003-2022，macOS（10.12+），以及 Linux。
框架：.NET Framework 4.0 至 8.0。
IDE：与各种版本的 Visual Studio 兼容。

18. 如何设置 Documentize 的许可证密钥？

要激活插件，请在项目中引用 Documentize 并在调用任何方法之前设置许可证密钥。有关详细说明，请参考特定插件的文档。

19. 在哪里可以找到更多 Documentize 插件的示例和文档？

完整的 API 文档和示例可以在 Documentize 网站上找到，或通过您开发环境中的 NuGet 包获取。

概述

核心功能

专用 SDK

使用与兼容性

概述 的子部分

安装

1. NuGet（首选方法）

2. MSI 安装程序

3. ZIP 归档

安装 的子部分

系统要求

支持的操作系统

Windows

macOS

Linux

Android

开发环境

支持的 .NET 框架

其他说明

声明

为什么需要完全信任

中级信任环境的限制

Non-Windows Environment

推荐的Linux设置

1. 安装libgdiplus包

2. 安装微软兼容字体

License and Evaluation

评估 Documentize for .NET

什么是评估许可证？

评估许可证的关键特性

评估模式的限制

如何开始使用评估许可证

何时使用评估许可证

今天就开始使用 Documentize

开发者指南

开发者指南 的子部分

PDF Converter

PDF Converter 的子部分

PDF to HTML

转换 PDF 为 HTML

可用于 PDF 转 HTML 转换的选项

PDF to DOC

如何将 PDF 转换为 DOC/DOCX

使用自定义选项转换 PDF 到 DOC

主要特点：

HTML to PDF

将 HTML 转换为 PDF

HTML 转 PDF 转换的其他选项

PDF to JPEG

如何将PDF页面转换为JPEG

自定义PDF到JPEG转换

如何在没有目录的情况下获取结果，或以流的形式获取

关键特性：

PDF to PDF/A

如何将PDF转换为PDF/A

验证PDF/A合规性

主要功能：

PDF to PNG

如何将 PDF 转换为 PNG

自定义 PDF 到 PNG 转换

处理转换结果

主要特点：

PDF to TIFF

如何将 PDF 转换为 TIFF

自定义 PDF 到 TIFF 转换的页面和 DPI

多页 TIFF 创建

自定义 PDF 到 TIFF 转换的页面和 DPI

如何处理转换结果

主要特点：

PDF to XLS

如何将 PDF 转换为 Excel

自定义 PDF 到 Excel 转换

支持的输出格式

主要特点：

PDF Extractor

PDF Extractor 的子部分

Extract Text

如何从 PDF 中提取文本

文本提取模式

主要特性：

概述的子部分

安装的子部分

开发者指南的子部分