概述

Documentize 是一个全面的平台,提供用于管理 .NET 应用程序中 PDF 文档的 SDK。 这些 SDK 简化了与 PDF 处理相关的复杂任务,增强了文档工作流程,使其对用户更加直观和高效。以下是其主要功能的概述:

核心功能

  • PDF 转换

    • 将 PDF 转换为多种格式,如 Microsoft Word (DOC/DOCX)、Excel (XLS/XLSX)、HTML、JPEG 和 PNG。
    • 支持将 PDF 转换为 PDF/A 格式,适用于长期归档和符合保存标准。
  • 文档操作

    • 合并和分割 PDF:轻松组合多个 PDF 文件或将大型文档拆分为更小、更易于管理的部分。
    • 优化 PDF:压缩和增强 PDF 文档以减少文件大小,同时不影响内容质量。
  • 文本提取

    • 精确提取文本,支持结构化和非结构化数据格式。
  • 数字签名

    • 对 PDF 文档进行数字签名,以确保其真实性和完整性,为敏感文件提供安全性和信任。

专用 SDK

  • PDF 转 DOC 转换器:准确地将 PDF 内容转换为可编辑的 Word 文档,同时保留格式和布局。
  • PDF 转 Excel 转换器:从 PDF 中提取表格数据,并将其转换为 Excel 电子表格,以便进行进一步的数据分析。
  • ChatGPT 集成:使与 ChatGPT 的交互成为可能,将会话 AI 响应嵌入 PDF 中,以实现独特的文档增强。

使用与兼容性

Documentize SDK 旨在无缝集成到 .NET 应用程序 中,支持包括 WindowsmacOSLinux 在内的多个平台。 这些 SDK 提供灵活且强大的 API,可以满足多样的文档处理需求,同时确保高性能和可靠性。

有关 SDK 及其与项目集成的详细信息,请访问 官方网站

概述 的子部分

安装

Documentize SDK 可以通过多种方法安装,针对不同的开发环境和偏好。以下是推荐的 Documentize 安装方式:

1. NuGet(首选方法)

NuGet 是安装 Documentize 最直接和首选的方法,确保您始终在开发环境中拥有最新版本和更新。有关此安装方法的更多详细信息,请查看 如何使用 NuGet 安装 Documentize SDK

2. MSI 安装程序

如果您希望将 Documentize DLL 直接安装到系统中,MSI 安装程序是一个方便的选项。这种方法非常适合希望在多个项目中使用 Documentize 的开发者,而无需手动管理 DLL 文件。有关此安装方法的更多详细信息,请查看 如何使用 MSI 安装 Documentize SDK

3. ZIP 归档

对于喜欢手动操作的开发者,ZIP 归档包含 Documentize DLL,可以直接提取并添加到您的项目中。有关此安装方法的更多详细信息,请查看 如何使用 ZIP 安装 Documentize SDK

2025年7月25日

安装 的子部分

系统要求

Documentize SDK 旨在与 .NET 应用程序集成,并支持多种操作系统和开发环境。以下是主要系统要求:

支持的操作系统

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 到 Windows Server 2022 (x64, x86)
  • : Microsoft Azure

macOS

  • macOS 10.12 (Sierra) 及更高版本

Linux

  • 兼容多种 Linux 发行版:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • 支持 Android 8.0 (Oreo) 及更高版本。

开发环境

  • Microsoft Visual Studio:
    • Visual Studio 2010 及更高版本(包括 2019 和 2022)
  • 支持任何以 .NET 平台为目标的开发环境。

支持的 .NET 框架

  • .NET Framework 4.0 及更高版本
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

其他说明

  • 运行 Documentize SDK 不需要 Adobe Acrobat,但建议使用 Adobe Acrobat 查看 PDF 文件。
2025年7月25日

声明

Documentize.com SDK 在 .NET 应用程序中使用时需要完全信任权限集。此权限级别对于 SDK 执行某些系统级操作至关重要,例如访问注册表设置、系统文件和解析字体。

为什么需要完全信任

Documentize SDK 利用核心 .NET 系统类,这些类通常需要提升的权限,原因如下:

  • 注册表访问:某些操作可能需要读取或写入系统注册表。
  • 系统文件:访问超出应用程序虚拟目录的系统文件可能对于某些任务是必要的,例如处理字体或执行文件操作。

中级信任环境的限制

在强制执行中级信任安全的托管环境中,几个重要权限受到限制或不可用。这可能会阻止 SDK 在此类环境中正常运行。在中级信任下适用以下限制:

  • OleDbPermission:不能使用 ADO.NET 管理的 OLE DB 数据提供程序来访问数据库。
  • EventLogPermission:禁止访问 Windows 事件日志。
  • ReflectionPermission:阻止使用反射,这可能会影响某些动态操作。
  • RegistryPermission:拒绝访问系统注册表。
  • WebPermission:通信限制在 <trust> 元素中配置的预定义地址或范围内。
  • FileIOPermission:对文件的访问限制在应用程序的虚拟目录内。
2025年7月25日

Non-Windows Environment

Documentize SDKs 支持 .NET Standard 2.0,这使得它们可以在运行于Linux或其他非Windows环境的.NET Core应用程序中使用。为了确保最佳性能和正确的文本渲染,请按照以下步骤操作:

推荐的Linux设置

1. 安装libgdiplus包

该包提供必要的GDI+功能,这对于渲染和处理PDF至关重要。您可以在终端中运行以下命令进行安装:

sudo apt-get install libgdiplus

2. 安装微软兼容字体

为了正确渲染文本,请使用以下命令安装微软的TrueType字体:

sudo apt-get install ttf-mscorefonts-installer

这些字体应放置在 /usr/share/fonts/truetype/msttcorefonts 目录中。如果您的系统将字体存储在其他目录中,请在对Documentize SDKs执行任何操作之前,更新代码中的路径:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));

提示

通过确保这些安装完成并正确配置字体路径,您可以最大化Documentize SDKs在Linux或其他非Windows系统上的性能。

2025年7月25日

License and Evaluation

评估 Documentize for .NET

当您开始使用 Documentize 产品时,可以立即使用免费的评估许可证。此许可证允许开发人员和企业在购买之前探索、测试并将 Documentize 功能集成到他们的应用程序中。

什么是评估许可证?

评估许可证是每个 Documentize 产品中包含的内置无限期试用模式。它使您能够访问大多数核心功能,以便您可以在现实场景中充分评估产品的能力。无论您是在生成、编辑还是转换文档,都可以测试与您的技术栈的性能和集成。

评估许可证的关键特性

  • 无需安装 – 只需下载并开始使用 Documentize 产品。
  • 🧪 探索核心功能 – 测试文档转换、操作和导出等基本功能。
  • 💻 面向开发者 – 适合概念验证 (POC)、集成测试或技术评估。
  • 🔁 易于升级 – 随时切换到完整许可证,而无需更改您的实现。

如果您想升级到完整许可证,需要添加以下代码:

License.Set("path_to_your_license_file.lic");

评估模式的限制

虽然评估许可证提供广泛访问权限,但有一些限制旨在保护许可的产品:

  • 所生成的 PDF 文档中的所有页面都有水印。
  • 在评估版本中,您只能处理文档的前四页。
  • 评估许可证不适用于生产或商业部署。

要获取没有限制的完全访问权限,您需要购买有效的 Documentize 许可证并在您的项目中应用它。

如何开始使用评估许可证

无需特殊设置。只需下载您想要的 Documentize SDK,并开始使用。如果未应用许可证文件,产品将自动以评估模式运行。

要测试有效许可证的行为,您也可以请求临时完整功能许可证以进行深入评估。

何时使用评估许可证

如果您满足以下条件,应使用评估许可证:

  • 您第一次探索 Documentize 的功能。
  • 您想确认与您的应用程序或平台的兼容性。
  • 您需要在购买之前构建原型或概念验证。
  • 您正在比较文档自动化解决方案。

今天就开始使用 Documentize

无风险评估 Documentize 产品,看看它们如何提升您的文档工作流程。当您准备好进入生产阶段时,升级到完整许可证的过程既快速又无缝。

📘 需要帮助吗?访问我们的文档联系我们以获得帮助。

2025年8月15日

开发者指南

HTML Converter

使用 Documentize 的 .NET 工具将 HTML 转换为 PDF,或将 PDF 转换为 HTML—保持布局和格式,以确保一致的专业结果。

PDF Security

使用 Documentize 的 .NET 工具轻松加密、解密和设置权限,以保护敏感信息.

PDF Optimizer

使用 Documentize 的 .NET 工具轻松优化您的 PDF——减小文件大小、提升性能并保持质量

PDF Merger

使用 Documentize 的 .NET 工具轻松合并 PDFs——将多个文件合并为一个,同时保持质量和结构。

PDF Table Generator

使用 Documentize 的 .NET 工具生成专业的 PDF 表格——轻松自定义布局、样式和数据。

PDF TOC Generator

.NET 插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航

PDF Signature

使用 Documentize 的 .NET 工具数字签署 PDF——轻松确保安全、真实性和合规性。

PDF Splitter

使用Documentize的.NET工具轻松拆分PDF——提取页面、创建新文件并精确管理文档

PDF ChatGPT

使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。

PDF Image Extractor

轻松地从.NET应用程序中提取PDF文档中的图像

PDF Text Extractor

使用 Documentize 的 .NET 工具准确提取 PDF 中文本——轻松检索、处理和分析内容。

PDF Timestamp Adder

使用 Documentize 的 .NET 工具向 PDF 添加时间戳——自动插入日期和时间,以增强文档跟踪。

PDF/A Converter

使用 Documentize 的 .NET 工具将 PDF 转换为 PDF/A 格式——轻松确保长期归档和合规性。

PDF 转 XLS 转换器

使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。

PDF to DOC Converter

使用Documentize的.NET工具将PDF转换为Word文档——保留格式和结构以便于编辑。

PDF to JPEG Converter

使用 Documentize 的 .NET 工具将 PDF 转换为 JPEG 图像——轻松提取文档中的高质量图像。

PDF to PNG Converter

使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取高质量图像以用于网页和图形。

PDF to TIFF Converter

使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业文档管理。

PDF Form Flattener

将交互式PDF表单转换为不可编辑的文档,使其免受未经授权的修改

2024年10月10日

开发者指南 的子部分

HTML Converter

Documentize HTML Converter for .NET 提供强大的文档转换功能,支持 PDF 和 HTML 格式之间的转换,非常适合 Web 应用程序、归档和报告生成。具有多种处理资源和布局的选项,该转换器可适应各种项目需求。

PDF 转 HTML 转换

将 PDF 文件转换为 HTML,以使文档可用于基于 Web 的查看或集成到 HTML 格式优先的应用程序中。

HTML 转 PDF 转换

将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。


将 PDF 转换为 HTML

要将 PDF 转换为 HTML:

  1. 配置选项: 使用 PdfToHtmlOptions 自定义输出,选择嵌入式或外部资源。
  2. 定义输入和输出路径: 设置输入 PDF 和输出 HTML 的路径。
  3. 执行转换: 调用 HtmlConverterProcess 方法以转换文件。

示例:将 PDF 转换为带嵌入式资源的 HTML

1// 步骤 1: 配置 PDF 转 HTML 转换的选项
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

PDF 转 HTML 转换的可用选项

  • SaveDataType:
    • FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单一 HTML 文件。
    • FileWithExternalResources: 将资源单独保存,适用于大型 HTML 文件。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF,请按照以下步骤操作:

  1. 配置选项: 使用 HtmlToPdfOptions 定义布局和媒体设置。
  2. 指定路径: 设置输入 HTML 和输出 PDF 文件路径。
  3. 执行转换: 运行 HtmlConverterProcess 方法以转换文件。

示例:将 HTML 转换为 PDF

1// 步骤 1: 配置 HTML 转 PDF 转换的选项
2var options = new HtmlToPdfOptions();
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

HTML 转 PDF 转换的附加选项

  • 媒体类型:

    • HtmlMediaType.Print: 适合生成适合打印的 PDF。
    • HtmlMediaType.Screen: 在转换为为数字观看而设计的内容时使用。
  • 布局调整:

    • PageLayoutOption: 调整 HTML 内容适应 PDF 布局的方式,例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
    • IsRenderToSinglePage: 启用在需要简明呈现时将整个 HTML 内容呈现到单个 PDF 页面。

该转换器在多种应用程序中非常灵活,从基于 Web 的内容生成 PDF报告,到转换 PDF 文档归档以实现 Web 可访问性。有关更多高级配置,请参阅完整的 Documentize 文档。

PDF Security

Documentize PDF Security for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。

如何加密 PDF

要加密 PDF 文档,请按照以下步骤操作:

  1. 创建 EncryptionOptions 的实例,并设置所需的用户和所有者密码。
  2. 使用 AddInput 方法添加输入 PDF 文件
  3. 使用 AddOutput 方法添加输出 PDF 文件
  4. 使用 Security 类的 Process 方法执行加密
1// 创建 EncryptionOptions 对象以设置指令
2var options = new EncryptionOptions("123456", "qwerty");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);

如何解密 PDF

要解密 PDF 文档,请按照以下步骤操作:

  1. 创建 DecryptionOptions 的实例,并设置必要的密码。
  2. 使用 AddInput 方法添加输入 PDF 文件
  3. 使用 AddOutput 方法添加输出 PDF 文件
  4. 使用 Security 类的 Process 方法执行解密
1// 创建 DecryptionOptions 对象以设置指令
2var options = new DecryptionOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);

主要特点:

  • 加密 PDF 文档:通过添加用户和所有者密码来保护您的 PDF 文件。
  • 解密 PDF 文档:在需要时移除 PDF 的加密。
  • 自动化:将加密和解密集成到您的 .NET 应用程序中,以实现自动化工作流程。
  • 合规性:确保您的文档符合行业标准的文档安全性。

PDF Optimizer

Documentize PDF Optimizer 是一个全面的插件,通过先进的优化技术增强 PDF 文档。它旨在帮助减少文件大小、旋转页面、裁剪内容和调整文档尺寸。这些操作可以提高 PDF 文件的质量和可管理性,使其更易于存储、共享和查看。

优化 PDF

以下步骤演示了如何通过减少文件大小同时保持质量来优化 PDF 文档。

  1. 创建一个 OptimizeOptions 对象以配置优化设置。
  2. 添加输入 PDF 文件并设置优化文件的输出位置。
  3. 运行 OptimizerProcess 方法以执行优化。
1// 创建 OptimizeOptions 对象以设置指令
2var options = new OptimizeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);

旋转 PDF

使用 RotateOptions 类来调整 PDF 文件中页面的方向。

  1. 创建一个 RotateOptions 对象并配置旋转角度。
  2. 添加输入 PDF 文件并指定输出文件位置。
  3. 使用 SetRotation 方法设置旋转角度(例如,90 度)。
  4. 运行 OptimizerProcess 方法。
 1// 创建 RotateOptions 对象以设置指令
 2var options = new RotateOptions();
 3// 设置新的旋转
 4options.Rotation = Rotation.On90;
 5// 添加输入文件路径
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// 设置输出文件路径
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// 执行处理
10Optimizer.Process(options);

调整 PDF 尺寸

要调整 PDF 文档的大小,可以使用 ResizeOptions 类来指定文档的新页面大小。

  1. 创建一个 ResizeOptions 对象以定义页面大小。
  2. 添加输入文件并设置所需的输出位置。
  3. 使用 SetPageSize 方法指定新尺寸(例如,A4)。
  4. 运行 OptimizerProcess 方法。
 1// 创建 ResizeOptions 对象以设置指令
 2var options = new ResizeOptions();
 3// 设置新的页面尺寸
 4options.PageSize = PageSize.A3;
 5// 添加输入文件路径
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// 设置输出文件路径
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// 执行处理
10Optimizer.Process(options);

压缩 PDF

通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来在可行的情况下压缩 PDF 文档。

  1. 创建一个 CompressOptions 对象以配置优化设置。
  2. 添加输入文件并指定输出文件位置。
  3. 使用 SetCropBox 方法定义裁剪区域。
  4. 运行 OptimizerProcess 方法。
1// 创建 CompressOptions 对象以设置指令
2var options = new CompressOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);

主要特点:

  • 优化:在不损失质量的情况下减少 PDF 文件大小。
  • 旋转:调整 PDF 页面的方向。
  • 调整大小:将页面调整为特定尺寸(例如,A4、Letter)。
  • 压缩:从文档中删除未使用的页面资源和对象。

PDF Merger

Documentize PDF Merger for .NET 是一个多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档能够高效合并并保持内容的一致性。该插件处理内部资源,例如字体和图像,以优化合并后的文档。

如何合并 PDF

要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:

  1. 创建一个 MergeOptions 的实例以配置合并过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法添加输出 PDF 文件。
  4. 使用 Merger 类的 Process 方法执行合并。
1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9Merger.Process(options);

如何合并具有页面范围的 PDFs

您还可以使用 MergeOptions 类从输入 PDF 文件中合并特定的页面范围。这允许您将所选页面合并到最终输出文档中。

  1. 创建 Merger 类的实例。
  2. 使用 MergeOptions 配置页面范围。
  3. 添加具有指定页面范围的输入文件。
  4. 设置输出路径。
  5. 调用 Process 方法。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 从输入 PDFs 中合并特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行处理
12merger.Process(mergeOptions);

如何处理批量合并

PDF Merger 插件经过优化,能够处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。

  1. 实例化 Merger 类。
  2. 将所有输入 PDF 文件添加到 MergeOptions 类中。
  3. 指定输出路径。
  4. 调用 Process 方法以合并批量中的所有文件。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDFs 进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

主要特点:

  • 合并多个 PDFs:轻松将多个 PDF 文件合并为一个。
  • 资源优化:合并过程中移除重复的字体和图像。
  • 批量处理:一次性合并大量 PDF 文档。

PDF Table Generator

Documentize Table Generator for .NET 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单,还是提高文档的可读性,该插件都能在保持精确和高效的同时简化过程。其直观的 API 支持单个文档和批处理工作流,使其成为处理结构化数据的开发者必备工具。

创建包含表格的 PDF

按照以下步骤使用 TableGenerator 类在 PDF 中创建结构化表格:

  1. 配置 TableOptions 对象以定义表格结构、内容和输入/输出文件。
  2. 将表格、行和单元格添加到您的 PDF。
  3. 使用 Process 方法完成表格生成过程。

这里是一个示例:

 1var options = new TableOptions();
 2
 3// 指定输入和输出 PDF 文件
 4options.AddInput(new FileDataSource("input.pdf"));
 5options.AddOutput(new FileDataSource("output.pdf"));
 6
 7// 定义包含行和单元格的表格
 8options
 9    .InsertPageBefore(1) // 在第一页之前添加表格
10    .AddTable()
11        .AddRow()
12            .AddCell().AddParagraph("Cell 1")
13            .AddCell().AddParagraph("Cell 2")
14            .AddCell().AddParagraph("Cell 3");
15
16// 在文档中生成表格
17TableGenerator.Process(options);

设置表格的页码

按照以下步骤在 PDF 中的第 2 页之后创建表格: 这里是一个示例:

 1var options = new TableOptions();
 2
 3// 指定输入和输出 PDF 文件
 4options.AddInput(new FileDataSource("input.pdf"));
 5options.AddOutput(new FileDataSource("output.pdf"));
 6
 7// 定义包含行和单元格的表格
 8options
 9    .InsertPageAfter(2) // 在第 2 页之后添加表格
10    .AddTable()
11        .AddRow()
12            .AddCell().AddParagraph("Cell 1")
13            .AddCell().AddParagraph("Cell 2")
14            .AddCell().AddParagraph("Cell 3");
15
16// 在文档中生成表格
17TableGenerator.Process(options);

处理表格生成

在添加所有内容并自定义表格结构后,通过调用 Process 方法完成该过程。此方法生成表格并更新 PDF 文档。以下是如何处理结果:

1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);

关键功能:

  • 动态表格创建:轻松生成结构化的 PDF 表格。
  • 丰富的内容支持:使用文本、HTML、图像和 LaTeX 内容填充表格。
  • 页码放置:在 PDF 中精确插入表格到特定位置。
  • 可定制的布局:调整表格结构、单元格对齐和样式。

PDF TOC Generator

Documentize PDF TOC Generator for .NET 是一个强大的插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。这个插件简化了将 TOC 添加到 PDF 的过程,使文档更易于导航和管理。

如何为 PDF 生成 TOC

要在 PDF 文件中创建目录,请按照以下步骤操作:

  1. 创建一个 TocOptions 实例以配置 TOC 生成设置。
  2. 使用 Title 属性设置标题。
  3. 使用 Headings.Add 方法设计 TOC 的标题。
  4. 使用 AddInput 方法添加输入 PDF 文件。
  5. 使用 AddOutput 方法指定输出 PDF 文件及 TOC。
  6. 调用 Process 方法生成 TOC。
 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 设计标题
 6options.Headings.Add(new TocHeading("引言", 2));
 7options.Headings.Add(new TocHeading("第一章", 3));
 8options.Headings.Add(new TocHeading("第二章", 4));
 9options.Headings.Add(new TocHeading("第三章", 5));
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 设置输出文件路径
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// 执行处理
15TocGenerator.Process(options);

在 PDF 的 TOC 中生成书签

您可以使用 ‘GenerateBookmarks’ 属性生成书签。

 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 在书签中生成链接
 6options.GenerateBookmarks = true;
 7// 设计标题
 8options.Headings.Add(new TocHeading("引言", 2, false, 1));
 9options.Headings.Add(new TocHeading("第一章", 3, true, 1));
10options.Headings.Add(new TocHeading("第二章", 4, true, 1));
11options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
12options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
13options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
14options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
15options.Headings.Add(new TocHeading("第三章", 5, true, 1));
16// 添加输入文件路径
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 设置输出文件路径
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// 执行处理
21TocGenerator.Process(options);

自定义 TOC 标题

您可以通过修改 TocHeading 类来自定义目录标题。例如,您可以使用 ‘GenerateNumbering’ 或手动完成。 ‘PageNumber’ 属性用于页面链接。您也可以使用 Level 属性。

 1var heading = new TocHeading();
 2heading.Text = "引言";
 3heading.PageNumber = 5;
 4heading.GenerateNumbering = true;
 5heading.Level = 2;
 6
 7var tocOptions = new TocOptions();
 8options.Headings.Add(heading);
 9// 添加输入和输出文件
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// 使用自定义选项生成 TOC
14TocGenerator.Process(tocOptions);

如何获取结果流

 1// 创建 TocOptions 对象以设置指令
 2var options = new TocOptions();
 3// 设置标题
 4options.Title = "我的目录";
 5// 设计标题
 6options.Headings.Add(new TocHeading("引言", 2, false, 1));
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 9// 设置输出流 
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// 执行处理
14TocGenerator.Process(options);

主要特点:

  • 动态 TOC 生成:为任何 PDF 文件创建 TOC,自动根据标题或书签生成条目。
  • 批处理:一次为多个 PDF 文档生成 TOC。
  • 定制:控制 TOC 的外观和结构,包括样式、格式和深度级别。
  • 高效工作流程:最大限度减少手动创建 TOC 的时间,特别是对于大型或复杂文档。

PDF Signature

Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名、确保真实性和保护 PDF 内容的简化流程。该插件支持可见和隐形签名,并提供自定义签名位置、原因、联系信息等选项。

如何签署 PDF 文档

要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:

  1. 使用 PFX 文件路径和密码实例化 SignOptions 类。
  2. 将输入 PDF 和输出文件添加到选项中。
  3. 运行 Process 方法以应用签名。
1// 创建 SignOptions 对象以设置说明
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Signature.Process(options);

如何使用流进行 PFX 文件签名

您也可以使用作为流提供的 PFX 证书签署 PDF,而不是文件路径。这允许更灵活地处理证书存储。

  1. 用包含 PFX 的流和密码实例化 SignOptions
  2. 添加输入和输出文件。
  3. 运行 Process 方法以应用签名。
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行处理
6Signature.Process(options);

如何添加隐形签名

要添加隐形签名(在文档上不会显示签名但可以保护文档),只需将 Visible 属性设置为 false

  1. 创建 SignOptions 的实例。
  2. Visible 设置为 false
  3. 添加输入和输出文件。
  4. 调用 Process 以应用隐形签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置隐形签名
5signOptions.Visible = false;
6// 执行处理
7Signature.Process(options);

如何为 PDF 文档的签名使用额外选项

在向 PFX 文件添加签名时,您可以使用额外选项,如原因、联系人、位置、页码。

  1. 使用 PFX 文件路径和密码实例化 SignOptions 类。
  2. 将输入 PDF 和输出文件添加到选项中。
  3. 设置选项的值。
  4. 运行 Process 方法以应用签名。
 1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 4// 可选参数
 5options.Reason = "my Reason";
 6options.Contact = "my Contact";
 7options.Location = "my Location";
 8options.PageNumber = 3;
 9// 执行处理
10Signature.Process(options);

主要功能:

  • 数字签署 PDF 文档:使用可见或隐形数字签名保护您的文档。
  • PFX 支持:使用 PFX 证书签署 PDF 文件。
  • 可自定义选项:配置签名设置,如原因、位置和联系信息。
  • 可见和隐形签名:选择签名是否在文档上可见。

PDF Splitter

Documentize PDF Splitter for .NET 是一款强大的工具,简化了将大型PDF文档拆分为更小、更易管理文件的过程。无论您需要提取单个页面还是将文档划分为特定部分,这个插件都能高效地帮您实现,并且所需的努力最小化。

如何拆分PDF

要将PDF文档拆分为单独的页面,请遵循以下步骤:

  1. 创建一个SplitOptions实例以配置拆分选项。
  2. 使用AddInput方法添加输入PDF文件。
  3. 使用AddOutput方法为每个拆分页面添加输出文件。
  4. Splitter类中运行Process方法以拆分文档。
 1var splitOptions = new SplitOptions();
 2
 3// 添加输入PDF文件
 4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 5
 6// 为每个页面指定输出文件
 7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// 处理拆分操作
12Splitter.Process(splitOptions);

关键特性:

  • 按页面拆分PDF:将PDF文档拆分为单独的页面。
  • 批量处理:一次性拆分大量PDF。
  • 自定义拆分选项:根据您的需求配置拆分过程。
  • 有序输出:轻松管理每个拆分页面或部分的输出文件。

PDF ChatGPT

Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。此插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,使其适合在 PDF 文档中直接创建对话界面或分析报告。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件,请按照以下步骤操作:

  1. 创建 PdfChatGptRequestOptions 类的实例以配置请求选项。
  2. 添加输入和输出 PDF 文件。
  3. 设置 API 密钥,并指定参数,例如最大令牌数和 ChatGPT 模型的查询。
  4. 运行 ProcessAsync 方法以生成聊天响应。
 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // 设置您的 API 密钥
 3options.MaxTokens = 1000;  // 设置最大令牌数
 4options.Query = "分析此文本的关键主题。";
 5
 6// 添加输入 PDF 文件
 7options.AddInput(new FileDataSource("input.pdf"));
 8
 9// 指定保存聊天响应的输出 PDF 的位置
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// 创建 PdfChatGpt 插件的实例
13var plugin = new PdfChatGpt();
14
15// 异步运行处理
16var result = await plugin.ProcessAsync(options);

主要特点:

  • 聊天完成: 使用 ChatGPT API 根据自定义输入生成响应。
  • 系统和用户消息: 提供系统上下文和用户输入以创建动态对话。
  • PDF 输出: 将生成的聊天完成保存在结构化的 PDF 文件中以供进一步使用。
  • 异步处理: 通过异步处理聊天完成确保应用程序的响应性。

添加系统和用户消息

要创建更为互动的对话,您可以同时添加系统和用户消息。这些消息有助于塑造对话上下文。

  1. 添加一个系统消息,以设置 ChatGPT 的上下文。
  2. 添加一个用户消息,以表示用户的输入。
 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // 设置您的 API 密钥
 3
 4// 添加上下文的系统消息
 5options.AddSystemMessage("您是一个被训练来总结文本的人工智能。");
 6
 7// 添加用户消息以查询 ChatGPT 模型
 8options.AddUserMessage("请总结附加的文档。");
 9
10// 添加输入和输出 PDF
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// 异步处理请求
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);

PDF Image Extractor

Documentize PDF Image Extractor for .NET 插件使您能够轻松地从PDF文档中提取图像。它扫描您的PDF文件,识别嵌入的图像,并在保持原始质量和格式的同时提取它们。这个工具提高了视觉内容的可访问性,并简化了从PDF中检索图像的过程。

如何从PDF中提取图像

要从PDF文件中提取图像,请遵循以下步骤:

  1. 创建 ImageExtractorOptions 类的实例。
  2. 使用 AddInput 方法将输入文件路径添加到选项中。
  3. 使用 AddOutput 方法设置图像的输出目录路径。
  4. 使用插件处理图像提取。
  5. 从结果容器中检索提取的图像。
 1// 创建 ImageExtractorOptions 以设置指令
 2var options = new ImageExtractorOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// 执行处理
 8var results = ImageExtractor.Process(options);
 9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();

从PDF文件提取图像到流,不使用文件夹

ImageExtractor 插件支持保存到流,这允许您从PDF文件中提取图像到流,而无需使用临时文件夹。

 1// 创建 ImageExtractorOptions 以设置指令
 2var options = new ImageExtractorOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 不设置输出 - 它将结果写入流
 6// 执行处理
 7var results = ImageExtractor.Process(options);
 8// 获取流
 9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

主要特性:

  • 提取嵌入图像:识别并提取PDF文档中的图像。
  • 保持图像质量:确保提取的图像保留其原始质量。
  • 灵活输出:以您喜欢的格式或位置保存提取的图像。

PDF Text Extractor

Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要的是纯文本、原始文本还是普通文本,该插件都可以高效地提取文本,同时根据您的需要保留格式或省略格式。

如何从 PDF 中提取文本

要从 PDF 文档中提取文本,请按照以下步骤操作:

  1. 创建 TextExtractorOptions 的实例以配置提取选项。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 运行 Process 方法以提取文本。
  4. 使用 ResultContainer.ResultCollection 访问提取的文本。
1// 创建 TextExtractorOptions 对象以设置指令
2var options = new TextExtractorOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

文本提取模式

TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。

  1. 纯模式:保留原始格式,包括空格和对齐。
  2. 原始模式:提取不带格式的文本,适用于原始数据处理。
  3. 扁平模式:根据坐标表示 PDF 内容与定位文本片段。
1// 创建 TextExtractorOptions 对象以设置 TextFormattingMode
2var options = new TextExtractorOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

主要特点:

  • 纯模式:在保留原始格式的同时提取文本。
  • 原始模式:提取不带任何格式的文本。
  • 扁平模式:提取没有特殊字符或格式的文本。

PDF Timestamp Adder

Documentize PDF Timestamp Adder for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。它通过提供可信的时间参考来增强文档的完整性和真实性,确保符合数字签名标准。

如何向 PDF 添加时间戳

要向 PDF 文档添加安全时间戳,请按照以下步骤操作:

  1. 创建 AddTimestampOptions 的实例 来配置时间戳过程。
  2. 使用 AddInput 方法添加输入 PDF 文件
  3. 使用 AddOutput 设置输出文件路径
  4. 使用 Process 方法执行时间戳操作
 1// 配置时间戳选项
 2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
 3
 4// 添加输入 PDF 文件
 5options.AddInput(new FileDataSource("path_to_pdf"));
 6
 7// 指定输出 PDF 文件
 8options.AddOutput(new FileDataSource("path_to_result_pdf"));
 9
10// 执行时间戳过程
11Timestamp.Process(options);

如何使用自定义身份验证连接时间戳服务器

在连接时间戳服务器时,您可以提供基本身份验证凭据。这允许您与需要用户名和密码的服务器进行身份验证。

  1. 创建 AddTimestampOptions 的实例,包括 serverBasicAuthCredentials
  2. 添加输入文件和输出文件路径
  3. 调用 Process 方法
 1// 使用身份验证配置时间戳选项
 2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
 3
 4// 添加输入 PDF 文件
 5options.AddInput(new FileDataSource("path_to_pdf"));
 6
 7// 指定输出 PDF 文件
 8options.AddOutput(new FileDataSource("path_to_result_pdf"));
 9
10// 执行时间戳过程
11Timestamp.Process(options);

处理 PFX 文件和密码

AddTimestampOptions 类允许您使用 PFX 文件进行数字签名并配合密码使用。

  • PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
  • 密码保护:确保安全管理 PFX 文件的密码。

主要特性:

  • 添加安全时间戳:轻松向您的 PDF 文档添加安全时间戳。
  • 可自定义的时间戳服务器:使用自定义时间戳服务器 URL 和身份验证凭据。
  • 自动化:将时间戳过程集成到您的 .NET 应用程序中,实现自动化工作流。
  • 合规性:确保您的文档符合数字签名和时间戳的行业标准。

PDF/A Converter

Documentize PDF/A Converter for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 规范,提供了单一解决方案的转换和验证功能。

如何将 PDF 转换为 PDF/A

要将 PDF 文档转换为 PDF/A 格式,请按以下步骤操作:

  1. 创建 PdfAConvertOptions 的实例以配置转换。
  2. 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 方法添加结果 PDF/A 的输出文件。
  5. 调用 Process 方法以执行转换。
 1var pdfAOptions = new PdfAConvertOptions
 2{
 3    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 4};
 5
 6// 添加输入 PDF 文件
 7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 8
 9// 指定输出 PDF/A 文件
10pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
11
12// 处理转换
13PdfAConverter.Process(pdfAOptions);

验证 PDF/A 合规性

您可以使用 PdfAValidateOptions 类验证现有 PDF 文件的 PDF/A 合规性。

 1var validationOptions = new PdfAValidateOptions
 2{
 3    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 4};
 5
 6// 添加要验证的 PDF 文件
 7validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 8
 9// 运行验证过程
10var resultContainer = PdfAConverter.Process(validationOptions);
11
12// 检查验证结果
13var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
14Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);

PDF/A 转换的批处理

该插件支持批处理,允许您同时转换或验证多个 PDF 文件以符合 PDF/A 规范。

 1var pdfAOptions = new PdfAConvertOptions
 2{
 3    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 4};
 5
 6// 添加多个输入 PDF
 7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 9
10// 为转换的 PDF/A 指定输出文件
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
13
14// 处理批量转换
15PdfAConverter.Process(pdfAOptions);

主要特点:

  • 转换为 PDF/A:无缝将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a,PDF/A-2b,PDF/A-3b),确保符合归档标准。
  • 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
  • 批处理:一次处理多个文件进行转换或验证。
  • 高效工作流程:通过快速可靠的转换过程减少时间和精力。

PDF 转 XLS 转换器

Documentize PDF 转 XLS 转换器 for .NET 是一个通用且强大的工具,用于将 PDF 文档转换为 Excel 电子表格 (XLSX/XLS/CSV/XLSM/ODS)。通过利用此插件,开发人员可以无缝地将静态 PDF 数据转换为动态且可编辑的电子表格,从而简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件 (XLSX),请按照以下步骤操作:

  1. 使用 PdfToXlsOptions 类配置转换设置。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定输出文件路径。
  4. 执行 Process 方法以启动转换。
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.xlsx"));
7// 执行处理
8XlsConverter.Process(options);

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:

 1// 创建 PdfToXlsOptions 对象以设置指令
 2var options = new PdfToXlsOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 指定 XLS 格式
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 执行处理
12XlsConverter.Process(options);

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:

  • XLSX: Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM: 启用宏的 Excel 格式。
  • CSV: 逗号分隔值。
  • ODS: 开放文档电子表格。
  • XMLSpreadSheet2003: Excel 2003 XML (.xls) 文件格式。

主要特性:

  • 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 高级格式:插入空白列或最小化工作表数量。

PDF to DOC Converter

Documentize PDF to DOC Converter for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。该插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使跨多个平台重用、编辑和共享内容变得简单。

如何将PDF转换为DOC/DOCX

要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:

  1. 创建一个 DocConversionOptions 实例以配置转换过程。
  2. 使用 AddInput 方法添加输入PDF文件。
  3. 使用 AddOutput 方法添加结果文件的输出文件路径。
  4. 运行 Process 方法以执行转换。
 1var options = new DocConversionOptions()
 2{
 3    SaveFormat = SaveFormat.DocX,       // 输出格式为DOCX
 4    ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
 5};
 6
 7// 添加输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
12
13// 处理转换
14DocConverter.Process(options);

使用自定义选项转换PDF到DOC

PDF to DOC Converter 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制PDF在转换过程中的布局和结构处理。

 1var options = new DocConversionOptions()
 2{
 3    SaveFormat = SaveFormat.Doc,        // 输出格式为DOC
 4    ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF的布局
 5};
 6
 7// 添加输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
12
13// 处理转换
14DocConverter.Process(options);

批量处理PDF到DOC/DOCX转换

PDF to DOC Converter 支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的示例:

 1var options = new DocConversionOptions()
 2{
 3    SaveFormat = SaveFormat.DocX
 4};
 5
 6// 添加多个输入PDF文件
 7options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 8options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 9
10// 添加结果DOCX文件的输出路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
13
14// 处理批量转换
15DocConverter.Process(options);

主要特性:

  • DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
  • 保持格式:在转换过程中保留原始布局、文本和格式。
  • 批量处理:一次转换多个PDF文件。
  • 自定义转换选项:通过不同模式(如增强流)微调转换过程,以获得更好的布局。

PDF to JPEG Converter

Documentize PDF to JPEG Converter for .NET 是一个强大的工具,简化了将 PDF 文档转换为高质量 JPEG 图像的过程。该插件旨在通过将 PDF 页面转换为广泛使用的图像格式,使您的内容更易于跨平台访问。

如何将 PDF 页面转换为 JPEG

要将 PDF 文档转换为 JPEG 图像,请按照以下步骤操作:

  1. 创建一个 PdfToJpegOptions 实例以配置转换过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法设置 JPEG 图像的输出目录路径。
  4. 运行 Process 方法将 PDF 页面转换为 JPEG 图像。
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8JpegConverter.Process(options);

自定义 PDF 转 JPEG 转换

您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以 200 DPI 转换 PDF 的第一页:

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToJpegOptions();
 3// 仅处理第一页
 4options.PageList = new List<int> { 1 };
 5// 设置输出分辨率为 200 DPI
 6options.OutputResolution = 200;
 7// 设置输出质量为 50
 8options.Quality = 50;
 9// 添加输入文件路径
10options.AddInput(new FileDataSource("path_to_input.pdf"));
11// 设置输出目录路径
12options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
13// 执行处理
14JpegConverter.Process(options);

如何在没有目录的情况下获取结果,或以流的形式获取结果

Process 方法返回一个 ResultContainer 对象,该对象包含有关转换结果的信息。您可以获取转换后 JPEG 文件的流,如下所示:

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToJpegOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = JpegConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特性:

  • 将 PDF 转换为 JPEG:轻松将整个 PDF 文档或特定页面转换为 JPEG 图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
  • 页面集:选择特定页面进行转换。
  • 快速转换:快速高效的过程,最小化工作量。

PDF to PNG Converter

Documentize PDF to PNG Converter for .NET 是一个高级工具,允许您将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问和易于共享。

如何将 PDF 转换为 PNG

要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:

  1. 创建 PdfToPngOptions 实例以配置转换过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法设置 PNG 图像的输出目录路径。
  4. 运行 Process 方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8PngConverter.Process(options);

自定义 PDF 到 PNG 转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页面:

 1// 创建 PdfToPngOptions 对象以设置指令
 2var options = new PdfToPngOptions()
 3// 仅处理第一页
 4options.PageList = new List<int> { 1 };
 5// 设置输出分辨率为 200 dpi
 6options.OutputResolution = 200;
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行处理
12PngConverter.Process(options);

处理转换结果

Process 方法返回一个 ResultContainer 对象,该对象包含有关转换结果的信息。您可以获取转换后 PNG 文件的流,如下所示:

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = PngConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点:

  • 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
  • 可自定义分辨率:设置所需的 DPI(例如,300 DPI)以获得高质量的图像输出。
  • 页面集合:选择特定页面进行转换。
  • 轻松输出管理:为每个转换后的 PNG 文件指定输出目录。
  • 快速转换:快速、高效,并且配置所需的努力最小。

PDF to TIFF Converter

Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件确保您的内容在各个平台上都可访问,同时保持卓越的保真度和多功能性。 您可以通过调整分辨率、启用多页输出或选择页面来定制转换过程。

如何将 PDF 转换为 TIFF

要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:

  1. 创建 PdfToTiffOptions 的实例以配置转换过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
  4. 运行 Process 方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8TiffConverter.Process(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置页面
 8options.PageList = [1, 3];
 9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行处理
12TiffConverter.Process(options);

多页 TIFF 创建

PDF to TIFF Converter 插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为一个 TIFF 文件,以便于存档或打印。

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 启用多页 TIFF 输出
 8options.MultiPage = true;
 9// 执行处理
10TiffConverter.Process(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置压缩和色深
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行处理
11TiffConverter.Process(options);

如何处理转换结果

Process 方法返回一个 ResultContainer 对象,其中提供有关转换结果的详细信息。您可以获得转换后 TIFF 文件的流,如下所示:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = TiffConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点:

  • 将 PDF 转换为 TIFF:轻松地将整个 PDF 文档或特定页面转换为 TIFF 图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
  • 多页 TIFF:将多个 PDF 页面合并为一个多页 TIFF 文件。
  • 页面集:选择特定页面进行转换。
  • 快速转换:快速有效的处理,付出最少的努力。

PDF Form Flattener

Documentize PDF Form Flattener for .NET 插件旨在将交互式PDF表单转换为不可编辑的文档,确保其免受未经授权的修改。该工具将表单字段转换为静态内容,增强您的PDF文档的安全性。当您需要确保合同、协议或任何必须保持不变的表单字段的文档时,此工具特别有用。

如何在PDF中扁平化表单字段

要在PDF文档中扁平化表单字段,请按照以下步骤操作:

  1. 创建FormFlattenerOptions类的实例。
  2. 将输入和输出文件添加到选项中。
  3. 调用Process方法执行扁平化操作。
1// 创建FormFlattenerOptions对象以设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);

如何获取PDF中的所有字段

您可以获取文档中包含多少字段的信息。

1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");

如何在PDF中扁平化除了第一个字段以外的所有内容

您可以根据字段的位置或名称等标准选择性地只扁平化特定的表单字段。

 1// 获取字段名称
 2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
 3// 创建FormFlattenerOptions对象以设置指令
 4var options = new FormFlattenerOptions();
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// 跳过1个字段。
 8options.SkipFields.Add(fieldNames[0]);
 9// 执行处理
10FormFlattener.Process(options);

主要特性:

  • 扁平化所有表单字段:将交互式表单字段转换为不可编辑的静态内容。
  • 扁平化选定字段:可选择在PDF中扁平化特定字段,同时保留其他字段可编辑。
  • 扁平化获取字段名称:获取PDF中的字段名称。

常见问题解答

此常见问题解答提供有关 Documentize .NET 插件 功能和特性的全面信息,涵盖 PDF 转换、表单处理和目录生成(TOC)等方面。


一般问题

1. 什么是 Documentize for .NET?

Documentize for .NET 是一个强大的库,用于以编程方式管理和处理 PDF 文档。它包括将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成目录以及确保长期归档的 PDF/A 合规性等功能的插件。

2. 如何安装 Documentize 插件 for .NET?

您可以通过从官方网站下载程序集文件或直接从 NuGet 获取软件包来安装 Documentize 插件。每个插件的文档中提供详细的安装说明。


PDF 转换插件

3. 如何将 PDF 文档转换为 Word(DOC/DOCX)文件?

要使用 PDF 到 DOC 转换器 将 PDF 文档转换为 Word 格式:

  1. 实例化 PdfDoc 类。
  2. 创建 PdfToDocOptions 对象以配置转换选项。
  3. 添加输入 PDF 和输出 DOC/DOCX 文件路径。
  4. 调用 Process 方法执行转换。

4. 如何将 PDF 页转换为 JPEG 图像?

使用 PDF 到 JPEG 转换器

  1. 创建 Jpeg 类的实例。
  2. 通过 JpegOptions 设置转换选项(例如,分辨率,页面范围)。
  3. 添加输入/输出文件路径。
  4. 调用 Jpeg.Process 方法运行转换。

5. 如何将 PDF 转换为 PNG?

要将 PDF 转换为 PNG 格式:

  1. 创建 Png 类的实例和 PngOptions 对象。
  2. 添加输入 PDF 并指定输出文件夹。
  3. 设置选项,如分辨率(例如,300 DPI)。
  4. 调用 Process 方法生成 PNG 图像。

6. 如何将 PDF 转换为 Excel(XLS/XLSX)?

要将 PDF 转换为 Excel:

  1. 实例化 PdfXls 类。
  2. 使用 PdfToXlsOptions 配置输入/输出路径和转换选项。
  3. 调用 Process 方法开始转换。

7. 如何将 PDF 转换为 HTML?

要将 PDF 文档转换为 HTML:

  1. 创建 PdfHtml 类的实例。
  2. 使用 PdfToHtmlOptionsHtmlToPdfOptions 配置转换选项。
  3. 添加输入/输出路径并调用 Process 方法。

PDF 表单处理

8. 如何使用表单编辑器编辑 PDF 表单?

PDF 表单编辑器 提供以下功能:

  • 添加字段(FormEditorAddOptions)。
  • 更新字段(FormEditorSetOptions)。
  • 删除字段(FormRemoveSelectedFieldsOptions)。 配置表单字段后,运行 Process 方法。

9. 如何扁平化 PDF 表单?

要扁平化表单字段:

  1. 实例化 FormFlattener 类。
  2. 使用 FormFlattenAllFieldsOptions 扁平化所有字段或使用 FormFlattenSelectedFieldsOptions 定位特定字段。
  3. 添加输入/输出文件并调用 Process 方法。

10. 如何导出 PDF 表单中的数据?

要导出表单数据,请使用 PDF 表单导出器。创建 FormExporterValuesToCsvOptions 对象,指定表单字段条件,并运行 Process 方法将数据导出为 CSV 格式。


PDF/A 和 TOC 管理

11. 如何将 PDF 转换为 PDF/A 格式?

要将 PDF 转换为 PDF/A:

  1. 使用 PdfAConverter 类。
  2. PdfAConvertOptions 中配置 PDF/A 版本(例如,PDF/A-3B)。
  3. 添加输入/输出路径并调用 Process 方法。

12. 如何在 PDF 中生成目录(TOC)?

要创建 TOC:

  1. 创建 TocGenerator 类的实例。
  2. 使用 TocOptions 定义 TOC 参数。
  3. 添加输入/输出文件并运行 Process 方法。

签名处理

13. 如何对 PDF 文档进行数字签名?

要添加数字签名:

  1. 实例化 Signature 类。
  2. 使用 SignOptions 配置 PFX 文件、密码和签名详细信息(例如,原因、联系信息)。
  3. 添加输入/输出文件并运行 Process 方法。

附加功能

14. 我可以使用 Documentize 拆分 PDF 文件吗?

可以,使用 PDF 拆分器

  1. 实例化 Splitter 类。
  2. 使用 SplitOptions 配置拆分选项。
  3. 添加输入/输出路径并调用 Process 方法。

15. 如何将多个 PDF 文件合并为一个?

要合并 PDF:

  1. 实例化 Merger 类。
  2. 添加输入 PDF,并通过 MergeOptions 指定输出文件。
  3. 运行 Process 方法合并文件。

16. Documentize 是否仅限于处理 PDF?

虽然 Documentize 主要专注于 PDF 操作,但它也支持与 DOC、XLS、HTML、JPEG 和 PNG 等格式之间的转换。


许可和兼容性

17. 使用 Documentize 插件的系统要求是什么?

Documentize 支持:

  • 操作系统:Windows 7-11,Windows Server 2003-2022,macOS(10.12+),以及 Linux。
  • 框架:.NET Framework 4.0 至 8.0。
  • IDE:与各种版本的 Visual Studio 兼容。

18. 如何设置 Documentize 的许可证密钥?

要激活插件,请在项目中引用 Documentize 并在调用任何方法之前设置许可证密钥。有关详细说明,请参考特定插件的文档。

19. 在哪里可以找到更多 Documentize 插件的示例和文档?

完整的 API 文档和示例可以在 Documentize 网站上找到,或通过您开发环境中的 NuGet 包获取。


 中文