1// 步骤 1: 配置 PDF 转 HTML 转换的选项
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

PDF 转 HTML 转换的可用选项

SaveDataType:
- FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单一 HTML 文件。
- FileWithExternalResources: 将资源单独保存，适用于大型 HTML 文件。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF，请按照以下步骤操作：

配置选项: 使用 HtmlToPdfOptions 定义布局和媒体设置。
指定路径: 设置输入 HTML 和输出 PDF 文件路径。
执行转换: 运行 HtmlConverter 的 Process 方法以转换文件。

示例：将 HTML 转换为 PDF

1// 步骤 1: 配置 HTML 转 PDF 转换的选项
2var options = new HtmlToPdfOptions();
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

HTML 转 PDF 转换的附加选项

媒体类型:
- HtmlMediaType.Print: 适合生成适合打印的 PDF。
- HtmlMediaType.Screen: 在转换为为数字观看而设计的内容时使用。
布局调整:
- PageLayoutOption: 调整 HTML 内容适应 PDF 布局的方式，例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
- IsRenderToSinglePage: 启用在需要简明呈现时将整个 HTML 内容呈现到单个 PDF 页面。

该转换器在多种应用程序中非常灵活，从基于 Web 的内容生成 PDF报告，到转换 PDF 文档归档以实现 Web 可访问性。有关更多高级配置，请参阅完整的 Documentize 文档。

PDF Security

Documentize PDF Security for .NET 是一款强大的工具，旨在通过提供加密和解密功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密，并受到未授权访问的保护。

如何加密 PDF

要加密 PDF 文档，请按照以下步骤操作：

创建 EncryptionOptions 的实例，并设置所需的用户和所有者密码。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 Security 类的 Process 方法执行加密。

1// 创建 EncryptionOptions 对象以设置指令
2var options = new EncryptionOptions("123456", "qwerty");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);

如何解密 PDF

要解密 PDF 文档，请按照以下步骤操作：

创建 DecryptionOptions 的实例，并设置必要的密码。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 Security 类的 Process 方法执行解密。

1// 创建 DecryptionOptions 对象以设置指令
2var options = new DecryptionOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);

主要特点：

加密 PDF 文档：通过添加用户和所有者密码来保护您的 PDF 文件。
解密 PDF 文档：在需要时移除 PDF 的加密。

自动化：将加密和解密集成到您的 .NET 应用程序中，以实现自动化工作流程。
合规性：确保您的文档符合行业标准的文档安全性。

PDF Optimizer

Documentize PDF Optimizer 是一个全面的插件，通过先进的优化技术增强 PDF 文档。它旨在帮助减少文件大小、旋转页面、裁剪内容和调整文档尺寸。这些操作可以提高 PDF 文件的质量和可管理性，使其更易于存储、共享和查看。

优化 PDF

以下步骤演示了如何通过减少文件大小同时保持质量来优化 PDF 文档。

创建一个 OptimizeOptions 对象以配置优化设置。
添加输入 PDF 文件并设置优化文件的输出位置。
运行 Optimizer 的 Process 方法以执行优化。

1// 创建 OptimizeOptions 对象以设置指令
2var options = new OptimizeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);

旋转 PDF

使用 RotateOptions 类来调整 PDF 文件中页面的方向。

创建一个 RotateOptions 对象并配置旋转角度。
添加输入 PDF 文件并指定输出文件位置。
使用 SetRotation 方法设置旋转角度（例如，90 度）。
运行 Optimizer 的 Process 方法。

 1// 创建 RotateOptions 对象以设置指令
 2var options = new RotateOptions();
 3// 设置新的旋转
 4options.Rotation = Rotation.On90;
 5// 添加输入文件路径
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// 设置输出文件路径
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// 执行处理
10Optimizer.Process(options);

调整 PDF 尺寸

要调整 PDF 文档的大小，可以使用 ResizeOptions 类来指定文档的新页面大小。

创建一个 ResizeOptions 对象以定义页面大小。
添加输入文件并设置所需的输出位置。
使用 SetPageSize 方法指定新尺寸（例如，A4）。
运行 Optimizer 的 Process 方法。

 1// 创建 ResizeOptions 对象以设置指令
 2var options = new ResizeOptions();
 3// 设置新的页面尺寸
 4options.PageSize = PageSize.A3;
 5// 添加输入文件路径
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// 设置输出文件路径
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// 执行处理
10Optimizer.Process(options);

压缩 PDF

通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来在可行的情况下压缩 PDF 文档。

创建一个 CompressOptions 对象以配置优化设置。
添加输入文件并指定输出文件位置。
使用 SetCropBox 方法定义裁剪区域。
运行 Optimizer 的 Process 方法。

1// 创建 CompressOptions 对象以设置指令
2var options = new CompressOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);

主要特点：

优化：在不损失质量的情况下减少 PDF 文件大小。
旋转：调整 PDF 页面的方向。
调整大小：将页面调整为特定尺寸（例如，A4、Letter）。
压缩：从文档中删除未使用的页面资源和对象。

PDF Merger

Documentize PDF Merger for .NET 是一个多功能工具，旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合，确保您的文档能够高效合并并保持内容的一致性。该插件处理内部资源，例如字体和图像，以优化合并后的文档。

如何合并 PDF

要将多个 PDF 文档合并为一个文件，请按照以下步骤操作：

创建一个 MergeOptions 的实例以配置合并过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法添加输出 PDF 文件。
使用 Merger 类的 Process 方法执行合并。

1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9Merger.Process(options);

如何合并具有页面范围的 PDFs

您还可以使用 MergeOptions 类从输入 PDF 文件中合并特定的页面范围。这允许您将所选页面合并到最终输出文档中。

创建 Merger 类的实例。
使用 MergeOptions 配置页面范围。
添加具有指定页面范围的输入文件。
设置输出路径。
调用 Process 方法。

 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 从输入 PDFs 中合并特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行处理
12merger.Process(mergeOptions);

如何处理批量合并

PDF Merger 插件经过优化，能够处理大量 PDF 文档。通过利用批处理功能，您可以在一次操作中合并数百个 PDF，确保高效和快速的文档管理。

实例化 Merger 类。
将所有输入 PDF 文件添加到 MergeOptions 类中。
指定输出路径。
调用 Process 方法以合并批量中的所有文件。

 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDFs 进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

主要特点：

合并多个 PDFs：轻松将多个 PDF 文件合并为一个。
资源优化：合并过程中移除重复的字体和图像。
批量处理：一次性合并大量 PDF 文档。

PDF Table Generator

Documentize 的 .NET 表格生成器 是一个多功能插件，旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单，还是提高文档可读性，这个插件都能简化过程，同时保持准确性和效率。它直观的 API 支持单个文档和批处理工作流，是处理结构化数据的开发者必备工具。

创建包含表格的 PDF

按照以下步骤使用 TableGenerator 类在 PDF 中创建结构化表格：

实例化 TableGenerator 类。
配置 TableOptions 对象以定义表格结构、内容和输入/输出文件。
将表格、行和单元格添加到您的 PDF。
使用 Process 方法完成表格生成过程。

以下是一个示例：

 1var generator = new TableGenerator();
 2var options = new TableOptions();
 3
 4// 指定输入和输出 PDF 文件
 5options.AddInput(new FileDataSource("input.pdf"));
 6options.AddOutput(new FileDataSource("output.pdf"));
 7
 8// 定义一个包含行和单元格的表格
 9options
10    .InsertPageAfter(1) // 在第一页之后添加表格
11    .AddTable()
12        .AddRow()
13            .AddCell().AddParagraph(new TextFragment("Cell 1"))
14            .AddCell().AddParagraph(new TextFragment("Cell 2"))
15            .AddCell().AddParagraph(new TextFragment("Cell 3"));
16
17// 在文档中生成表格
18generator.Process(options);

向表格添加丰富内容

PDF 文档中的表格可以包含多种内容类型，以增强其功能和外观。以下是将 HTML 内容添加到表格单元格的示例：

1options
2    .AddTable()
3        .AddRow()
4            .AddCell().AddParagraph(new HtmlFragment("<h1>Header 1</h1>"))
5            .AddCell().AddParagraph(new HtmlFragment("<h2>Header 2</h2>"))
6            .AddCell().AddParagraph(new HtmlFragment("<h3>Header 3</h3>"));

表格中支持的内容类型

PDF 表格生成器 支持多种内容类型，使开发者能够为各种用例自定义表格：

HtmlFragment：添加基于 HTML 的内容，如标题、列表和格式化文本。
TeXFragment：包含基于 LaTeX 的内容，用于数学方程式和科学表示法。
TextFragment：插入纯文本或格式化文本。
Image：直接在表格单元格中嵌入图像。

自定义表格布局和结构

该插件提供了调整表格结构的灵活性，包括行高、列宽和单元格对齐。这些自定义选项使您能够设计出符合文档布局和样式需求的表格。

处理表格生成

在添加所有内容并自定义表格结构后，通过调用 Process 方法完成该过程。此方法生成表格并更新 PDF 文档。以下是处理结果的方式：

1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);

PDF 表格生成器的用例

数据报告：以清晰和有组织的格式呈现分析、财务报告或调查结果。
表单设计：创建具有结构化表格布局的交互式表单。
文档增强：提高用户手册、指南或教学材料的可读性和可用性。
批处理：自动为多个 PDF 文档生成表格。

主要特性：

动态表格创建：轻松生成 PDF 文档中的结构化表格。
丰富内容支持：用文本、HTML、图像和 LaTeX 内容填充表格。
页面放置：精确地在 PDF 中的特定位置插入表格。
可自定义布局：调整表格结构、单元格对齐和样式。
批处理：同时处理多个文档以实现最大效率。

PDF TOC Generator

Documentize PDF TOC Generator for .NET 是一个强大的插件，旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。该插件简化了向 PDF 添加 TOC 的过程，使文档更易于导航和管理。

如何为 PDF 生成 TOC

要在 PDF 文件中创建目录，请按照以下步骤操作：

创建 TocGenerator 类的实例。
创建 TocOptions 的实例，以配置 TOC 生成设置。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法指定带有 TOC 的输出 PDF 文件。
调用 Process 方法生成 TOC。

1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// 添加输入和输出文件
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
7
8// 生成 TOC
9tocGenerator.Process(tocOptions);

自定义 TOC

您可以通过修改 TocOptions 类来定制目录。例如，您可以控制 TOC 条目的深度级别，设置特定的格式选项等：

 1var tocOptions = new TocOptions
 2{
 3    Depth = 3,  // 将 TOC 深度级别设置为 3
 4    FontSize = 12,  // 设置 TOC 条目的字体大小
 5    Title = "目录"  // 自定义 TOC 标题
 6};
 7
 8// 添加输入和输出文件
 9tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
11
12// 使用自定义选项生成 TOC
13tocGenerator.Process(tocOptions);

如何处理结果

处理后，Process 方法返回一个 ResultContainer 对象，该对象保存有关 TOC 生成的详细信息。您可以检索并打印输出详细信息：

1var resultContainer = tocGenerator.Process(tocOptions);
2
3// 访问结果集合并打印输出文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);

批量处理多个 PDF

PDF TOC Generator 插件支持批量处理，使您能够同时向多个 PDF 文档添加 TOC。

 1var tocGenerator = new TocGenerator();
 2var tocOptions = new TocOptions();
 3
 4// 添加多个输入 PDF
 5tocOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6tocOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 添加带 TOC 的输出 PDF
 9tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output1_with_toc.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output2_with_toc.pdf"));
11
12// 处理批量 TOC 生成
13tocGenerator.Process(tocOptions);

关键特性：

动态 TOC 生成：根据标题或书签自动生成条目，为任何 PDF 文件创建 TOC。
批量处理：一次为多个 PDF 文档生成 TOC。
定制：控制 TOC 的外观和结构，包括样式、格式和深度级别。
高效工作流程：减少手动创建 TOC 的时间，特别是对于大型或复杂文档。

PDF Signature

Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名、确保真实性和保护 PDF 内容的简化流程。该插件支持可见和隐形签名，并提供自定义签名位置、原因、联系信息等选项。

如何签署 PDF 文档

要使用 PFX 文件签署 PDF 文档，请按照以下步骤操作：

使用 PFX 文件路径和密码实例化 SignOptions 类。
将输入 PDF 和输出文件添加到选项中。
运行 Process 方法以应用签名。

1// 创建 SignOptions 对象以设置说明
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Signature.Process(options);

如何使用流进行 PFX 文件签名

您也可以使用作为流提供的 PFX 证书签署 PDF，而不是文件路径。这允许更灵活地处理证书存储。

用包含 PFX 的流和密码实例化 SignOptions。
添加输入和输出文件。
运行 Process 方法以应用签名。

1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行处理
6Signature.Process(options);

如何添加隐形签名

要添加隐形签名（在文档上不会显示签名但可以保护文档），只需将 Visible 属性设置为 false。

创建 SignOptions 的实例。
将 Visible 设置为 false。
添加输入和输出文件。
调用 Process 以应用隐形签名。

1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置隐形签名
5signOptions.Visible = false;
6// 执行处理
7Signature.Process(options);

如何为 PDF 文档的签名使用额外选项

在向 PFX 文件添加签名时，您可以使用额外选项，如原因、联系人、位置、页码。

使用 PFX 文件路径和密码实例化 SignOptions 类。
将输入 PDF 和输出文件添加到选项中。
设置选项的值。
运行 Process 方法以应用签名。

 1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 4// 可选参数
 5options.Reason = "my Reason";
 6options.Contact = "my Contact";
 7options.Location = "my Location";
 8options.PageNumber = 3;
 9// 执行处理
10Signature.Process(options);

主要功能：

数字签署 PDF 文档：使用可见或隐形数字签名保护您的文档。
PFX 支持：使用 PFX 证书签署 PDF 文件。
可自定义选项：配置签名设置，如原因、位置和联系信息。
可见和隐形签名：选择签名是否在文档上可见。

PDF Splitter

Documentize PDF Splitter for .NET 是一款强大的工具，简化了将大型PDF文档拆分为更小、更易管理文件的过程。无论您需要提取单个页面还是将文档划分为特定部分，这个插件都能高效地帮您实现，并且所需的努力最小化。

如何拆分PDF

要将PDF文档拆分为单独的页面，请遵循以下步骤：

创建一个SplitOptions实例以配置拆分选项。
使用AddInput方法添加输入PDF文件。
使用AddOutput方法为每个拆分页面添加输出文件。
在Splitter类中运行Process方法以拆分文档。

 1var splitOptions = new SplitOptions();
 2
 3// 添加输入PDF文件
 4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 5
 6// 为每个页面指定输出文件
 7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// 处理拆分操作
12Splitter.Process(splitOptions);

关键特性：

按页面拆分PDF：将PDF文档拆分为单独的页面。
批量处理：一次性拆分大量PDF。
自定义拆分选项：根据您的需求配置拆分过程。
有序输出：轻松管理每个拆分页面或部分的输出文件。

PDF ChatGPT

Documentize ChatGPT for .NET 插件是一个强大的工具，旨在将 ChatGPT API 与 PDF 应用程序集成。此插件允许开发人员根据输入消息生成聊天响应，并将输出保存为 PDF 格式，使其适合在 PDF 文档中直接创建对话界面或分析报告。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件，请按照以下步骤操作：

创建 PdfChatGptRequestOptions 类的实例以配置请求选项。
添加输入和输出 PDF 文件。
设置 API 密钥，并指定参数，例如最大令牌数和 ChatGPT 模型的查询。
运行 ProcessAsync 方法以生成聊天响应。

 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // 设置您的 API 密钥
 3options.MaxTokens = 1000;  // 设置最大令牌数
 4options.Query = "分析此文本的关键主题。";
 5
 6// 添加输入 PDF 文件
 7options.AddInput(new FileDataSource("input.pdf"));
 8
 9// 指定保存聊天响应的输出 PDF 的位置
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// 创建 PdfChatGpt 插件的实例
13var plugin = new PdfChatGpt();
14
15// 异步运行处理
16var result = await plugin.ProcessAsync(options);

主要特点:

聊天完成: 使用 ChatGPT API 根据自定义输入生成响应。
系统和用户消息: 提供系统上下文和用户输入以创建动态对话。
PDF 输出: 将生成的聊天完成保存在结构化的 PDF 文件中以供进一步使用。
异步处理: 通过异步处理聊天完成确保应用程序的响应性。

添加系统和用户消息

要创建更为互动的对话，您可以同时添加系统和用户消息。这些消息有助于塑造对话上下文。

添加一个系统消息，以设置 ChatGPT 的上下文。
添加一个用户消息，以表示用户的输入。

 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // 设置您的 API 密钥
 3
 4// 添加上下文的系统消息
 5options.AddSystemMessage("您是一个被训练来总结文本的人工智能。");
 6
 7// 添加用户消息以查询 ChatGPT 模型
 8options.AddUserMessage("请总结附加的文档。");
 9
10// 添加输入和输出 PDF
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// 异步处理请求
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);

PDF Image Extractor

Documentize PDF Image Extractor for .NET 插件使您能够轻松地从PDF文档中提取图像。它扫描您的PDF文件，识别嵌入的图像，并在保持原始质量和格式的同时提取它们。这个工具提高了视觉内容的可访问性，并简化了从PDF中检索图像的过程。

如何从PDF中提取图像

要从PDF文件中提取图像，请遵循以下步骤：

创建 ImageExtractorOptions 类的实例。
使用 AddInput 方法将输入文件路径添加到选项中。
使用 AddOutput 方法设置图像的输出目录路径。
使用插件处理图像提取。
从结果容器中检索提取的图像。

 1// 创建 ImageExtractorOptions 以设置指令
 2var options = new ImageExtractorOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
 7// 执行处理
 8var results = ImageExtractor.Process(options);
 9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();

从PDF文件提取图像到流，不使用文件夹

ImageExtractor 插件支持保存到流，这允许您从PDF文件中提取图像到流，而无需使用临时文件夹。

 1// 创建 ImageExtractorOptions 以设置指令
 2var options = new ImageExtractorOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 不设置输出 - 它将结果写入流
 6// 执行处理
 7var results = ImageExtractor.Process(options);
 8// 获取流
 9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

主要特性：

提取嵌入图像：识别并提取PDF文档中的图像。
保持图像质量：确保提取的图像保留其原始质量。
灵活输出：以您喜欢的格式或位置保存提取的图像。

PDF Text Extractor

Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要的是纯文本、原始文本还是普通文本，该插件都可以高效地提取文本，同时根据您的需要保留格式或省略格式。

如何从 PDF 中提取文本

要从 PDF 文档中提取文本，请按照以下步骤操作：

创建 TextExtractorOptions 的实例以配置提取选项。
使用 AddInput 方法添加输入 PDF 文件。
运行 Process 方法以提取文本。
使用 ResultContainer.ResultCollection 访问提取的文本。

1// 创建 TextExtractorOptions 对象以设置指令
2var options = new TextExtractorOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

文本提取模式

TextExtractor 插件提供三种提取模式，根据您的需求提供灵活性。

纯模式：保留原始格式，包括空格和对齐。
原始模式：提取不带格式的文本，适用于原始数据处理。
扁平模式：根据坐标表示 PDF 内容与定位文本片段。

1// 创建 TextExtractorOptions 对象以设置 TextFormattingMode
2var options = new TextExtractorOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();

主要特点：

纯模式：在保留原始格式的同时提取文本。
原始模式：提取不带任何格式的文本。
扁平模式：提取没有特殊字符或格式的文本。

PDF Timestamp Adder

Documentize PDF时间戳添加器（.NET） 是一个强大的工具，旨在为您的PDF文档添加安全的时间戳。它通过提供可信的时间参考，增强了文档的完整性和真实性，确保符合数字签名标准。

如何为PDF添加时间戳

要为PDF文档添加安全时间戳，请按照以下步骤操作：

创建Timestamp类的实例。
创建AddTimestampOptions实例以配置时间戳过程。
使用AddInput方法添加输入PDF文件。
使用AddOutput设置输出文件路径。
使用Process方法执行时间戳处理。

 1// 实例化时间戳插件
 2var plugin = new Timestamp();
 3
 4// 配置时间戳选项
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
 6
 7// 添加输入PDF文件
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 指定输出PDF文件
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// 执行时间戳处理
14plugin.Process(opt);

如何与时间戳服务器使用自定义身份验证

连接到时间戳服务器时，您可以提供基本身份验证凭据。这使您能够与需要用户名和密码的服务器进行身份验证。

创建Timestamp类的实例。
创建AddTimestampOptions的实例，包括serverBasicAuthCredentials。
添加输入文件和输出文件路径。
调用Process方法。

 1// 实例化时间戳插件
 2var plugin = new Timestamp();
 3
 4// 使用身份验证配置时间戳选项
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
 6
 7// 添加输入PDF文件
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 指定输出PDF文件
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// 执行时间戳处理
14plugin.Process(opt);

处理PFX文件和密码

AddTimestampOptions类允许您使用PFX文件进行数字签名以及密码。

PFX流或文件路径：您可以提供PFX文件的流或文件路径。
密码保护：确保安全管理PFX文件的密码。

主要特点：

添加安全时间戳：轻松为您的PDF文档添加安全时间戳。
可定制的时间戳服务器：使用自定义时间戳服务器URL和身份验证凭据。
自动化：将时间戳集成到您的.NET应用程序中以实现自动化工作流程。
合规性：确保您的文档符合数字签名和时间戳的行业标准。

PDF/A Converter

Documentize PDF/A Converter for .NET 是一个强大的工具，旨在将PDF文档转换为PDF/A格式，确保您的内容符合长期归档标准。此插件还支持验证现有PDF文档的PDF/A合规性，在一个解决方案中提供转换和验证功能。

如何将PDF转换为PDF/A

要将PDF文档转换为PDF/A格式，请按照以下步骤操作：

创建PdfAConverter类的实例。
创建PdfAConvertOptions的实例以配置转换。
指定所需的PDF/A版本（例如，PDF/A-3B）。
使用AddInput方法添加输入PDF文件。
使用AddOutput方法添加生成的PDF/A的输出文件。
调用Process方法以执行转换。

 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// 添加输入PDF文件
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 指定输出PDF/A文件
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// 处理转换
14pdfAConverter.Process(pdfAOptions);

验证PDF/A合规性

您可以使用PdfAValidateOptions类验证现有PDF文件的PDF/A合规性。

 1var pdfAConverter = new PdfAConverter();
 2var validationOptions = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// 添加要验证的PDF文件
 8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 运行验证过程
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// 检查验证结果
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);

PDF/A转换的批处理

此插件支持批处理，允许您一次转换或验证多个PDF文件以符合PDF/A标准。

 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// 添加多个输入PDF
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 指定转换后的PDF/A的输出文件
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// 处理批量转换
16pdfAConverter.Process(pdfAOptions);

主要功能：

转换为PDF/A: 无缝将PDF文件转换为PDF/A格式（如PDF/A-1a、PDF/A-2b、PDF/A-3b），确保符合归档标准。
验证PDF/A合规性: 检查现有PDF文档是否符合PDF/A标准，并识别任何不合规的问题。
批处理: 一次处理多个文件以进行转换或验证。
高效工作流: 通过快速可靠的转换过程来最小化时间和精力。

PDF 转 XLS 转换器

Documentize PDF 转 XLS 转换器 for .NET 是一个通用且强大的工具，用于将 PDF 文档转换为 Excel 电子表格 (XLSX/XLS/CSV/XLSM/ODS)。通过利用此插件，开发人员可以无缝地将静态 PDF 数据转换为动态且可编辑的电子表格，从而简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件 (XLSX)，请按照以下步骤操作：

使用 PdfToXlsOptions 类配置转换设置。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法指定输出文件路径。
执行 Process 方法以启动转换。

1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.xlsx"));
7// 执行处理
8XlsConverter.Process(options);

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如，要将 PDF 转换为 XLS 文件并启用高级格式选项：

 1// 创建 PdfToXlsOptions 对象以设置指令
 2var options = new PdfToXlsOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 指定 XLS 格式
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 执行处理
12XlsConverter.Process(options);

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式：

XLSX: Office Open XML (.xlsx) 文件格式（默认）。
XLSM: 启用宏的 Excel 格式。
CSV: 逗号分隔值。
ODS: 开放文档电子表格。
XMLSpreadSheet2003: Excel 2003 XML (.xls) 文件格式。

主要特性：

灵活的转换选项：将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
内容保留：保持原始结构、布局和格式。
高级格式：插入空白列或最小化工作表数量。

PDF to DOC Converter

Documentize PDF to DOC Converter for .NET 是一个强大的工具，旨在将PDF文档转换为DOC或DOCX格式。此插件无缝地将PDF页面转换为可编辑的Microsoft Word文档，使在多个平台上重用、编辑和共享内容变得容易。

如何将PDF转换为DOC/DOCX

要将PDF文档转换为DOC/DOCX格式，请按照以下步骤操作：

创建DocConverter类的实例。
创建DocConversionOptions的实例以配置转换过程。
使用AddInput方法添加输入PDF文件。
使用AddOutput方法添加生成的DOC/DOCX文件的输出文件路径。
运行Process方法以执行转换。

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // 输出格式为DOCX
 5    ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15docConverter.Process(options);

使用自定义选项转换PDF到DOC

PDF to DOC Converter插件提供多种选项以自定义转换过程。您可以选择不同的模式来控制在转换过程中如何处理PDF的布局和结构。

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // 输出格式为DOC
 5    ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15docConverter.Process(options);

批量处理PDF到DOC/DOCX转换

PDF to DOC Converter支持批量处理，允许您一次转换多个PDF文件。以下是批量转换的示例：

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// 添加多个输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加生成的DOCX文件的输出文件路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16docConverter.Process(options);

主要特性：

DOC/DOCX转换：将PDF文档转换为可编辑的Microsoft Word格式（DOC或DOCX）。
保持格式：在转换过程中保留原始布局、文本和格式。
批量处理：一次转换多个PDF文件。
自定义转换选项：通过不同模式微调转换过程，例如增强流，以获得更好的布局。

PDF to JPEG Converter

Documentize PDF to JPEG Converter for .NET 是一个强大的工具，简化了将 PDF 文档转换为高质量 JPEG 图像的过程。该插件旨在通过将 PDF 页面转换为广泛使用的图像格式，使您的内容更易于跨平台访问。

如何将 PDF 页面转换为 JPEG

要将 PDF 文档转换为 JPEG 图像，请按照以下步骤操作：

创建一个 PdfToJpegOptions 实例以配置转换过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法设置 JPEG 图像的输出目录路径。
运行 Process 方法将 PDF 页面转换为 JPEG 图像。

1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8JpegConverter.Process(options);

自定义 PDF 转 JPEG 转换

您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以 200 DPI 转换 PDF 的第一页：

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToJpegOptions();
 3// 仅处理第一页
 4options.PageList = new List<int> { 1 };
 5// 设置输出分辨率为 200 DPI
 6options.OutputResolution = 200;
 7// 设置输出质量为 50
 8options.Quality = 50;
 9// 添加输入文件路径
10options.AddInput(new FileDataSource("path_to_input.pdf"));
11// 设置输出目录路径
12options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
13// 执行处理
14JpegConverter.Process(options);

如何在没有目录的情况下获取结果，或以流的形式获取结果

Process 方法返回一个 ResultContainer 对象，该对象包含有关转换结果的信息。您可以获取转换后 JPEG 文件的流，如下所示：

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToJpegOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = JpegConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特性：

将 PDF 转换为 JPEG：轻松将整个 PDF 文档或特定页面转换为 JPEG 图像。
自定义分辨率：调整分辨率（例如，300 dpi）以获得高质量输出。
页面集：选择特定页面进行转换。
快速转换：快速高效的过程，最小化工作量。

PDF to PNG Converter

Documentize PDF to PNG Converter for .NET 是一个高级工具，允许您将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式，使您的内容更加多样化、可访问和易于共享。

如何将 PDF 转换为 PNG

要将 PDF 文档转换为 PNG 图像，请按照以下步骤操作：

创建 PdfToPngOptions 实例以配置转换过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法设置 PNG 图像的输出目录路径。
运行 Process 方法将 PDF 页面转换为 PNG 图像。

1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8PngConverter.Process(options);

自定义 PDF 到 PNG 转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如，要以 200 DPI 转换 PDF 的第一页面：

 1// 创建 PdfToPngOptions 对象以设置指令
 2var options = new PdfToPngOptions()
 3// 仅处理第一页
 4options.PageList = new List<int> { 1 };
 5// 设置输出分辨率为 200 dpi
 6options.OutputResolution = 200;
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行处理
12PngConverter.Process(options);

处理转换结果

Process 方法返回一个 ResultContainer 对象，该对象包含有关转换结果的信息。您可以获取转换后 PNG 文件的流，如下所示：

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = PngConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点：

将 PDF 转换为 PNG：快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
可自定义分辨率：设置所需的 DPI（例如，300 DPI）以获得高质量的图像输出。
页面集合：选择特定页面进行转换。
轻松输出管理：为每个转换后的 PNG 文件指定输出目录。
快速转换：快速、高效，并且配置所需的努力最小。

PDF to TIFF Converter

Documentize PDF to TIFF Converter for .NET 是一个强大的工具，旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件确保您的内容在各个平台上都可访问，同时保持卓越的保真度和多功能性。您可以通过调整分辨率、启用多页输出或选择页面来定制转换过程。

如何将 PDF 转换为 TIFF

要将 PDF 文档转换为 TIFF 图像，请按照以下步骤操作：

创建 PdfToTiffOptions 的实例以配置转换过程。
使用 AddInput 方法添加输入 PDF 文件。
使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
运行 Process 方法将 PDF 页面转换为 TIFF 图像。

1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8TiffConverter.Process(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置页面
 8options.PageList = [1, 3];
 9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行处理
12TiffConverter.Process(options);

多页 TIFF 创建

PDF to TIFF Converter 插件支持多页 TIFF 生成，允许您将多个 PDF 页面合并为一个 TIFF 文件，以便于存档或打印。

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 启用多页 TIFF 输出
 8options.MultiPage = true;
 9// 执行处理
10TiffConverter.Process(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置压缩和色深
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行处理
11TiffConverter.Process(options);

如何处理转换结果

Process 方法返回一个 ResultContainer 对象，其中提供有关转换结果的详细信息。您可以获得转换后 TIFF 文件的流，如下所示：

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行处理
 6var results = TiffConverter.Process(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点：

将 PDF 转换为 TIFF：轻松地将整个 PDF 文档或特定页面转换为 TIFF 图像。
自定义分辨率：调整分辨率（例如，300 dpi）以获得更高质量的输出。
多页 TIFF：将多个 PDF 页面合并为一个多页 TIFF 文件。
页面集：选择特定页面进行转换。
快速转换：快速有效的处理，付出最少的努力。

PDF Form Flattener

Documentize PDF Form Flattener for .NET 插件旨在将交互式PDF表单转换为不可编辑的文档，确保其免受未经授权的修改。该工具将表单字段转换为静态内容，增强您的PDF文档的安全性。当您需要确保合同、协议或任何必须保持不变的表单字段的文档时，此工具特别有用。

如何在PDF中扁平化表单字段

要在PDF文档中扁平化表单字段，请按照以下步骤操作：

创建FormFlattenerOptions类的实例。
将输入和输出文件添加到选项中。
调用Process方法执行扁平化操作。

1// 创建FormFlattenerOptions对象以设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);

如何获取PDF中的所有字段

您可以获取文档中包含多少字段的信息。

1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");

如何在PDF中扁平化除了第一个字段以外的所有内容

您可以根据字段的位置或名称等标准选择性地只扁平化特定的表单字段。

 1// 获取字段名称
 2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
 3// 创建FormFlattenerOptions对象以设置指令
 4var options = new FormFlattenerOptions();
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 7// 跳过1个字段。
 8options.SkipFields.Add(fieldNames[0]);
 9// 执行处理
10FormFlattener.Process(options);

主要特性：

扁平化所有表单字段：将交互式表单字段转换为不可编辑的静态内容。
扁平化选定字段：可选择在PDF中扁平化特定字段，同时保留其他字段可编辑。
扁平化获取字段名称：获取PDF中的字段名称。

开发者指南

开发者指南 的子部分

HTML Converter

PDF 转 HTML 转换

HTML 转 PDF 转换

将 PDF 转换为 HTML

PDF 转 HTML 转换的可用选项

将 HTML 转换为 PDF

HTML 转 PDF 转换的附加选项

PDF Security

如何加密 PDF

如何解密 PDF

主要特点：

PDF Optimizer

优化 PDF

旋转 PDF

调整 PDF 尺寸

压缩 PDF

主要特点：

PDF Merger

如何合并 PDF

如何合并具有页面范围的 PDFs

如何处理批量合并

主要特点：

PDF Table Generator

创建包含表格的 PDF

向表格添加丰富内容

表格中支持的内容类型

自定义表格布局和结构

处理表格生成

PDF 表格生成器的用例

主要特性：

PDF TOC Generator

如何为 PDF 生成 TOC

自定义 TOC

如何处理结果

批量处理多个 PDF

关键特性：

PDF Signature

如何签署 PDF 文档

如何使用流进行 PFX 文件签名

如何添加隐形签名

如何为 PDF 文档的签名使用额外选项

主要功能：

PDF Splitter

如何拆分PDF

关键特性：

PDF ChatGPT

生成聊天响应

主要特点:

添加系统和用户消息

PDF Image Extractor

如何从PDF中提取图像

从PDF文件提取图像到流，不使用文件夹

主要特性：

PDF Text Extractor

如何从 PDF 中提取文本

文本提取模式

主要特点：

PDF Timestamp Adder

如何为PDF添加时间戳

如何与时间戳服务器使用自定义身份验证

处理PFX文件和密码

主要特点：

PDF/A Converter

如何将PDF转换为PDF/A

验证PDF/A合规性

PDF/A转换的批处理

主要功能：

PDF 转 XLS 转换器

如何将 PDF 转换为 Excel

自定义 PDF 到 Excel 转换

支持的输出格式

主要特性：

PDF to DOC Converter

如何将PDF转换为DOC/DOCX

使用自定义选项转换PDF到DOC

批量处理PDF到DOC/DOCX转换

主要特性：

PDF to JPEG Converter

开发者指南的子部分