开发者指南

PDF安全性

使用C# .NET加密和解密PDF文档

PDF 表格生成器

轻松生成 PDF 文档中的结构化表格,理想用于组织数据、创建交互式表单及增强内容可读性。

PDF优化器

减小文件大小,旋转页面,裁剪内容,调整文档大小

PDF 合并器

使用 C# .NET 将多个 PDF 文档合并为一个文件

PDF签名

.NET插件提供简化的签名添加流程,确保真实性并保护PDF内容

PDF 分割器

.NET 工具,简化将大型 PDF 文档拆分为更小、更易管理的文件的过程

PDF ChatGPT

将 ChatGPT API 集成到 .NET PDF 应用程序

PDF文本提取器

.NET插件允许您高效提取文本,同时根据您的需求保留格式或省略格式

PDF 时间戳添加器

使用 C# .NET 为您的 PDF 文档添加安全时间戳

PDF/A 转换器

.NET 插件将 PDF 文档转换为 PDF/A 格式,确保您的内容仍符合长期归档标准

PDF转XLS转换器

借助Documentize强大的.NET插件,轻松将PDF文档转换为Excel电子表格(XLS/XLSX)。

PDF转DOC转换器

.NET工具允许将PDF文档转换为DOC或DOCX格式

PDF转JPEG转换器

.NET插件简化了将PDF文档转换为高质量JPEG图像的过程

PDF转PNG转换器

.NET插件允许您将PDF文档转换为高质量的PNG图像

PDF 转 TIFF 转换器

.NET 插件简化 PDF 文档转换为高质量 TIFF 图像

HTML 转换器

Documentize HTML 转换器 PDF 到 HTML 和 HTML 到 PDF 功能的全面指南。

2024年10月10日

开发者指南 的子部分

PDF安全性

Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的PDF文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。

关键功能:

  • 加密PDF文档:通过添加用户和所有者密码,保护您的PDF文件。
  • 解密PDF文档:在需要时去除PDF文件的加密。
  • 设置权限:控制打印、复制和修改内容等权限。
  • 自动化:将加密和解密集成到您的.NET应用程序中,以实现自动化工作流程。
  • 合规性:确保您的文档符合行业标准的文档安全性。

如何加密PDF文档

要加密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 创建EncryptionOptions的实例,并设置所需的用户和所有者密码。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行加密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置加密选项
 5var opt = new EncryptionOptions("user_password", "owner_password");
 6
 7// 添加输入PDF文件
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 指定输出加密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// 执行加密处理
14plugin.Process(opt);

如何解密PDF文档

要解密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 创建DecryptionOptions的实例,并提供必要的密码。
  3. 使用AddInput方法添加加密的PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行解密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置解密选项
 5var opt = new DecryptionOptions("user_password");
 6
 7// 添加输入加密PDF文件
 8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
 9
10// 指定输出解密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// 执行解密处理
14plugin.Process(opt);

设置PDF文档的权限

在加密PDF时,您可以设置各种权限以控制文档的使用方式。

  • 打印:允许或禁止打印文档。
  • 复制:允许或禁止复制内容。
  • 修改:允许或禁止对文档的修改。

要设置权限,您可以相应地配置EncryptionOptions

PDF 表格生成器

.NET 的 Documentize 表格生成器 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论是组织数据、设计表单还是改善文档可读性, هذا 插件都可以在保持精确性和效率的同时简化流程。它直观的 API 支持单个文档和批处理工作流,使其成为处理结构化数据的开发者必备工具。

主要特点:

  • 动态表格创建:轻松生成 PDF 文档中的结构化表格。
  • 丰富的内容支持:使用文本、HTML、图像和 LaTeX 内容填充表格。
  • 页面放置:精确地在 PDF 中的特定位置插入表格。
  • 可定制的布局:调整表格结构、单元格对齐和样式。
  • 批处理:同时处理多个文档以实现最大效率。

使用表格创建 PDF

按照以下步骤使用 TableGenerator 类在 PDF 中创建结构化表格:

  1. 实例化 TableGenerator 类。
  2. 配置 TableOptions 对象以定义表格结构、内容和输入/输出文件。
  3. 向 PDF 添加表格、行和单元格。
  4. 使用 Process 方法完成表格生成过程。

以下是一个示例:

 1var generator = new TableGenerator();
 2var options = new TableOptions();
 3
 4// 指定输入和输出 PDF 文件
 5options.AddInput(new FileDataSource("input.pdf"));
 6options.AddOutput(new FileDataSource("output.pdf"));
 7
 8// 定义一个包含行和单元格的表格
 9options
10    .InsertPageAfter(1) // 在第一页后添加表格
11    .AddTable()
12        .AddRow()
13            .AddCell().AddParagraph(new TextFragment("单元格 1"))
14            .AddCell().AddParagraph(new TextFragment("单元格 2"))
15            .AddCell().AddParagraph(new TextFragment("单元格 3"));
16
17// 在文档中生成表格
18generator.Process(options);

向表格添加丰富内容

PDF 文档中的表格可以包含多种内容类型,以增强其功能和外观。下面是向表格单元格添加 HTML 内容的示例:

1options
2    .AddTable()
3        .AddRow()
4            .AddCell().AddParagraph(new HtmlFragment("<h1>标题 1</h1>"))
5            .AddCell().AddParagraph(new HtmlFragment("<h2>标题 2</h2>"))
6            .AddCell().AddParagraph(new HtmlFragment("<h3>标题 3</h3>"));

表格中支持的内容类型

PDF 表格生成器 支持多种内容类型,使开发者能够根据各种用例自定义表格:

  • HtmlFragment:添加基于 HTML 的内容,如标题、列表和格式化文本。
  • TeXFragment:包含用于数学公式和科学计数法的 LaTeX 内容。
  • TextFragment:插入普通或格式化文本。
  • Image:将图像直接嵌入表格单元格中。

定制表格布局和结构

该插件提供了调整表格结构的灵活性,包括行高、列宽和单元格对齐。这些定制选项允许您设计与文档的布局和样式需求相匹配的表格。

处理表格生成

在添加所有内容并定制表格结构之后,通过调用 Process 方法完成该过程。此方法生成表格并更新 PDF 文档。以下是处理结果的方法:

1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);

PDF 表格生成器的用例

  1. 数据报告:以清晰有序的格式呈现分析、财务报告或调查结果。
  2. 表单设计:创建具有结构化表格布局的交互式表单。
  3. 文档增强:改善用户手册、指南或教学材料的可读性和可用性。
  4. 批处理:自动生成多个 PDF 文档的表格。

PDF优化器

Documentize PDF优化器 是一个综合插件,通过高级优化技术增强PDF文档。它的设计旨在帮助减小文件大小,旋转页面,裁剪内容,并调整文档大小。这些操作改善了PDF文件的质量和可管理性,使得它们更容易存储、分享和查看。

主要特性:

  • 优化:减小PDF文件大小而不损失质量。
  • 旋转:调整PDF页面的方向。
  • 裁剪:去除文档中不必要的边距或内容。
  • 调整大小:将页面调整为特定尺寸(例如,A4,Letter)。

优化PDF文档

以下步骤演示如何优化PDF文档,通过减小文件大小而保持质量。

  1. 创建Optimizer类的实例。
  2. 创建OptimizeOptions对象以配置优化设置。
  3. 添加输入PDF文件,并设置优化后文件的输出位置。
  4. 运行Process方法以执行优化。
1  
2var optimizer = new Optimizer();  
3var optimizeOptions = new OptimizeOptions();  
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));  
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));  
6optimizer.Process(optimizeOptions);  

调整PDF文档大小

要调整PDF文档的大小,使用ResizeOptions类来指定文档的新页面大小。

  1. 实例化Optimizer类。
  2. 创建ResizeOptions对象以定义页面大小。
  3. 添加输入文件并设置所需的输出位置。
  4. 使用SetPageSize方法指定新大小(例如,A4)。
  5. 调用Process方法以应用更改。
1  
2var optimizer = new Optimizer();  
3var resizeOptions = new ResizeOptions();  
4resizeOptions.AddInput(new FileDataSource("input.pdf"));  
5resizeOptions.SetPageSize(PageSize.A4);  
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(resizeOptions);  

旋转PDF页面

使用RotateOptions类来调整PDF文件中页面的方向。

  1. 实例化Optimizer类。
  2. 创建RotateOptions对象并配置旋转角度。
  3. 添加输入PDF文件并指定输出文件位置。
  4. 使用SetRotation方法设置旋转角度(例如,90度)。
  5. 使用Process方法执行旋转。
1  
2var optimizer = new Optimizer();  
3var rotateOptions = new RotateOptions();  
4rotateOptions.AddInput(new FileDataSource("input.pdf"));  
5rotateOptions.SetRotation(90);  
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(rotateOptions);  

裁剪PDF文档

裁剪去除PDF文档中不必要的内容或边距。可以使用CropOptions类来定义裁剪区域。

  1. 创建Optimizer类的实例。
  2. 使用CropOptions对象定义裁剪区域。
  3. 添加输入文件并指定输出文件位置。
  4. 使用SetCropBox方法定义裁剪区域。
  5. 使用Process方法执行裁剪。
1  
2var optimizer = new Optimizer();  
3var cropOptions = new CropOptions();  
4cropOptions.AddInput(new FileDataSource("input.pdf"));  
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域  
6cropOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(cropOptions);  

PDF 合并器

Documentize PDF 合并器 for .NET 是一款多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效地合并,并且在内容上保持一致。该插件处理内部资源,如字体和图像,以优化合并后的文档。

主要特性:

  • 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
  • 资源优化:合并过程中删除重复的字体和图像。
  • 批量处理:一次性合并大量的 PDF 文档。
  • 安全合并:确保文档完整性,无数据丢失或内容损坏。

如何合并 PDF 文档

要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:

  1. 创建 Merger 类的实例。
  2. 创建 MergeOptions 类的实例以配置合并过程。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 设置输出文件路径。
  5. 使用 Process 方法执行合并。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加要合并的输入 PDF 文件
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF
13merger.Process(mergeOptions);

如何合并带页码范围的 PDF

您还可以使用 MergeOptions 类合并输入 PDF 文件中的特定页码范围。这使您可以将选定的页面合并到最终输出文档中。

  1. 创建 Merger 类的实例。
  2. 使用 MergeOptions 配置页码范围。
  3. 添加带有指定页码范围的输入文件。
  4. 设置输出路径。
  5. 调用 Process 方法。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 合并输入 PDF 的特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF
12merger.Process(mergeOptions);

如何处理批量合并

PDF 合并器 插件经过优化,以处理大量 PDF 文档。通过利用批量处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。

  1. 实例化 Merger 类。
  2. 将所有输入 PDF 文件添加到 MergeOptions 类。
  3. 指定输出路径。
  4. 调用 Process 方法以合并批量中的所有文件。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDF 进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

PDF签名

Documentize PDF Signature for .NET 插件允许用户对PDF文档进行数字签名。它提供了一种简化的流程来添加签名,确保真实性,并保护PDF内容。该插件支持可见和不可见签名,并提供自定义签名位置、原因、联系信息等选项。

主要特点:

  • 数字签名PDF文档:使用可见或不可见的数字签名保护您的文档。
  • PFX支持:使用PFX证书对PDF文件进行签名。
  • 可自定义选项:配置签名设置,如原因、位置和联系信息。
  • 可见和不可见签名:选择签名是否在文档上可见。

如何签署PDF文档

要使用PFX文件签署PDF文档,请按照以下步骤操作:

  1. 创建Signature类的实例。
  2. 使用PFX文件路径和密码实例化SignOptions类。
  3. 将输入PDF和输出文件添加到选项中。
  4. 运行Process方法以应用签名。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 添加输入PDF并指定输出文件  
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 8
 9// 配置签名选项  
10signOptions.Reason = "合同协议";  
11signOptions.Contact = "johndoe@example.com";  
12signOptions.Location = "纽约";  
13signOptions.PageNumber = 1;  
14signOptions.Visible = true;  
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);  
16
17// 将签名应用于文档  
18signature.Process(signOptions);  

如何使用PFX文件流

您还可以使用作为流提供的PFX证书而不是文件路径来签名PDF。这允许更灵活地处理证书存储。

  1. 创建Signature类的实例。
  2. 用包含PFX及密码的流实例化SignOptions
  3. 添加输入和输出文件。
  4. 运行Process方法以应用签名。
 1  
 2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");  
 3var signature = new Signature();  
 4var signOptions = new SignOptions(pfxStream, "pfxPassword");  
 5
 6// 添加输入和输出文件  
 7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 9
10// 应用签名  
11signature.Process(signOptions);  

如何应用不可见签名

要添加一个不可见的签名(即保护文档而不在文档上显示签名),只需将Visible属性设置为false

  1. 创建SignOptions的实例。
  2. Visible设置为false
  3. 添加输入和输出文件。
  4. 调用Process以应用不可见签名。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 配置不可见签名  
 6signOptions.Visible = false;  
 7
 8// 添加输入和输出文件  
 9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));  
11
12// 处理签名  
13signature.Process(signOptions);  

PDF 分割器

Documentize PDF 分割器 for .NET 是一个强大的工具,简化了将大型 PDF 文档拆分为更小、更易管理文件的过程。无论您是需要提取单独的页面还是将文档划分为特定部分,这个插件都可以让您高效地实现,并且付出最少的努力。

主要特点:

  • 按页面拆分 PDF:将 PDF 文档拆分为单独的页面。
  • 批量处理:一次性拆分大量 PDF。
  • 自定义拆分选项:根据您的需求配置拆分过程。
  • 有序输出:轻松管理每个拆分页面或部分的输出文件。

如何拆分 PDF 文档

要将 PDF 文档拆分为单独的页面,请按照以下步骤操作:

  1. 创建 Splitter 类的实例。
  2. 创建 SplitOptions 的实例以配置拆分选项。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 方法为每个拆分页面添加输出文件。
  5. 运行 Process 方法以拆分文档。
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 添加输入 PDF 文件  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面指定输出文件  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12
13// 处理拆分操作  
14splitter.Process(splitOptions);  

按页面范围拆分 PDF

您还可以通过指定页面范围来拆分 PDF。这使您能够从 PDF 中提取特定部分或多个页面到单独的文档中。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 添加输入 PDF  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为页面范围定义输出(例如:页面 1-3)  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10
11// 处理拆分  
12splitter.Process(splitOptions);  

如何处理批量拆分

PDF 分割器 插件已优化以处理大量 PDF 文档。您可以利用批量处理将数百个 PDF 拆分为单独的页面或部分。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 批量添加输入 PDF 文件  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 为每个文件定义输出  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12
13// 处理批量拆分  
14splitter.Process(splitOptions);  

PDF ChatGPT

Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 集成到 PDF 应用程序中。该插件允许开发者根据输入消息生成聊天响应,并将输出以 PDF 格式保存,非常适合在 PDF 文档中直接创建对话接口或分析报告。

主要特点:

  • 聊天补全:根据自定义输入使用 ChatGPT API 生成响应。
  • 系统和用户消息:提供系统上下文和用户输入,以创建动态对话。
  • PDF 输出:将生成的聊天补全保存为结构化 PDF 文件以供进一步使用。
  • 异步处理:通过异步处理聊天补全,确保应用程序的响应能力。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:

  1. 创建 PdfChatGptRequestOptions 类的实例以配置请求选项。
  2. 添加输入和输出 PDF 文件。
  3. 设置 API 密钥并指定参数,如最大令牌数和 ChatGPT 模型的查询。
  4. 运行 ProcessAsync 方法生成聊天补全。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4options.MaxTokens = 1000;  // 设置最大令牌数  
 5options.Query = "分析此文本的关键主题。";  
 6
 7// 添加输入 PDF 文件  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// 指定保存包含聊天回复的输出 PDF 的位置  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// 创建 PdfChatGpt 插件的实例  
14var plugin = new PdfChatGpt();  
15
16// 异步运行该过程  
17var result = await plugin.ProcessAsync(options);  

添加系统和用户消息

要创建更具交互性的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。

  1. 添加设置 ChatGPT 上下文的系统消息。
  2. 添加表示用户输入的用户消息以进行对话。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4
 5// 添加上下文的系统消息  
 6options.AddSystemMessage("您是一个经过训练的 AI,用于总结文本。");  
 7
 8// 添加用户消息以查询 ChatGPT 模型  
 9options.AddUserMessage("请总结附加的文档。");  
10
11// 添加输入和输出 PDF  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// 异步处理请求  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDF文本提取器

Documentize PDF文本提取器 for .NET 简化了从PDF文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,此插件都允许您高效提取文本,同时根据需求保留格式或省略格式。

关键功能:

  • 纯模式:提取文本时保留其原始格式。
  • 原始模式:提取时不保留任何格式。
  • 简单模式:提取文本时不包含特殊字符或格式。
  • 批量处理:一次从多个PDF中提取文本。

如何从PDF文档中提取文本

要从PDF文档中提取文本,请按照以下步骤操作:

  1. 创建 TextExtractor 类的实例。
  2. 创建 TextExtractorOptions 的实例以配置提取选项。
  3. 使用 AddInput 方法添加输入PDF文件。
  4. 运行 Process 方法提取文本。
  5. 使用 ResultContainer.ResultCollection 访问提取的文本。
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 处理文本提取
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// 打印提取的文本
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

从多个PDF中提取文本

该插件允许您同时从多个PDF中提取文本,确保快速和高效的处理。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加多个输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// 处理提取
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 输出提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

文本提取模式

TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。

  1. 纯模式:保留原始格式,包括空格和对齐。
  2. 原始模式:提取不带格式的文本,适用于原始数据处理。
  3. 简单模式:提取文本时不包含特殊字符或附加格式。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 设置为纯模式
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 处理和输出
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

如何处理批量处理

对于大型文档集,您可以利用批量处理,使您能够一次从多个PDF中提取文本。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加多个输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// 为每个文件定义输出
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 处理提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

PDF 时间戳添加器

Documentize PDF 时间戳添加器 for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。

主要特点:

  • 添加安全时间戳:轻松为您的 PDF 文档添加安全时间戳。
  • 可定制的时间戳服务器:使用自定义的时间戳服务器 URL 和身份验证凭据。
  • 自动化:将时间戳功能集成到您的 .NET 应用程序中,实现自动化工作流程。
  • 合规性:确保您的文档符合数字签名和时间戳的行业标准。

如何为 PDF 文档添加时间戳

要为 PDF 文档添加安全时间戳,请按照以下步骤操作:

  1. 创建 Timestamp 类的实例。
  2. 创建 AddTimestampOptions 实例,以配置时间戳处理过程。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 设置输出文件路径。
  5. 使用 Process 方法执行时间戳处理。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");  
 7
 8// 添加输入 PDF 文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出 PDF 文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

如何使用带有时间戳服务器的自定义身份验证

在连接到时间戳服务器时,您可以提供基本身份验证凭据。这使您能够对需要用户名和密码的服务器进行身份验证。

  1. 创建 Timestamp 类的实例。
  2. 创建 AddTimestampOptions 实例,包括 serverBasicAuthCredentials
  3. 添加输入文件和输出文件路径。
  4. 调用 Process 方法。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 使用身份验证配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");  
 7
 8// 添加输入 PDF 文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出 PDF 文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

处理 PFX 文件和密码

AddTimestampOptions 类允许您使用 PFX 文件进行数字签名,并提供密码。

  • PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
  • 密码保护:确保您安全管理 PFX 文件的密码。

PDF/A 转换器

Documentize PDF/A 转换器 for .NET 是一个强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 标准,提供转换和验证功能于一体的解决方案。

关键特性:

  • 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(例如 PDF/A-1a、PDF/A-2b、PDF/A-3b)以确保符合归档标准。
  • 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
  • 批量处理:同时处理多个文件进行转换或验证。
  • 高效工作流程:通过快速可靠的转换过程减少时间和精力。

如何将 PDF 转换为 PDF/A

要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤进行:

  1. 创建 PdfAConverter 类的实例。
  2. 创建 PdfAConvertOptions 实例以配置转换。
  3. 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
  4. 使用 AddInput 方法添加输入 PDF 文件。
  5. 使用 AddOutput 方法添加生成的 PDF/A 输出文件。
  6. 调用 Process 方法以执行转换。
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 添加输入 PDF 文件  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 指定输出的 PDF/A 文件  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13
14// 处理转换  
15pdfAConverter.Process(pdfAOptions);  

验证 PDF/A 合规性

您可以使用 PdfAValidateOptions 类验证现有 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7
 8// 添加待验证的 PDF 文件  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 运行验证过程  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13
14// 检查验证结果  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);  

PDF/A 转换的批量处理

该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 添加多个输入 PDF  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// 指定转换后的 PDF/A 输出文件  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15
16// 处理批量转换  
17pdfAConverter.Process(pdfAOptions);  

PDF转XLS转换器

Documentize PDF转XLS转换器 for .NET 是一款多功能且强大的工具,用于将PDF文档转换为Excel电子表格(XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态PDF数据转换为动态且可编辑的电子表格,从而简化数据处理、分析和共享。

主要特点:

  • 灵活的转换选项:将PDF文件转换为XLSX、XLS、CSV或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 可定制的输出:配置页面范围、工作表名称和输出格式。
  • 批量处理:同时处理多个PDF文件,实现高效。
  • 高级格式化:插入空白列或减少工作表数量。

如何将PDF转换为Excel

要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤进行:

  1. 创建XlsConverter类的实例。
  2. 使用PdfToXlsOptions类配置转换设置。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定输出文件路径。
  5. 执行Process方法以启动转换。
 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加输入和输出文件路径  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// 执行转换  
10converter.Process(options);  

自定义PDF转Excel转换

PdfToXlsOptions类允许您自定义转换过程。例如,要将PDF转换为XLSX文件,设置工作表名称,并启用高级格式化选项:

 1  
 2var options = new PdfToXlsOptions  
 3{  
 4    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // 指定XLSX格式  
 5    WorksheetName = "MySheet",                    // 命名工作表  
 6    InsertBlankColumnAtFirst = true               // 在开头插入一列空白  
 7};  
 8
 9// 添加输入和输出文件  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
12
13// 处理转换  
14converter.Process(options);  

批量处理PDF到XLS转换

通过批量处理,您可以一次性将多个PDF文件转换为Excel电子表格。以下是一个示例:

 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加多个输入文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 指定输出文件路径  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// 执行批量转换  
14converter.Process(options);  

处理转换结果

转换过程中,Process方法将返回一个ResultContainer对象,其中包含操作的详细信息。以下是如何检索转换后的文件路径:

1  
2var resultContainer = converter.Process(options);  
3
4// 访问输出文件路径  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine("转换后的文件路径: " + result.Data.ToString());  

支持的输出格式

PdfToXlsOptions.ExcelFormat枚举提供多种输出格式:

  • XLSX:Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM:宏启用Excel格式。
  • CSV:逗号分隔值。
  • ODS:开放文档电子表格。
  • XMLSpreadSheet2003:Excel 2003 XML格式。

PDF转DOC转换器

Documentize PDF转DOC转换器 for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。这个插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和分享。

主要特性:

  • DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
  • 保持格式:在转换过程中保留原始布局、文本和格式。
  • 批量处理:一次转换多个PDF文件。
  • 自定义转换选项:通过不同模式(如增强流模式)微调转换过程,以获得更好的布局。

如何将PDF转换为DOC/DOCX

要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:

  1. 创建DocConverter类的实例。
  2. 创建DocConversionOptions实例以配置转换过程。
  3. 使用AddInput方法添加输入的PDF文件。
  4. 使用AddOutput方法添加生成的DOC/DOCX文件的输出路径。
  5. 运行Process方法以执行转换。
 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // 输出格式为DOCX
 5    ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15docConverter.Process(options);

使用自定义选项将PDF转换为DOC

PDF转DOC转换器插件提供多种选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中如何处理PDF的布局和结构。

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // 输出格式为DOC
 5    ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15docConverter.Process(options);

批量处理PDF到DOC/DOCX转换

PDF转DOC转换器支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的一个示例:

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// 添加多个输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加生成的DOCX文件的输出路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16docConverter.Process(options);

PDF转JPEG转换器

Documentize PDF转JPEG转换器 for .NET 是一个强大的工具,简化了将PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各种平台上更加可访问。

主要特性:

  • 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
  • 页面范围:选择要转换的特定页面或范围。
  • 批量处理:一次转换多个PDF页面或整个文档。
  • 快速转换:高效快速的过程,几乎不需要额外的努力。

如何将PDF页面转换为JPEG

要将PDF文档转换为JPEG图像,请按照以下步骤操作:

  1. 创建Jpeg类的实例。
  2. 创建JpegOptions的实例以配置转换过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定JPEG图像的输出文件路径。
  5. 运行Process方法将PDF页面转换为JPEG图像。
 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 指定JPEG图像的输出目录  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// 处理PDF到JPEG的转换  
12converter.Process(options);  

自定义PDF到JPEG的转换

您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以300 dpi转换PDF的第一页:

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 设置输出分辨率为300 dpi,仅转换第一页  
 6options.OutputResolution = 300;  
 7options.PageRange = new PageRange(1);  
 8
 9// 添加输入和输出路径  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
12
13// 处理转换  
14converter.Process(options);  

PDF到JPEG转换的批量处理

PDF转JPEG转换器插件支持批量处理,允许您将PDF的多个页面转换为单独的JPEG文件。

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面设置输出路径  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));  
11
12// 处理批量转换  
13converter.Process(options);  

如何处理转换结果

Process方法返回一个ResultContainer对象,该对象包含有关转换结果的信息。您可以打印转换后JPEG文件的路径,如下所示:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// 打印JPEG图像的输出路径  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDF转PNG转换器

Documentize PDF转PNG转换器 for .NET 是一个先进的工具,允许您将PDF文档转换为高质量的PNG图像。该插件旨在通过将PDF页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并更易于共享。

关键特性:

  • 将PDF转换为PNG:快速有效地将整个PDF文档或特定页面转换为PNG图像。
  • 可自定义分辨率:设置所需的DPI(例如,300 DPI)以获得高质量的图像输出。
  • 批处理:一次转换多个PDF页面或整个文档。
  • 轻松的输出管理:为每个转换后的PNG文件指定输出目录。
  • 快速转换:快速、高效,配置所需的努力最小。

如何将PDF转换为PNG

要将PDF文档转换为PNG图像,请按照以下步骤操作:

  1. 创建Png类的实例。
  2. 创建PngOptions的实例以配置转换过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定PNG图像的输出目录。
  5. 运行Process方法将PDF页面转换为PNG图像。
 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
 7
 8// 指定PNG图像的输出目录  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// 处理PDF到PNG的转换  
12converter.Process(options);  

自定义PDF到PNG的转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以300 DPI仅转换PDF的第一页:

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 设置输出分辨率为300 DPI  
 6options.OutputResolution = 300;  
 7
 8// 仅转换第一页  
 9options.PageRange = new PageRange(1);  
10
11// 添加输入和输出路径  
12options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
14
15// 处理转换  
16converter.Process(options);  

PDF到PNG的批处理

PDF转PNG转换器插件还支持批处理,允许您将多个页面甚至整个PDF文档转换为单独的PNG文件。

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面设置输出路径  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));  
11
12// 处理批量转换  
13converter.Process(options);  

处理转换结果

处理完转换后,Process方法返回一个ResultContainer对象,包含转换结果。您可以按如下方式打印PNG图像的输出路径:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// 打印PNG图像的输出路径  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDF 转 TIFF 转换器

Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。该插件确保您的内容在各种平台上均可访问,同时保持出色的保真度和灵活性。

主要特点:

  • 将 PDF 转换为 TIFF:轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
  • 多页 TIFF:将多个 PDF 页面合并为单个多页 TIFF 文件。
  • 页面范围:转换特定页面或范围,以实现精确结果。
  • 批处理:一次性转换多个 PDF 文档或页面。
  • 快速转换:快速高效的过程,最小努力即可完成。

如何将 PDF 页面转换为 TIFF

要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:

  1. 创建 TiffConverter 类的实例。
  2. 创建 PdfToTiffOptions 的实例以配置转换过程。
  3. 使用 AddInput 方法添加输入的 PDF 文件。
  4. 使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
  5. 运行 Process 方法将 PDF 页面转换为 TIFF 图像。
 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 添加输入的 PDF 文件
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 指定 TIFF 图像的输出文件
 8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
 9
10// 处理 PDF 到 TIFF 的转换
11converter.Process(options);

自定义 PDF 到 TIFF 转换

您可以通过调整分辨率、启用多页输出或选择页面范围来自定义转换过程。以下是如何将 PDF 的第一页以 300 dpi 转换为 TIFF 文件:

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 将输出分辨率设置为 300 dpi 并仅转换第一页
 5options.OutputResolution = 300;
 6options.PageList = new List<int> { 1 };
 7
 8// 添加输入和输出路径
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 处理转换
13converter.Process(options);

多页 TIFF 创建

PDF to TIFF Converter 插件支持多页 TIFF 生成,使您能够将多个 PDF 页面合并为一个 TIFF 文件,以便高效存档或打印。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions
 3{
 4    MultiPage = true // 启用多页 TIFF 输出
 5};
 6
 7// 添加输入的 PDF 文件
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 指定多页 TIFF 的输出文件
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 处理转换
14converter.Process(options);

PDF 到 TIFF 转换的批处理

PDF to TIFF Converter 插件还支持批处理,允许您同时将多个 PDF 页面或整个文档转换为单独的 TIFF 文件。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 添加输入的 PDF 文件
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 为各个页面设置输出路径
 8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// 处理批转换
12converter.Process(options);

如何处理转换结果

Process 方法返回一个 ResultContainer 对象,其中提供了关于转换结果的详细信息。您可以打印转换后的 TIFF 文件的路径,如下所示:

1ResultContainer resultContainer = converter.Process(options);
2
3// 打印 TIFF 图像的输出路径
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6    Console.WriteLine(result.Data.ToString());
7}

HTML 转换器

Documentize HTML 转换器 for .NET 提供了强大的文档转换功能,可以在 PDF 和 HTML 格式之间转换,适合于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应各种项目需求。

主要特点

PDF 到 HTML 转换

将 PDF 文件转换为 HTML,使文档可供基于 Web 的查看或集成到首选 HTML 格式的应用程序中。

HTML 到 PDF 转换

将 HTML 内容转变为高质量的 PDF,适用于生成可打印的报告、归档 Web 内容或创建可共享的文档格式。


详细指南

将 PDF 转换为 HTML

要将 PDF 转换为 HTML:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 设置转换选项:使用 PdfToHtmlOptions 自定义输出,选择内嵌资源或外部资源。
  3. 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
  4. 执行转换:调用 Process 方法以转换文件。

示例:将 PDF 转换为带内嵌资源的 HTML

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 PDF 到 HTML 转换的选项  
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.pdf"));  
options.AddOutput(new FileDataSource("output.html"));  

// 第四步:运行转换  
converter.Process(options);  

PDF 到 HTML 转换的可用选项

  • SaveDataType

    • FileWithEmbeddedResources:生成一个包含所有内嵌资源的单一 HTML 文件。
    • FileWithExternalResources:单独保存资源,适用于大型 HTML 文件。
  • 输出自定义

    • BasePath:设置 HTML 文档中资源的基础路径。
    • IsRenderToSinglePage:可选择将所有 PDF 内容呈现在单个 HTML 页面上。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF,请按以下步骤操作:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 配置 PDF 选项:使用 HtmlToPdfOptions 定义布局和媒体设置。
  3. 指定路径:设置输入 HTML 和输出 PDF 文件路径。
  4. 执行转换:运行 Process 方法以完成转换。

示例:将 HTML 转换为 PDF

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 HTML 到 PDF 转换的选项  
var options = new HtmlToPdfOptions();  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.html"));  
options.AddOutput(new FileDataSource("output.pdf"));  

// 第四步:执行转换  
converter.Process(options);  

HTML 到 PDF 转换的其他选项

  • 媒体类型

    • HtmlMediaType.Print:适合生成适合打印的 PDF。
    • HtmlMediaType.Screen:在转换为数字查看设计的内容时使用。
  • 布局调整

    • PageLayoutOption:调整 HTML 内容在 PDF 布局中的适配方式,例如 ScaleToPageWidth 可确保内容比例适应 PDF 的宽度。
    • IsRenderToSinglePage:如果需要简洁的演示,启用在单个 PDF 页面上呈现整个 HTML 内容。

这个转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到将 PDF 文档归档转换为 Web 可访问格式。有关更高级的配置,请参考完整的 Documentize 文档。

 中文