开发者指南

PDF ChatGPT

将 ChatGPT API 集成到 .NET PDF 应用程序中

PDF 合并器

使用 C# .NET 将多个 PDF 文档合并成一个文件

PDF 签名

.NET 插件提供了添加签名的简化流程,确保真实性并保护 PDF 内容

PDF 文本提取器

.NET 插件允许您高效提取文本,同时根据需要保留格式或省略它

PDF/A 转换器

.NET 插件将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准

PDF安全性

使用C# .NET加密和解密PDF文档

PDF分割器

.NET工具,可简化将大型PDF文档拆分为较小、可管理文件的过程

PDF时间戳添加器

使用C# .NET为您的PDF文档添加安全时间戳

PDF优化器

减小文件大小,旋转页面,裁剪内容,调整文档尺寸

PDF转DOC转换器

.NET工具允许将PDF文档转换为DOC或DOCX格式

PDF转XLS转换器

.NET插件支持无缝将PDF文档转换为Excel电子表格(XLS/XLSX)

2024年10月10日

开发者指南 的子部分

PDF ChatGPT

Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。该插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,非常适合在 PDF 文档中直接创建对话界面或分析报告。

主要特点:

  • 聊天完成:使用 ChatGPT API 根据自定义输入生成响应。
  • 系统与用户消息:提供系统上下文和用户输入,以创建动态对话。
  • PDF 输出:将生成的聊天完成保存到结构化的 PDF 文件中以供进一步使用。
  • 异步处理:通过异步处理聊天完成确保应用程序的响应性。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:

  1. 创建 PdfChatGptRequestOptions 类的实例,以配置请求选项。
  2. 添加输入和输出 PDF 文件。
  3. 设置 API 密钥并指定参数,例如最大令牌数和 ChatGPT 模型的查询。
  4. 运行 ProcessAsync 方法以生成聊天完成。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4options.MaxTokens = 1000;  // 设置最大令牌数  
 5options.Query = "分析此文本的关键主题。";  
 6
 7// 添加输入 PDF 文件  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// 指定保存聊天响应的输出 PDF 文件的位置  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// 创建 PdfChatGpt 插件的实例  
14var plugin = new PdfChatGpt();  
15
16// 异步运行处理  
17var result = await plugin.ProcessAsync(options);  

添加系统和用户消息

要创建更互动的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。

  1. 添加设置 ChatGPT 上下文的系统消息。
  2. 添加代表用户输入的用户消息。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4
 5// 添加用于上下文的系统消息  
 6options.AddSystemMessage("您是一个被训练来总结文本的 AI。");  
 7
 8// 添加用户消息以查询 ChatGPT 模型  
 9options.AddUserMessage("请总结附加的文档。");  
10
11// 添加输入和输出 PDF  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// 异步处理请求  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDF 合并器

Documentize PDF 合并器 for .NET 是一个多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效合并并保持内容一致性。该插件处理内部资源,如字体和图像,以优化合并后的文档。

主要特性:

  • 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
  • 资源优化:在合并期间去除重复的字体和图像。
  • 批量处理:一次性合并大量 PDF 文档。
  • 安全合并:确保文档完整性,不会丢失数据或内容损坏。

如何合并 PDF 文档

要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:

  1. 创建 Merger 类的实例。
  2. 创建 MergeOptions 的实例以配置合并过程。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 设置输出文件路径。
  5. 使用 Process 方法执行合并。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加待合并的输入 PDF 文件
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF 文件
13merger.Process(mergeOptions);

如何合并带有页面范围的 PDF

您还可以使用 MergeOptions 类合并输入 PDF 文件的特定页面范围。这允许您将选定页面合并到最终输出文档中。

  1. 创建 Merger 类的实例。
  2. 使用 MergeOptions 配置页面范围。
  3. 添加带有指定页面范围的输入文件。
  4. 设置输出路径。
  5. 调用 Process 方法。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 从输入 PDF 中合并特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF 文件
12merger.Process(mergeOptions);

如何处理批量合并

PDF 合并器 插件经过优化,可处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,从而确保高效快速的文档管理。

  1. 实例化 Merger 类。
  2. 将所有输入 PDF 文件添加到 MergeOptions 类。
  3. 指定输出路径。
  4. 调用 Process 方法以合并批次中的所有文件。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDF 文件进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

PDF 签名

Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名的简化流程,确保真实性并保护 PDF 内容。该插件支持可见和不可见的签名,并提供定制签名位置、原因、联系信息等选项。

主要特性:

  • 数字签名 PDF 文档:用可见或不可见的数字签名保护您的文档。
  • PFX 支持:使用 PFX 证书对 PDF 文件进行签名。
  • 可定制选项:配置签名设置,如原因、位置和联系信息。
  • 可见和不可见签名:选择签名是否在文档上可见。

如何签署 PDF 文档

要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:

  1. 创建 Signature 类的实例。
  2. 用 PFX 文件路径和密码实例化 SignOptions 类。
  3. 将输入 PDF 和输出文件添加到选项中。
  4. 运行 Process 方法应用签名。
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// 添加输入 PDF 并指定输出文件
 5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 7
 8// 配置签名选项
 9signOptions.Reason = "合同协议";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "纽约";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 将签名应用到文档
17signature.Process(signOptions);

如何使用流处理 PFX 文件

您还可以使用作为流提供的 PFX 证书来签署 PDF,而不是文件路径。这使证书存储的处理更加灵活。

  1. 创建 Signature 类的实例。
  2. 使用包含 PFX 和密码的流实例化 SignOptions
  3. 添加输入和输出文件。
  4. 运行 Process 方法应用签名。
 1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
 2var signature = new Signature();
 3var signOptions = new SignOptions(pfxStream, "pfxPassword");
 4
 5// 添加输入和输出文件
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 8
 9// 应用签名
10signature.Process(signOptions);

如何应用不可见签名

要添加不可见签名(在文档上不显示签名以保护文档),只需将 Visible 属性设置为 false

  1. 创建 SignOptions 的实例。
  2. Visible 设置为 false
  3. 添加输入和输出文件。
  4. 调用 Process 应用不可见签名。
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// 配置不可见签名
 5signOptions.Visible = false;
 6
 7// 添加输入和输出文件
 8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 处理签名
12signature.Process(signOptions);

PDF 文本提取器

Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,这个插件都允许您高效地提取文本,同时根据需要保留格式或省略它。

主要特点:

  • 纯模式:提取文本同时保留其原始格式。
  • 原始模式:提取没有任何格式的文本。
  • 简单模式:提取没有特殊字符或格式的文本。
  • 批处理:一次从多个 PDF 提取文本。

如何从 PDF 文档中提取文本

要从 PDF 文档中提取文本,请按照以下步骤操作:

  1. 创建 TextExtractor 类的实例。
  2. 创建 TextExtractorOptions 的实例以配置提取选项。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 运行 Process 方法以提取文本。
  5. 使用 ResultContainer.ResultCollection 访问提取的文本。
 1  
 2using var extractor = new TextExtractor();  
 3var textExtractorOptions = new TextExtractorOptions();  
 4
 5// 添加输入 PDF  
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 处理文本提取  
 9var resultContainer = extractor.Process(textExtractorOptions);  
10
11// 输出提取的文本  
12var extractedText = resultContainer.ResultCollection[0];  
13Console.WriteLine(extractedText);  

从多个 PDF 提取文本

该插件允许您同时从多个 PDF 提取文本,确保快速和高效的处理。

 1  
 2using var extractor = new TextExtractor();  
 3var textExtractorOptions = new TextExtractorOptions();  
 4
 5// 添加多个输入 PDF  
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));  
 7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));  
 8
 9// 处理提取  
10var resultContainer = extractor.Process(textExtractorOptions);  
11
12// 输出提取的文本  
13foreach (var result in resultContainer.ResultCollection)  
14{  
15    Console.WriteLine(result);  
16}  

文本提取模式

TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。

  1. 纯模式:保留原始格式,包括空格和对齐。
  2. 原始模式:提取没有格式的文本,适合原始数据处理。
  3. 简单模式:提取没有特殊字符或附加格式的文本。
 1  
 2var textExtractorOptions = new TextExtractorOptions();  
 3
 4// 设置为纯模式  
 5textExtractorOptions.Mode = ExtractionMode.Pure;  
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 处理并输出  
 9var resultContainer = extractor.Process(textExtractorOptions);  
10Console.WriteLine(resultContainer.ResultCollection[0]);  

如何处理批处理

对于大型文档集,您可以利用批处理,允许您一次从多个 PDF 提取文本。

 1  
 2using var extractor = new TextExtractor();  
 3var textExtractorOptions = new TextExtractorOptions();  
 4
 5// 添加多个输入 PDF  
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));  
 7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));  
 8
 9// 为每个文件定义输出  
10var resultContainer = extractor.Process(textExtractorOptions);  
11
12// 处理提取的文本  
13foreach (var result in resultContainer.ResultCollection)  
14{  
15    Console.WriteLine(result);  
16}  

PDF/A 转换器

Documentize PDF/A 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档的 PDF/A 合规性,提供转换和验证功能于一体的解决方案。

主要特性:

  • 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a、PDF/A-2b、PDF/A-3b),确保符合归档标准。
  • 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,如果不合规则识别问题。
  • 批量处理:同时处理多个文件以进行转换或验证。
  • 高效工作流程:通过快速和可靠的转换流程最小化时间和精力的浪费。

如何将 PDF 转换为 PDF/A

要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤操作:

  1. 创建 PdfAConverter 类的实例。
  2. 创建 PdfAConvertOptions 类的实例以配置转换。
  3. 指定所需的 PDF/A 版本(例如 PDF/A-3B)。
  4. 使用 AddInput 方法添加输入 PDF 文件。
  5. 使用 AddOutput 方法添加输出文件以生成 PDF/A。
  6. 调用 Process 方法以执行转换。
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7  
 8// 添加输入 PDF 文件  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10  
11// 指定输出 PDF/A 文件  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13  
14// 处理转换  
15pdfAConverter.Process(pdfAOptions);  

验证 PDF/A 合规性

您可以使用 PdfAValidateOptions 类验证现有 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7  
 8// 添加要验证的 PDF 文件  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10  
11// 运行验证过程  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13  
14// 检查验证结果  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);  

PDF/A 转换的批量处理

该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7  
 8// 添加多个输入 PDF  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11  
12// 指定输出文件以获得转换后的 PDF/A  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15  
16// 处理批量转换  
17pdfAConverter.Process(pdfAOptions);  

PDF安全性

Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强你的PDF文档的安全性。它确保你的敏感信息保持机密,并受到未授权访问的保护。

主要特点:

  • 加密PDF文档:通过添加用户和所有者密码来保护你的PDF文件。
  • 解密PDF文档:在需要时移除PDF的加密。
  • 设置权限:控制打印、复制和修改内容等权限。
  • 自动化:将加密和解密集成到你的.NET应用程序中,实现自动化工作流程。
  • 合规性:确保你的文档符合行业安全标准。

如何加密PDF文档

要加密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 使用所需的用户和所有者密码创建EncryptionOptions的实例。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行加密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置加密选项
 5var opt = new EncryptionOptions("用户密码", "所有者密码");
 6
 7// 添加输入PDF文件
 8opt.AddInput(new FileDataSource("pdf文件路径"));
 9
10// 指定输出加密PDF文件
11opt.AddOutput(new FileDataSource("加密pdf文件路径"));
12
13// 执行加密过程
14plugin.Process(opt);

如何解密PDF文档

要解密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 使用必要的密码创建DecryptionOptions的实例。
  3. 使用AddInput方法添加加密PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行解密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置解密选项
 5var opt = new DecryptionOptions("用户密码");
 6
 7// 添加输入加密PDF文件
 8opt.AddInput(new FileDataSource("加密pdf文件路径"));
 9
10// 指定输出解密PDF文件
11opt.AddOutput(new FileDataSource("解密pdf文件路径"));
12
13// 执行解密过程
14plugin.Process(opt);

设置PDF文档的权限

在加密PDF时,可以设置各种权限来控制文档的使用方式。

  • 打印:允许或禁止打印文档。
  • 复制:允许或禁止复制内容。
  • 修改:允许或禁止对文档进行修改。

要设置权限,可以相应地配置EncryptionOptions

PDF分割器

Documentize PDF分割器 for .NET 是一款强大的工具,简化了将大型PDF文档拆分为较小、可管理文件的过程。无论您需要提取单独的页面还是将文档分为特定部分,这个插件都能让您高效地实现,且付出最小的努力。

主要特点:

  • 按页面拆分PDF:将PDF文档分解成单独的页面。
  • 批量处理:一次性拆分大量PDF。
  • 自定义拆分选项:根据您的要求配置拆分过程。
  • 有序输出:轻松管理每个拆分页面或部分的输出文件。

如何拆分PDF文档

要将PDF文档拆分为单独的页面,请按照以下步骤操作:

  1. 创建Splitter类的实例。
  2. 创建SplitOptions的实例以配置拆分选项。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法为每个拆分页面添加输出文件。
  5. 运行Process方法以拆分文档。
 1var splitter = new Splitter();
 2var splitOptions = new SplitOptions();
 3
 4// 添加输入PDF文件
 5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 为每个页面指定输出文件
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
11
12// 处理拆分操作
13splitter.Process(splitOptions);

按页面范围拆分PDF

您还可以通过指定页面范围来拆分PDF。这允许您将特定部分或多个页面从PDF提取到单独的文档中。

 1var splitter = new Splitter();
 2var splitOptions = new SplitOptions();
 3
 4// 添加输入PDF
 5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 定义页面范围的输出(例如,第1-3页)
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
 9
10// 处理拆分
11splitter.Process(splitOptions);

如何处理批量拆分

PDF分割器 插件经过优化,可处理大量PDF文档。您可以利用批量处理将数百个PDF拆分为单独的页面或部分。

 1var splitter = new Splitter();
 2var splitOptions = new SplitOptions();
 3
 4// 批量添加输入PDF文件
 5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 为每个文件定义输出
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);

PDF时间戳添加器

Documentize PDF时间戳添加器 for .NET 是一款强大的工具,旨在为您的PDF文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。

关键特性:

  • 添加安全时间戳:轻松为您的PDF文档添加安全时间戳。
  • 可自定义的时间戳服务器:使用自定义的时间戳服务器URL和身份验证凭据。
  • 自动化:将时间戳集成到您的.NET应用程序中,以实现自动化工作流。
  • 合规性:确保您的文档符合数字签名和时间戳的行业标准。

如何为PDF文档添加时间戳

要为PDF文档添加安全时间戳,请按照以下步骤操作:

  1. 创建Timestamp类的实例。
  2. 创建AddTimestampOptions的实例以配置时间戳过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行时间戳处理。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");  
 7
 8// 添加输入PDF文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出PDF文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

如何使用自定义身份验证与时间戳服务器

在连接到时间戳服务器时,您可以提供基本身份验证凭据。这允许您对需要用户名和密码的服务器进行身份验证。

  1. 创建Timestamp类的实例。
  2. 创建AddTimestampOptions的实例,包括serverBasicAuthCredentials
  3. 添加输入文件和输出文件路径。
  4. 调用Process方法。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 使用身份验证配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");  
 7
 8// 添加输入PDF文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出PDF文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

处理PFX文件和密码

AddTimestampOptions类允许您使用PFX文件进行数字签名以及密码。

  • PFX流或文件路径:您可以提供PFX文件的流或文件路径。
  • 密码保护:确保安全管理PFX文件的密码。

PDF优化器

Documentize PDF优化器是一个综合插件,通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小,旋转页面,裁剪内容和调整文档尺寸。这些操作提高了PDF文件的质量和可管理性,使其更易于存储、共享和查看。

主要特性:

  • 优化:在不降低质量的前提下减小PDF文件大小。
  • 旋转:调整PDF页面的朝向。
  • 裁剪:去除文档中不必要的边距或内容。
  • 调整尺寸:将页面调整为特定尺寸(例如,A4,信纸)。

优化PDF文档

以下步骤演示如何通过减小文件大小来优化PDF文档,同时保持质量。

  1. 创建Optimizer类的实例。
  2. 创建一个OptimizeOptions对象,以配置优化设置。
  3. 添加输入PDF文件并设置优化后文件的输出位置。
  4. 运行Process方法以执行优化。
1var optimizer = new Optimizer();
2var optimizeOptions = new OptimizeOptions();
3optimizeOptions.AddInput(new FileDataSource("input.pdf"));
4optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
5optimizer.Process(optimizeOptions);

调整PDF文档尺寸

要调整PDF文档的尺寸,可以使用ResizeOptions类来指定文档的新页面大小。

  1. 实例化Optimizer类。
  2. 创建一个ResizeOptions对象来定义页面大小。
  3. 添加输入文件并设置所需的输出位置。
  4. 使用SetPageSize方法指定新大小(例如,A4)。
  5. 调用Process方法以应用更改。
1var optimizer = new Optimizer();
2var resizeOptions = new ResizeOptions();
3resizeOptions.AddInput(new FileDataSource("input.pdf"));
4resizeOptions.SetPageSize(PageSize.A4);
5resizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(resizeOptions);

旋转PDF页面

使用RotateOptions类来调整PDF文件中页面的朝向。

  1. 实例化Optimizer类。
  2. 创建一个RotateOptions对象并设置旋转角度。
  3. 添加输入PDF文件并指定输出文件位置。
  4. 使用SetRotation方法设置旋转角度(例如,90度)。
  5. 使用Process方法执行旋转。
1var optimizer = new Optimizer();
2var rotateOptions = new RotateOptions();
3rotateOptions.AddInput(new FileDataSource("input.pdf"));
4rotateOptions.SetRotation(90);
5rotateOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(rotateOptions);

裁剪PDF文档

裁剪可以去除PDF文档中不需要的内容或边距。CropOptions类可以用来定义裁剪区域。

  1. 创建Optimizer类的实例。
  2. 使用CropOptions对象定义裁剪区域。
  3. 添加输入文件并指定输出文件位置。
  4. 使用SetCropBox方法定义裁剪区域。
  5. 使用Process方法执行裁剪。
1var optimizer = new Optimizer();
2var cropOptions = new CropOptions();
3cropOptions.AddInput(new FileDataSource("input.pdf"));
4cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域
5cropOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(cropOptions);

PDF转DOC转换器

Documentize PDF转DOC转换器 for .NET 是一款强大的工具,旨在将PDF文档转换为DOC或DOCX格式。此插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和共享。

主要特性:

  • DOC/DOCX转换: 将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
  • 保持格式: 在转换过程中保留原始布局、文本和格式。
  • 批处理: 一次转换多个PDF文件。
  • 自定义转换选项: 通过不同模式(如增强流)微调转换过程,以获得更好的布局。

如何将PDF转换为DOC/DOCX

要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:

  1. 创建PdfDoc类的实例。
  2. 创建PdfToDocOptions的实例以配置转换过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法添加结果DOC/DOCX文件的输出路径。
  5. 运行Process方法以执行转换。
 1var pdfToWord = new PdfDoc();
 2var options = new PdfToDocOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // 输出格式为DOCX
 5    ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
 6};
 7
 8// 添加输入的PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15pdfToWord.Process(options);

使用自定义选项转换PDF为DOC

PDF转DOC转换器 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中PDF的布局和结构如何处理。

 1var pdfToWord = new PdfDoc();
 2var options = new PdfToDocOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // 输出格式为DOC
 5    ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
 6};
 7
 8// 添加输入的PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15pdfToWord.Process(options);

PDF到DOC/DOCX的批处理转换

PDF转DOC转换器 支持批处理,允许您一次转换多个PDF文件。下面是批量转换的示例:

 1var pdfToWord = new PdfDoc();
 2var options = new PdfToDocOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// 添加多个输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加结果DOCX文件的输出文件路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16pdfToWord.Process(options);

PDF转XLS转换器

Documentize PDF转XLS转换器 for .NET 是一个强大的工具,能够无缝地将PDF文档转换为Excel电子表格(XLS/XLSX)。此插件增强了PDF内容的可访问性和可用性,使数据以电子表格格式更易于操作和分析。

主要特点:

  • 将PDF转换为Excel:将PDF文件转换为XLS/XLSX电子表格,以便于数据管理。
  • 自定义输出选项:配置输出格式、页面范围、工作表名称等。
  • 高保真转换:在转换过程中保留布局、格式和内容的准确性。
  • 批处理:一次转换多个PDF文件,以便进行大规模操作。

如何将PDF转换为XLS

要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤操作:

  1. 创建PdfXls类的实例。
  2. 创建PdfToXlsOptions的实例,以配置转换设置。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定输出Excel文件。
  5. 运行Process方法以启动转换。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加输入和输出文件路径
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 运行转换过程
9pdfXlsConverter.Process(options);

自定义PDF到Excel转换

您可以通过修改PdfToXlsOptions类来自定义转换设置。例如,要将PDF转换为XLSX格式,插入一个空列并命名工作表,可以使用以下代码:

 1var options = new PdfToXlsOptions();
 2
 3// 将输出格式设置为XLSX
 4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
 5
 6// 在第一个位置插入一个空列
 7options.InsertBlankColumnAtFirst = true;
 8
 9// 设置工作表名称
10options.WorksheetName = "MySheet";
11
12// 添加输入和输出文件
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 处理转换
17pdfXlsConverter.Process(options);

处理转换结果

处理完成后,Process方法返回一个ResultContainer对象,该对象保存转换结果。您可以获取转换后的文件路径或其他输出详情:

1var resultContainer = pdfXlsConverter.Process(options);
2
3// 访问并打印结果文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);

PDF到XLS转换的批处理

PDF到XLS转换器插件还支持批处理,允许一次转换多个PDF文件。

 1var pdfXlsConverter = new PdfXls();
 2var options = new PdfToXlsOptions();
 3
 4// 添加多个输入PDF
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 添加输出Excel文件
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// 处理批量转换
13pdfXlsConverter.Process(options);
 中文