开发者指南 的子部分
PDF ChatGPT
Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。该插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,非常适合在 PDF 文档中直接创建对话界面或分析报告。
主要特点:
- 聊天完成:使用 ChatGPT API 根据自定义输入生成响应。
- 系统与用户消息:提供系统上下文和用户输入,以创建动态对话。
- PDF 输出:将生成的聊天完成保存到结构化的 PDF 文件中以供进一步使用。
- 异步处理:通过异步处理聊天完成确保应用程序的响应性。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:
- 创建
PdfChatGptRequestOptions
类的实例,以配置请求选项。 - 添加输入和输出 PDF 文件。
- 设置 API 密钥并指定参数,例如最大令牌数和 ChatGPT 模型的查询。
- 运行
ProcessAsync
方法以生成聊天完成。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4options.MaxTokens = 1000; // 设置最大令牌数
5options.Query = "分析此文本的关键主题。";
6
7// 添加输入 PDF 文件
8options.AddInput(new FileDataSource("input.pdf"));
9
10// 指定保存聊天响应的输出 PDF 文件的位置
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// 创建 PdfChatGpt 插件的实例
14var plugin = new PdfChatGpt();
15
16// 异步运行处理
17var result = await plugin.ProcessAsync(options);
添加系统和用户消息
要创建更互动的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。
- 添加设置 ChatGPT 上下文的系统消息。
- 添加代表用户输入的用户消息。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4
5// 添加用于上下文的系统消息
6options.AddSystemMessage("您是一个被训练来总结文本的 AI。");
7
8// 添加用户消息以查询 ChatGPT 模型
9options.AddUserMessage("请总结附加的文档。");
10
11// 添加输入和输出 PDF
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// 异步处理请求
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
PDF 合并器
Documentize PDF 合并器 for .NET 是一个多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效合并并保持内容一致性。该插件处理内部资源,如字体和图像,以优化合并后的文档。
主要特性:
- 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
- 资源优化:在合并期间去除重复的字体和图像。
- 批量处理:一次性合并大量 PDF 文档。
- 安全合并:确保文档完整性,不会丢失数据或内容损坏。
如何合并 PDF 文档
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建
Merger
类的实例。 - 创建
MergeOptions
的实例以配置合并过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行合并。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加待合并的输入 PDF 文件
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF 文件
13merger.Process(mergeOptions);
如何合并带有页面范围的 PDF
您还可以使用 MergeOptions
类合并输入 PDF 文件的特定页面范围。这允许您将选定页面合并到最终输出文档中。
- 创建
Merger
类的实例。 - 使用
MergeOptions
配置页面范围。 - 添加带有指定页面范围的输入文件。
- 设置输出路径。
- 调用
Process
方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 从输入 PDF 中合并特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF 文件
12merger.Process(mergeOptions);
如何处理批量合并
PDF 合并器 插件经过优化,可处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,从而确保高效快速的文档管理。
- 实例化
Merger
类。 - 将所有输入 PDF 文件添加到
MergeOptions
类。 - 指定输出路径。
- 调用
Process
方法以合并批次中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDF 文件进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);
PDF 签名
Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名的简化流程,确保真实性并保护 PDF 内容。该插件支持可见和不可见的签名,并提供定制签名位置、原因、联系信息等选项。
主要特性:
- 数字签名 PDF 文档:用可见或不可见的数字签名保护您的文档。
- PFX 支持:使用 PFX 证书对 PDF 文件进行签名。
- 可定制选项:配置签名设置,如原因、位置和联系信息。
- 可见和不可见签名:选择签名是否在文档上可见。
如何签署 PDF 文档
要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:
- 创建
Signature
类的实例。 - 用 PFX 文件路径和密码实例化
SignOptions
类。 - 将输入 PDF 和输出文件添加到选项中。
- 运行
Process
方法应用签名。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 添加输入 PDF 并指定输出文件
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// 配置签名选项
9signOptions.Reason = "合同协议";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "纽约";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 将签名应用到文档
17signature.Process(signOptions);
如何使用流处理 PFX 文件
您还可以使用作为流提供的 PFX 证书来签署 PDF,而不是文件路径。这使证书存储的处理更加灵活。
- 创建
Signature
类的实例。 - 使用包含 PFX 和密码的流实例化
SignOptions
。 - 添加输入和输出文件。
- 运行
Process
方法应用签名。
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// 添加输入和输出文件
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 应用签名
10signature.Process(signOptions);
如何应用不可见签名
要添加不可见签名(在文档上不显示签名以保护文档),只需将 Visible
属性设置为 false
。
- 创建
SignOptions
的实例。 - 将
Visible
设置为 false
。 - 添加输入和输出文件。
- 调用
Process
应用不可见签名。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 配置不可见签名
5signOptions.Visible = false;
6
7// 添加输入和输出文件
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 处理签名
12signature.Process(signOptions);
PDF 文本提取器
Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,这个插件都允许您高效地提取文本,同时根据需要保留格式或省略它。
主要特点:
- 纯模式:提取文本同时保留其原始格式。
- 原始模式:提取没有任何格式的文本。
- 简单模式:提取没有特殊字符或格式的文本。
- 批处理:一次从多个 PDF 提取文本。
如何从 PDF 文档中提取文本
要从 PDF 文档中提取文本,请按照以下步骤操作:
- 创建
TextExtractor
类的实例。 - 创建
TextExtractorOptions
的实例以配置提取选项。 - 使用
AddInput
方法添加输入 PDF 文件。 - 运行
Process
方法以提取文本。 - 使用
ResultContainer.ResultCollection
访问提取的文本。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 处理文本提取
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 输出提取的文本
12var extractedText = resultContainer.ResultCollection[0];
13Console.WriteLine(extractedText);
从多个 PDF 提取文本
该插件允许您同时从多个 PDF 提取文本,确保快速和高效的处理。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加多个输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
8
9// 处理提取
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 输出提取的文本
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
文本提取模式
TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取没有格式的文本,适合原始数据处理。
- 简单模式:提取没有特殊字符或附加格式的文本。
1
2var textExtractorOptions = new TextExtractorOptions();
3
4// 设置为纯模式
5textExtractorOptions.Mode = ExtractionMode.Pure;
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 处理并输出
9var resultContainer = extractor.Process(textExtractorOptions);
10Console.WriteLine(resultContainer.ResultCollection[0]);
如何处理批处理
对于大型文档集,您可以利用批处理,允许您一次从多个 PDF 提取文本。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加多个输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
8
9// 为每个文件定义输出
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 处理提取的文本
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
PDF/A 转换器
Documentize PDF/A 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档的 PDF/A 合规性,提供转换和验证功能于一体的解决方案。
主要特性:
- 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a、PDF/A-2b、PDF/A-3b),确保符合归档标准。
- 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,如果不合规则识别问题。
- 批量处理:同时处理多个文件以进行转换或验证。
- 高效工作流程:通过快速和可靠的转换流程最小化时间和精力的浪费。
如何将 PDF 转换为 PDF/A
要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤操作:
- 创建
PdfAConverter
类的实例。 - 创建
PdfAConvertOptions
类的实例以配置转换。 - 指定所需的 PDF/A 版本(例如 PDF/A-3B)。
- 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加输出文件以生成 PDF/A。 - 调用
Process
方法以执行转换。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加输入 PDF 文件
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 指定输出 PDF/A 文件
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// 处理转换
15pdfAConverter.Process(pdfAOptions);
验证 PDF/A 合规性
您可以使用 PdfAValidateOptions
类验证现有 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// 添加要验证的 PDF 文件
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 运行验证过程
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// 检查验证结果
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);
PDF/A 转换的批量处理
该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加多个输入 PDF
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 指定输出文件以获得转换后的 PDF/A
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// 处理批量转换
17pdfAConverter.Process(pdfAOptions);
PDF安全性
Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强你的PDF文档的安全性。它确保你的敏感信息保持机密,并受到未授权访问的保护。
主要特点:
- 加密PDF文档:通过添加用户和所有者密码来保护你的PDF文件。
- 解密PDF文档:在需要时移除PDF的加密。
- 设置权限:控制打印、复制和修改内容等权限。
- 自动化:将加密和解密集成到你的.NET应用程序中,实现自动化工作流程。
- 合规性:确保你的文档符合行业安全标准。
如何加密PDF文档
要加密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 使用所需的用户和所有者密码创建
EncryptionOptions
的实例。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行加密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置加密选项
5var opt = new EncryptionOptions("用户密码", "所有者密码");
6
7// 添加输入PDF文件
8opt.AddInput(new FileDataSource("pdf文件路径"));
9
10// 指定输出加密PDF文件
11opt.AddOutput(new FileDataSource("加密pdf文件路径"));
12
13// 执行加密过程
14plugin.Process(opt);
如何解密PDF文档
要解密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 使用必要的密码创建
DecryptionOptions
的实例。 - 使用
AddInput
方法添加加密PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行解密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置解密选项
5var opt = new DecryptionOptions("用户密码");
6
7// 添加输入加密PDF文件
8opt.AddInput(new FileDataSource("加密pdf文件路径"));
9
10// 指定输出解密PDF文件
11opt.AddOutput(new FileDataSource("解密pdf文件路径"));
12
13// 执行解密过程
14plugin.Process(opt);
设置PDF文档的权限
在加密PDF时,可以设置各种权限来控制文档的使用方式。
- 打印:允许或禁止打印文档。
- 复制:允许或禁止复制内容。
- 修改:允许或禁止对文档进行修改。
要设置权限,可以相应地配置EncryptionOptions
。
PDF分割器
Documentize PDF分割器 for .NET 是一款强大的工具,简化了将大型PDF文档拆分为较小、可管理文件的过程。无论您需要提取单独的页面还是将文档分为特定部分,这个插件都能让您高效地实现,且付出最小的努力。
主要特点:
- 按页面拆分PDF:将PDF文档分解成单独的页面。
- 批量处理:一次性拆分大量PDF。
- 自定义拆分选项:根据您的要求配置拆分过程。
- 有序输出:轻松管理每个拆分页面或部分的输出文件。
如何拆分PDF文档
要将PDF文档拆分为单独的页面,请按照以下步骤操作:
- 创建
Splitter
类的实例。 - 创建
SplitOptions
的实例以配置拆分选项。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法为每个拆分页面添加输出文件。 - 运行
Process
方法以拆分文档。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 为每个页面指定输出文件
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
11
12// 处理拆分操作
13splitter.Process(splitOptions);
按页面范围拆分PDF
您还可以通过指定页面范围来拆分PDF。这允许您将特定部分或多个页面从PDF提取到单独的文档中。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 定义页面范围的输出(例如,第1-3页)
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
9
10// 处理拆分
11splitter.Process(splitOptions);
如何处理批量拆分
PDF分割器 插件经过优化,可处理大量PDF文档。您可以利用批量处理将数百个PDF拆分为单独的页面或部分。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 批量添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 为每个文件定义输出
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);
PDF时间戳添加器
Documentize PDF时间戳添加器 for .NET 是一款强大的工具,旨在为您的PDF文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。
关键特性:
- 添加安全时间戳:轻松为您的PDF文档添加安全时间戳。
- 可自定义的时间戳服务器:使用自定义的时间戳服务器URL和身份验证凭据。
- 自动化:将时间戳集成到您的.NET应用程序中,以实现自动化工作流。
- 合规性:确保您的文档符合数字签名和时间戳的行业标准。
如何为PDF文档添加时间戳
要为PDF文档添加安全时间戳,请按照以下步骤操作:
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
的实例以配置时间戳过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行时间戳处理。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
7
8// 添加输入PDF文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出PDF文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
如何使用自定义身份验证与时间戳服务器
在连接到时间戳服务器时,您可以提供基本身份验证凭据。这允许您对需要用户名和密码的服务器进行身份验证。
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
的实例,包括serverBasicAuthCredentials
。 - 添加输入文件和输出文件路径。
- 调用
Process
方法。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 使用身份验证配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
7
8// 添加输入PDF文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出PDF文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
处理PFX文件和密码
AddTimestampOptions
类允许您使用PFX文件进行数字签名以及密码。
- PFX流或文件路径:您可以提供PFX文件的流或文件路径。
- 密码保护:确保安全管理PFX文件的密码。
PDF优化器
Documentize PDF优化器是一个综合插件,通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小,旋转页面,裁剪内容和调整文档尺寸。这些操作提高了PDF文件的质量和可管理性,使其更易于存储、共享和查看。
主要特性:
- 优化:在不降低质量的前提下减小PDF文件大小。
- 旋转:调整PDF页面的朝向。
- 裁剪:去除文档中不必要的边距或内容。
- 调整尺寸:将页面调整为特定尺寸(例如,A4,信纸)。
优化PDF文档
以下步骤演示如何通过减小文件大小来优化PDF文档,同时保持质量。
- 创建Optimizer类的实例。
- 创建一个OptimizeOptions对象,以配置优化设置。
- 添加输入PDF文件并设置优化后文件的输出位置。
- 运行Process方法以执行优化。
1var optimizer = new Optimizer();
2var optimizeOptions = new OptimizeOptions();
3optimizeOptions.AddInput(new FileDataSource("input.pdf"));
4optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
5optimizer.Process(optimizeOptions);
调整PDF文档尺寸
要调整PDF文档的尺寸,可以使用ResizeOptions类来指定文档的新页面大小。
- 实例化Optimizer类。
- 创建一个ResizeOptions对象来定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用SetPageSize方法指定新大小(例如,A4)。
- 调用Process方法以应用更改。
1var optimizer = new Optimizer();
2var resizeOptions = new ResizeOptions();
3resizeOptions.AddInput(new FileDataSource("input.pdf"));
4resizeOptions.SetPageSize(PageSize.A4);
5resizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(resizeOptions);
旋转PDF页面
使用RotateOptions类来调整PDF文件中页面的朝向。
- 实例化Optimizer类。
- 创建一个RotateOptions对象并设置旋转角度。
- 添加输入PDF文件并指定输出文件位置。
- 使用SetRotation方法设置旋转角度(例如,90度)。
- 使用Process方法执行旋转。
1var optimizer = new Optimizer();
2var rotateOptions = new RotateOptions();
3rotateOptions.AddInput(new FileDataSource("input.pdf"));
4rotateOptions.SetRotation(90);
5rotateOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(rotateOptions);
裁剪PDF文档
裁剪可以去除PDF文档中不需要的内容或边距。CropOptions类可以用来定义裁剪区域。
- 创建Optimizer类的实例。
- 使用CropOptions对象定义裁剪区域。
- 添加输入文件并指定输出文件位置。
- 使用SetCropBox方法定义裁剪区域。
- 使用Process方法执行裁剪。
1var optimizer = new Optimizer();
2var cropOptions = new CropOptions();
3cropOptions.AddInput(new FileDataSource("input.pdf"));
4cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域
5cropOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(cropOptions);
PDF转DOC转换器
Documentize PDF转DOC转换器 for .NET 是一款强大的工具,旨在将PDF文档转换为DOC或DOCX格式。此插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和共享。
主要特性:
- DOC/DOCX转换: 将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
- 保持格式: 在转换过程中保留原始布局、文本和格式。
- 批处理: 一次转换多个PDF文件。
- 自定义转换选项: 通过不同模式(如增强流)微调转换过程,以获得更好的布局。
如何将PDF转换为DOC/DOCX
要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:
- 创建
PdfDoc
类的实例。 - 创建
PdfToDocOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法添加结果DOC/DOCX文件的输出路径。 - 运行
Process
方法以执行转换。
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.DocX, // 输出格式为DOCX
5 ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
6};
7
8// 添加输入的PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15pdfToWord.Process(options);
使用自定义选项转换PDF为DOC
PDF转DOC转换器 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中PDF的布局和结构如何处理。
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.Doc, // 输出格式为DOC
5 ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
6};
7
8// 添加输入的PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15pdfToWord.Process(options);
PDF到DOC/DOCX的批处理转换
PDF转DOC转换器 支持批处理,允许您一次转换多个PDF文件。下面是批量转换的示例:
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// 添加多个输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加结果DOCX文件的输出文件路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16pdfToWord.Process(options);
PDF转XLS转换器
Documentize PDF转XLS转换器 for .NET 是一个强大的工具,能够无缝地将PDF文档转换为Excel电子表格(XLS/XLSX)。此插件增强了PDF内容的可访问性和可用性,使数据以电子表格格式更易于操作和分析。
主要特点:
- 将PDF转换为Excel:将PDF文件转换为XLS/XLSX电子表格,以便于数据管理。
- 自定义输出选项:配置输出格式、页面范围、工作表名称等。
- 高保真转换:在转换过程中保留布局、格式和内容的准确性。
- 批处理:一次转换多个PDF文件,以便进行大规模操作。
如何将PDF转换为XLS
要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤操作:
- 创建
PdfXls
类的实例。 - 创建
PdfToXlsOptions
的实例,以配置转换设置。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定输出Excel文件。 - 运行
Process
方法以启动转换。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加输入和输出文件路径
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 运行转换过程
9pdfXlsConverter.Process(options);
自定义PDF到Excel转换
您可以通过修改PdfToXlsOptions
类来自定义转换设置。例如,要将PDF转换为XLSX格式,插入一个空列并命名工作表,可以使用以下代码:
1var options = new PdfToXlsOptions();
2
3// 将输出格式设置为XLSX
4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
5
6// 在第一个位置插入一个空列
7options.InsertBlankColumnAtFirst = true;
8
9// 设置工作表名称
10options.WorksheetName = "MySheet";
11
12// 添加输入和输出文件
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 处理转换
17pdfXlsConverter.Process(options);
处理转换结果
处理完成后,Process方法返回一个ResultContainer
对象,该对象保存转换结果。您可以获取转换后的文件路径或其他输出详情:
1var resultContainer = pdfXlsConverter.Process(options);
2
3// 访问并打印结果文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
PDF到XLS转换的批处理
PDF到XLS转换器插件还支持批处理,允许一次转换多个PDF文件。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加多个输入PDF
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 添加输出Excel文件
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// 处理批量转换
13pdfXlsConverter.Process(options);