开发者指南 的子部分
PDF安全性
Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的PDF文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。
关键功能:
- 加密PDF文档:通过添加用户和所有者密码,保护您的PDF文件。
- 解密PDF文档:在需要时去除PDF文件的加密。
- 设置权限:控制打印、复制和修改内容等权限。
- 自动化:将加密和解密集成到您的.NET应用程序中,以实现自动化工作流程。
- 合规性:确保您的文档符合行业标准的文档安全性。
如何加密PDF文档
要加密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 创建
EncryptionOptions
的实例,并设置所需的用户和所有者密码。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行加密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置加密选项
5var opt = new EncryptionOptions("user_password", "owner_password");
6
7// 添加输入PDF文件
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// 指定输出加密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// 执行加密处理
14plugin.Process(opt);
如何解密PDF文档
要解密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 创建
DecryptionOptions
的实例,并提供必要的密码。 - 使用
AddInput
方法添加加密的PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行解密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置解密选项
5var opt = new DecryptionOptions("user_password");
6
7// 添加输入加密PDF文件
8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
9
10// 指定输出解密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// 执行解密处理
14plugin.Process(opt);
设置PDF文档的权限
在加密PDF时,您可以设置各种权限以控制文档的使用方式。
- 打印:允许或禁止打印文档。
- 复制:允许或禁止复制内容。
- 修改:允许或禁止对文档的修改。
要设置权限,您可以相应地配置EncryptionOptions
。
PDF 表格生成器
.NET 的 Documentize 表格生成器 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论是组织数据、设计表单还是改善文档可读性, هذا 插件都可以在保持精确性和效率的同时简化流程。它直观的 API 支持单个文档和批处理工作流,使其成为处理结构化数据的开发者必备工具。
主要特点:
- 动态表格创建:轻松生成 PDF 文档中的结构化表格。
- 丰富的内容支持:使用文本、HTML、图像和 LaTeX 内容填充表格。
- 页面放置:精确地在 PDF 中的特定位置插入表格。
- 可定制的布局:调整表格结构、单元格对齐和样式。
- 批处理:同时处理多个文档以实现最大效率。
使用表格创建 PDF
按照以下步骤使用 TableGenerator
类在 PDF 中创建结构化表格:
- 实例化
TableGenerator
类。 - 配置
TableOptions
对象以定义表格结构、内容和输入/输出文件。 - 向 PDF 添加表格、行和单元格。
- 使用
Process
方法完成表格生成过程。
以下是一个示例:
1var generator = new TableGenerator();
2var options = new TableOptions();
3
4// 指定输入和输出 PDF 文件
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 定义一个包含行和单元格的表格
9options
10 .InsertPageAfter(1) // 在第一页后添加表格
11 .AddTable()
12 .AddRow()
13 .AddCell().AddParagraph(new TextFragment("单元格 1"))
14 .AddCell().AddParagraph(new TextFragment("单元格 2"))
15 .AddCell().AddParagraph(new TextFragment("单元格 3"));
16
17// 在文档中生成表格
18generator.Process(options);
向表格添加丰富内容
PDF 文档中的表格可以包含多种内容类型,以增强其功能和外观。下面是向表格单元格添加 HTML 内容的示例:
1options
2 .AddTable()
3 .AddRow()
4 .AddCell().AddParagraph(new HtmlFragment("<h1>标题 1</h1>"))
5 .AddCell().AddParagraph(new HtmlFragment("<h2>标题 2</h2>"))
6 .AddCell().AddParagraph(new HtmlFragment("<h3>标题 3</h3>"));
表格中支持的内容类型
PDF 表格生成器 支持多种内容类型,使开发者能够根据各种用例自定义表格:
- HtmlFragment:添加基于 HTML 的内容,如标题、列表和格式化文本。
- TeXFragment:包含用于数学公式和科学计数法的 LaTeX 内容。
- TextFragment:插入普通或格式化文本。
- Image:将图像直接嵌入表格单元格中。
定制表格布局和结构
该插件提供了调整表格结构的灵活性,包括行高、列宽和单元格对齐。这些定制选项允许您设计与文档的布局和样式需求相匹配的表格。
处理表格生成
在添加所有内容并定制表格结构之后,通过调用 Process
方法完成该过程。此方法生成表格并更新 PDF 文档。以下是处理结果的方法:
1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);
PDF 表格生成器的用例
- 数据报告:以清晰有序的格式呈现分析、财务报告或调查结果。
- 表单设计:创建具有结构化表格布局的交互式表单。
- 文档增强:改善用户手册、指南或教学材料的可读性和可用性。
- 批处理:自动生成多个 PDF 文档的表格。
PDF优化器
Documentize PDF优化器 是一个综合插件,通过高级优化技术增强PDF文档。它的设计旨在帮助减小文件大小,旋转页面,裁剪内容,并调整文档大小。这些操作改善了PDF文件的质量和可管理性,使得它们更容易存储、分享和查看。
主要特性:
- 优化:减小PDF文件大小而不损失质量。
- 旋转:调整PDF页面的方向。
- 裁剪:去除文档中不必要的边距或内容。
- 调整大小:将页面调整为特定尺寸(例如,A4,Letter)。
优化PDF文档
以下步骤演示如何优化PDF文档,通过减小文件大小而保持质量。
- 创建Optimizer类的实例。
- 创建OptimizeOptions对象以配置优化设置。
- 添加输入PDF文件,并设置优化后文件的输出位置。
- 运行Process方法以执行优化。
1
2var optimizer = new Optimizer();
3var optimizeOptions = new OptimizeOptions();
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(optimizeOptions);
调整PDF文档大小
要调整PDF文档的大小,使用ResizeOptions类来指定文档的新页面大小。
- 实例化Optimizer类。
- 创建ResizeOptions对象以定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用SetPageSize方法指定新大小(例如,A4)。
- 调用Process方法以应用更改。
1
2var optimizer = new Optimizer();
3var resizeOptions = new ResizeOptions();
4resizeOptions.AddInput(new FileDataSource("input.pdf"));
5resizeOptions.SetPageSize(PageSize.A4);
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(resizeOptions);
旋转PDF页面
使用RotateOptions类来调整PDF文件中页面的方向。
- 实例化Optimizer类。
- 创建RotateOptions对象并配置旋转角度。
- 添加输入PDF文件并指定输出文件位置。
- 使用SetRotation方法设置旋转角度(例如,90度)。
- 使用Process方法执行旋转。
1
2var optimizer = new Optimizer();
3var rotateOptions = new RotateOptions();
4rotateOptions.AddInput(new FileDataSource("input.pdf"));
5rotateOptions.SetRotation(90);
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(rotateOptions);
裁剪PDF文档
裁剪去除PDF文档中不必要的内容或边距。可以使用CropOptions类来定义裁剪区域。
- 创建Optimizer类的实例。
- 使用CropOptions对象定义裁剪区域。
- 添加输入文件并指定输出文件位置。
- 使用SetCropBox方法定义裁剪区域。
- 使用Process方法执行裁剪。
1
2var optimizer = new Optimizer();
3var cropOptions = new CropOptions();
4cropOptions.AddInput(new FileDataSource("input.pdf"));
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域
6cropOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(cropOptions);
PDF 合并器
Documentize PDF 合并器 for .NET 是一款多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效地合并,并且在内容上保持一致。该插件处理内部资源,如字体和图像,以优化合并后的文档。
主要特性:
- 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
- 资源优化:合并过程中删除重复的字体和图像。
- 批量处理:一次性合并大量的 PDF 文档。
- 安全合并:确保文档完整性,无数据丢失或内容损坏。
如何合并 PDF 文档
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建
Merger
类的实例。 - 创建
MergeOptions
类的实例以配置合并过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行合并。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加要合并的输入 PDF 文件
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF
13merger.Process(mergeOptions);
如何合并带页码范围的 PDF
您还可以使用 MergeOptions
类合并输入 PDF 文件中的特定页码范围。这使您可以将选定的页面合并到最终输出文档中。
- 创建
Merger
类的实例。 - 使用
MergeOptions
配置页码范围。 - 添加带有指定页码范围的输入文件。
- 设置输出路径。
- 调用
Process
方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 合并输入 PDF 的特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF
12merger.Process(mergeOptions);
如何处理批量合并
PDF 合并器 插件经过优化,以处理大量 PDF 文档。通过利用批量处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。
- 实例化
Merger
类。 - 将所有输入 PDF 文件添加到
MergeOptions
类。 - 指定输出路径。
- 调用
Process
方法以合并批量中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDF 进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);
PDF签名
Documentize PDF Signature for .NET 插件允许用户对PDF文档进行数字签名。它提供了一种简化的流程来添加签名,确保真实性,并保护PDF内容。该插件支持可见和不可见签名,并提供自定义签名位置、原因、联系信息等选项。
主要特点:
- 数字签名PDF文档:使用可见或不可见的数字签名保护您的文档。
- PFX支持:使用PFX证书对PDF文件进行签名。
- 可自定义选项:配置签名设置,如原因、位置和联系信息。
- 可见和不可见签名:选择签名是否在文档上可见。
如何签署PDF文档
要使用PFX文件签署PDF文档,请按照以下步骤操作:
- 创建
Signature
类的实例。 - 使用PFX文件路径和密码实例化
SignOptions
类。 - 将输入PDF和输出文件添加到选项中。
- 运行
Process
方法以应用签名。
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// 添加输入PDF并指定输出文件
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 配置签名选项
10signOptions.Reason = "合同协议";
11signOptions.Contact = "johndoe@example.com";
12signOptions.Location = "纽约";
13signOptions.PageNumber = 1;
14signOptions.Visible = true;
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
16
17// 将签名应用于文档
18signature.Process(signOptions);
如何使用PFX文件流
您还可以使用作为流提供的PFX证书而不是文件路径来签名PDF。这允许更灵活地处理证书存储。
- 创建
Signature
类的实例。 - 用包含PFX及密码的流实例化
SignOptions
。 - 添加输入和输出文件。
- 运行
Process
方法以应用签名。
1
2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
3var signature = new Signature();
4var signOptions = new SignOptions(pfxStream, "pfxPassword");
5
6// 添加输入和输出文件
7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
9
10// 应用签名
11signature.Process(signOptions);
如何应用不可见签名
要添加一个不可见的签名(即保护文档而不在文档上显示签名),只需将Visible
属性设置为false
。
- 创建
SignOptions
的实例。 - 将
Visible
设置为false
。 - 添加输入和输出文件。
- 调用
Process
以应用不可见签名。
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// 配置不可见签名
6signOptions.Visible = false;
7
8// 添加输入和输出文件
9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
11
12// 处理签名
13signature.Process(signOptions);
PDF 分割器
Documentize PDF 分割器 for .NET 是一个强大的工具,简化了将大型 PDF 文档拆分为更小、更易管理文件的过程。无论您是需要提取单独的页面还是将文档划分为特定部分,这个插件都可以让您高效地实现,并且付出最少的努力。
主要特点:
- 按页面拆分 PDF:将 PDF 文档拆分为单独的页面。
- 批量处理:一次性拆分大量 PDF。
- 自定义拆分选项:根据您的需求配置拆分过程。
- 有序输出:轻松管理每个拆分页面或部分的输出文件。
如何拆分 PDF 文档
要将 PDF 文档拆分为单独的页面,请按照以下步骤操作:
- 创建
Splitter
类的实例。 - 创建
SplitOptions
的实例以配置拆分选项。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法为每个拆分页面添加输出文件。 - 运行
Process
方法以拆分文档。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 添加输入 PDF 文件
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 为每个页面指定输出文件
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
12
13// 处理拆分操作
14splitter.Process(splitOptions);
按页面范围拆分 PDF
您还可以通过指定页面范围来拆分 PDF。这使您能够从 PDF 中提取特定部分或多个页面到单独的文档中。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 添加输入 PDF
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 为页面范围定义输出(例如:页面 1-3)
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
10
11// 处理拆分
12splitter.Process(splitOptions);
如何处理批量拆分
PDF 分割器 插件已优化以处理大量 PDF 文档。您可以利用批量处理将数百个 PDF 拆分为单独的页面或部分。
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// 批量添加输入 PDF 文件
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 为每个文件定义输出
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
12
13// 处理批量拆分
14splitter.Process(splitOptions);
PDF ChatGPT
Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 集成到 PDF 应用程序中。该插件允许开发者根据输入消息生成聊天响应,并将输出以 PDF 格式保存,非常适合在 PDF 文档中直接创建对话接口或分析报告。
主要特点:
- 聊天补全:根据自定义输入使用 ChatGPT API 生成响应。
- 系统和用户消息:提供系统上下文和用户输入,以创建动态对话。
- PDF 输出:将生成的聊天补全保存为结构化 PDF 文件以供进一步使用。
- 异步处理:通过异步处理聊天补全,确保应用程序的响应能力。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:
- 创建
PdfChatGptRequestOptions
类的实例以配置请求选项。 - 添加输入和输出 PDF 文件。
- 设置 API 密钥并指定参数,如最大令牌数和 ChatGPT 模型的查询。
- 运行
ProcessAsync
方法生成聊天补全。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4options.MaxTokens = 1000; // 设置最大令牌数
5options.Query = "分析此文本的关键主题。";
6
7// 添加输入 PDF 文件
8options.AddInput(new FileDataSource("input.pdf"));
9
10// 指定保存包含聊天回复的输出 PDF 的位置
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// 创建 PdfChatGpt 插件的实例
14var plugin = new PdfChatGpt();
15
16// 异步运行该过程
17var result = await plugin.ProcessAsync(options);
添加系统和用户消息
要创建更具交互性的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。
- 添加设置 ChatGPT 上下文的系统消息。
- 添加表示用户输入的用户消息以进行对话。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4
5// 添加上下文的系统消息
6options.AddSystemMessage("您是一个经过训练的 AI,用于总结文本。");
7
8// 添加用户消息以查询 ChatGPT 模型
9options.AddUserMessage("请总结附加的文档。");
10
11// 添加输入和输出 PDF
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// 异步处理请求
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
PDF文本提取器
Documentize PDF文本提取器 for .NET 简化了从PDF文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,此插件都允许您高效提取文本,同时根据需求保留格式或省略格式。
关键功能:
- 纯模式:提取文本时保留其原始格式。
- 原始模式:提取时不保留任何格式。
- 简单模式:提取文本时不包含特殊字符或格式。
- 批量处理:一次从多个PDF中提取文本。
如何从PDF文档中提取文本
要从PDF文档中提取文本,请按照以下步骤操作:
- 创建
TextExtractor
类的实例。 - 创建
TextExtractorOptions
的实例以配置提取选项。 - 使用
AddInput
方法添加输入PDF文件。 - 运行
Process
方法提取文本。 - 使用
ResultContainer.ResultCollection
访问提取的文本。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 添加输入PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 处理文本提取
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// 打印提取的文本
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
从多个PDF中提取文本
该插件允许您同时从多个PDF中提取文本,确保快速和高效的处理。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 添加多个输入PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// 处理提取
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 输出提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
文本提取模式
TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取不带格式的文本,适用于原始数据处理。
- 简单模式:提取文本时不包含特殊字符或附加格式。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 设置为纯模式
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 处理和输出
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
如何处理批量处理
对于大型文档集,您可以利用批量处理,使您能够一次从多个PDF中提取文本。
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// 添加多个输入PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// 为每个文件定义输出
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 处理提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
PDF 时间戳添加器
Documentize PDF 时间戳添加器 for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。
主要特点:
- 添加安全时间戳:轻松为您的 PDF 文档添加安全时间戳。
- 可定制的时间戳服务器:使用自定义的时间戳服务器 URL 和身份验证凭据。
- 自动化:将时间戳功能集成到您的 .NET 应用程序中,实现自动化工作流程。
- 合规性:确保您的文档符合数字签名和时间戳的行业标准。
如何为 PDF 文档添加时间戳
要为 PDF 文档添加安全时间戳,请按照以下步骤操作:
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
实例,以配置时间戳处理过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行时间戳处理。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
7
8// 添加输入 PDF 文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出 PDF 文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
如何使用带有时间戳服务器的自定义身份验证
在连接到时间戳服务器时,您可以提供基本身份验证凭据。这使您能够对需要用户名和密码的服务器进行身份验证。
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
实例,包括 serverBasicAuthCredentials
。 - 添加输入文件和输出文件路径。
- 调用
Process
方法。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 使用身份验证配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
7
8// 添加输入 PDF 文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出 PDF 文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
处理 PFX 文件和密码
AddTimestampOptions
类允许您使用 PFX 文件进行数字签名,并提供密码。
- PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
- 密码保护:确保您安全管理 PFX 文件的密码。
PDF/A 转换器
Documentize PDF/A 转换器 for .NET 是一个强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 标准,提供转换和验证功能于一体的解决方案。
关键特性:
- 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(例如 PDF/A-1a、PDF/A-2b、PDF/A-3b)以确保符合归档标准。
- 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
- 批量处理:同时处理多个文件进行转换或验证。
- 高效工作流程:通过快速可靠的转换过程减少时间和精力。
如何将 PDF 转换为 PDF/A
要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤进行:
- 创建
PdfAConverter
类的实例。 - 创建
PdfAConvertOptions
实例以配置转换。 - 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
- 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加生成的 PDF/A 输出文件。 - 调用
Process
方法以执行转换。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加输入 PDF 文件
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 指定输出的 PDF/A 文件
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// 处理转换
15pdfAConverter.Process(pdfAOptions);
验证 PDF/A 合规性
您可以使用 PdfAValidateOptions
类验证现有 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// 添加待验证的 PDF 文件
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 运行验证过程
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// 检查验证结果
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);
PDF/A 转换的批量处理
该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加多个输入 PDF
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 指定转换后的 PDF/A 输出文件
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// 处理批量转换
17pdfAConverter.Process(pdfAOptions);
PDF转XLS转换器
Documentize PDF转XLS转换器 for .NET 是一款多功能且强大的工具,用于将PDF文档转换为Excel电子表格(XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态PDF数据转换为动态且可编辑的电子表格,从而简化数据处理、分析和共享。
主要特点:
- 灵活的转换选项:将PDF文件转换为XLSX、XLS、CSV或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 可定制的输出:配置页面范围、工作表名称和输出格式。
- 批量处理:同时处理多个PDF文件,实现高效。
- 高级格式化:插入空白列或减少工作表数量。
如何将PDF转换为Excel
要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤进行:
- 创建
XlsConverter
类的实例。 - 使用
PdfToXlsOptions
类配置转换设置。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定输出文件路径。 - 执行
Process
方法以启动转换。
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 添加输入和输出文件路径
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// 执行转换
10converter.Process(options);
自定义PDF转Excel转换
PdfToXlsOptions
类允许您自定义转换过程。例如,要将PDF转换为XLSX文件,设置工作表名称,并启用高级格式化选项:
1
2var options = new PdfToXlsOptions
3{
4 Format = PdfToXlsOptions.ExcelFormat.XLSX, // 指定XLSX格式
5 WorksheetName = "MySheet", // 命名工作表
6 InsertBlankColumnAtFirst = true // 在开头插入一列空白
7};
8
9// 添加输入和输出文件
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
12
13// 处理转换
14converter.Process(options);
批量处理PDF到XLS转换
通过批量处理,您可以一次性将多个PDF文件转换为Excel电子表格。以下是一个示例:
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 添加多个输入文件
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 指定输出文件路径
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// 执行批量转换
14converter.Process(options);
处理转换结果
转换过程中,Process
方法将返回一个ResultContainer
对象,其中包含操作的详细信息。以下是如何检索转换后的文件路径:
1
2var resultContainer = converter.Process(options);
3
4// 访问输出文件路径
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine("转换后的文件路径: " + result.Data.ToString());
支持的输出格式
PdfToXlsOptions.ExcelFormat
枚举提供多种输出格式:
- XLSX:Office Open XML (.xlsx) 文件格式(默认)。
- XLSM:宏启用Excel格式。
- CSV:逗号分隔值。
- ODS:开放文档电子表格。
- XMLSpreadSheet2003:Excel 2003 XML格式。
PDF转DOC转换器
Documentize PDF转DOC转换器 for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。这个插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和分享。
主要特性:
- DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
- 保持格式:在转换过程中保留原始布局、文本和格式。
- 批量处理:一次转换多个PDF文件。
- 自定义转换选项:通过不同模式(如增强流模式)微调转换过程,以获得更好的布局。
如何将PDF转换为DOC/DOCX
要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:
- 创建
DocConverter
类的实例。 - 创建
DocConversionOptions
实例以配置转换过程。 - 使用
AddInput
方法添加输入的PDF文件。 - 使用
AddOutput
方法添加生成的DOC/DOCX文件的输出路径。 - 运行
Process
方法以执行转换。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX, // 输出格式为DOCX
5 ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
6};
7
8// 添加输入PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15docConverter.Process(options);
使用自定义选项将PDF转换为DOC
PDF转DOC转换器插件提供多种选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中如何处理PDF的布局和结构。
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.Doc, // 输出格式为DOC
5 ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
6};
7
8// 添加输入PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15docConverter.Process(options);
批量处理PDF到DOC/DOCX转换
PDF转DOC转换器支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的一个示例:
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// 添加多个输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加生成的DOCX文件的输出路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16docConverter.Process(options);
PDF转JPEG转换器
Documentize PDF转JPEG转换器 for .NET 是一个强大的工具,简化了将PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各种平台上更加可访问。
主要特性:
- 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
- 页面范围:选择要转换的特定页面或范围。
- 批量处理:一次转换多个PDF页面或整个文档。
- 快速转换:高效快速的过程,几乎不需要额外的努力。
如何将PDF页面转换为JPEG
要将PDF文档转换为JPEG图像,请按照以下步骤操作:
- 创建
Jpeg
类的实例。 - 创建
JpegOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定JPEG图像的输出文件路径。 - 运行
Process
方法将PDF页面转换为JPEG图像。
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 添加输入PDF文件
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 指定JPEG图像的输出目录
9options.AddOutput(new FileDataSource(@"C:\Samples\images"));
10
11// 处理PDF到JPEG的转换
12converter.Process(options);
自定义PDF到JPEG的转换
您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以300 dpi转换PDF的第一页:
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 设置输出分辨率为300 dpi,仅转换第一页
6options.OutputResolution = 300;
7options.PageRange = new PageRange(1);
8
9// 添加输入和输出路径
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
12
13// 处理转换
14converter.Process(options);
PDF到JPEG转换的批量处理
PDF转JPEG转换器插件支持批量处理,允许您将PDF的多个页面转换为单独的JPEG文件。
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// 添加输入PDF文件
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 为每个页面设置输出路径
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));
11
12// 处理批量转换
13converter.Process(options);
如何处理转换结果
Process方法返回一个ResultContainer
对象,该对象包含有关转换结果的信息。您可以打印转换后JPEG文件的路径,如下所示:
1
2ResultContainer resultContainer = converter.Process(options);
3
4// 打印JPEG图像的输出路径
5foreach (FileResult result in resultContainer.ResultCollection)
6{
7 Console.WriteLine(result.Data.ToString());
8}
PDF转PNG转换器
Documentize PDF转PNG转换器 for .NET 是一个先进的工具,允许您将PDF文档转换为高质量的PNG图像。该插件旨在通过将PDF页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并更易于共享。
关键特性:
- 将PDF转换为PNG:快速有效地将整个PDF文档或特定页面转换为PNG图像。
- 可自定义分辨率:设置所需的DPI(例如,300 DPI)以获得高质量的图像输出。
- 批处理:一次转换多个PDF页面或整个文档。
- 轻松的输出管理:为每个转换后的PNG文件指定输出目录。
- 快速转换:快速、高效,配置所需的努力最小。
如何将PDF转换为PNG
要将PDF文档转换为PNG图像,请按照以下步骤操作:
- 创建
Png
类的实例。 - 创建
PngOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定PNG图像的输出目录。 - 运行
Process
方法将PDF页面转换为PNG图像。
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 添加输入PDF文件
6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
7
8// 指定PNG图像的输出目录
9options.AddOutput(new FileDataSource(@"C:\Samples\images"));
10
11// 处理PDF到PNG的转换
12converter.Process(options);
自定义PDF到PNG的转换
您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以300 DPI仅转换PDF的第一页:
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 设置输出分辨率为300 DPI
6options.OutputResolution = 300;
7
8// 仅转换第一页
9options.PageRange = new PageRange(1);
10
11// 添加输入和输出路径
12options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
14
15// 处理转换
16converter.Process(options);
PDF到PNG的批处理
PDF转PNG转换器插件还支持批处理,允许您将多个页面甚至整个PDF文档转换为单独的PNG文件。
1
2var converter = new Png();
3var options = new PngOptions();
4
5// 添加输入PDF文件
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 为每个页面设置输出路径
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
11
12// 处理批量转换
13converter.Process(options);
处理转换结果
处理完转换后,Process方法返回一个ResultContainer
对象,包含转换结果。您可以按如下方式打印PNG图像的输出路径:
1
2ResultContainer resultContainer = converter.Process(options);
3
4// 打印PNG图像的输出路径
5foreach (FileResult result in resultContainer.ResultCollection)
6{
7 Console.WriteLine(result.Data.ToString());
8}
PDF 转 TIFF 转换器
Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。该插件确保您的内容在各种平台上均可访问,同时保持出色的保真度和灵活性。
主要特点:
- 将 PDF 转换为 TIFF:轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
- 多页 TIFF:将多个 PDF 页面合并为单个多页 TIFF 文件。
- 页面范围:转换特定页面或范围,以实现精确结果。
- 批处理:一次性转换多个 PDF 文档或页面。
- 快速转换:快速高效的过程,最小努力即可完成。
如何将 PDF 页面转换为 TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建
TiffConverter
类的实例。 - 创建
PdfToTiffOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入的 PDF 文件。 - 使用
AddOutput
方法指定 TIFF 图像的输出文件路径。 - 运行
Process
方法将 PDF 页面转换为 TIFF 图像。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 添加输入的 PDF 文件
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 指定 TIFF 图像的输出文件
8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
9
10// 处理 PDF 到 TIFF 的转换
11converter.Process(options);
自定义 PDF 到 TIFF 转换
您可以通过调整分辨率、启用多页输出或选择页面范围来自定义转换过程。以下是如何将 PDF 的第一页以 300 dpi 转换为 TIFF 文件:
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 将输出分辨率设置为 300 dpi 并仅转换第一页
5options.OutputResolution = 300;
6options.PageList = new List<int> { 1 };
7
8// 添加输入和输出路径
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 处理转换
13converter.Process(options);
多页 TIFF 创建
PDF to TIFF Converter 插件支持多页 TIFF 生成,使您能够将多个 PDF 页面合并为一个 TIFF 文件,以便高效存档或打印。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions
3{
4 MultiPage = true // 启用多页 TIFF 输出
5};
6
7// 添加输入的 PDF 文件
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 指定多页 TIFF 的输出文件
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 处理转换
14converter.Process(options);
PDF 到 TIFF 转换的批处理
PDF to TIFF Converter 插件还支持批处理,允许您同时将多个 PDF 页面或整个文档转换为单独的 TIFF 文件。
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// 添加输入的 PDF 文件
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 为各个页面设置输出路径
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// 处理批转换
12converter.Process(options);
如何处理转换结果
Process 方法返回一个 ResultContainer
对象,其中提供了关于转换结果的详细信息。您可以打印转换后的 TIFF 文件的路径,如下所示:
1ResultContainer resultContainer = converter.Process(options);
2
3// 打印 TIFF 图像的输出路径
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
HTML 转换器
Documentize HTML 转换器 for .NET 提供了强大的文档转换功能,可以在 PDF 和 HTML 格式之间转换,适合于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应各种项目需求。
主要特点
PDF 到 HTML 转换
将 PDF 文件转换为 HTML,使文档可供基于 Web 的查看或集成到首选 HTML 格式的应用程序中。
HTML 到 PDF 转换
将 HTML 内容转变为高质量的 PDF,适用于生成可打印的报告、归档 Web 内容或创建可共享的文档格式。
详细指南
将 PDF 转换为 HTML
要将 PDF 转换为 HTML:
- 初始化转换器:创建
HtmlConverter
的实例。 - 设置转换选项:使用
PdfToHtmlOptions
自定义输出,选择内嵌资源或外部资源。 - 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
Process
方法以转换文件。
示例:将 PDF 转换为带内嵌资源的 HTML
// 第一步:初始化 HTML 转换器
var converter = new HtmlConverter();
// 第二步:配置 PDF 到 HTML 转换的选项
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 第三步:设置文件路径
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));
// 第四步:运行转换
converter.Process(options);
PDF 到 HTML 转换的可用选项
SaveDataType:
FileWithEmbeddedResources
:生成一个包含所有内嵌资源的单一 HTML 文件。FileWithExternalResources
:单独保存资源,适用于大型 HTML 文件。
输出自定义:
BasePath
:设置 HTML 文档中资源的基础路径。IsRenderToSinglePage
:可选择将所有 PDF 内容呈现在单个 HTML 页面上。
将 HTML 转换为 PDF
要将 HTML 文档转换为 PDF,请按以下步骤操作:
- 初始化转换器:创建
HtmlConverter
的实例。 - 配置 PDF 选项:使用
HtmlToPdfOptions
定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件路径。
- 执行转换:运行
Process
方法以完成转换。
示例:将 HTML 转换为 PDF
// 第一步:初始化 HTML 转换器
var converter = new HtmlConverter();
// 第二步:配置 HTML 到 PDF 转换的选项
var options = new HtmlToPdfOptions();
// 第三步:设置文件路径
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));
// 第四步:执行转换
converter.Process(options);
HTML 到 PDF 转换的其他选项
媒体类型:
HtmlMediaType.Print
:适合生成适合打印的 PDF。HtmlMediaType.Screen
:在转换为数字查看设计的内容时使用。
布局调整:
PageLayoutOption
:调整 HTML 内容在 PDF 布局中的适配方式,例如 ScaleToPageWidth
可确保内容比例适应 PDF 的宽度。IsRenderToSinglePage
:如果需要简洁的演示,启用在单个 PDF 页面上呈现整个 HTML 内容。
这个转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到将 PDF 文档归档转换为 Web 可访问格式。有关更高级的配置,请参考完整的 Documentize 文档。
常见问题解答
此常见问题解答提供有关 Documentize .NET 插件 的全面信息,涵盖 PDF 转换、表单处理和目录生成 (TOC) 等功能和特性。
常见问题
1. 什么是 Documentize for .NET?
Documentize for .NET 是一个强大的库,用于以编程方式管理和处理 PDF 文档。它包括用于将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成 TOC 以及确保 PDF/A 合规性以用于长期存档的插件。
2. 如何安装 Documentize 的 .NET 插件?
您可以通过从官方网站下载程序集文件或直接从 NuGet 获取包的方式安装 Documentize 插件。每个插件的文档中都有详细的安装说明。
PDF 转换插件
3. 如何将 PDF 文档转换为 Word (DOC/DOCX) 文件?
要使用 PDF to DOC 转换器 将 PDF 文档转换为 Word 格式:
- 实例化
PdfDoc
类。 - 创建
PdfToDocOptions
对象以配置转换选项。 - 添加输入 PDF 和输出 DOC/DOCX 文件路径。
- 调用
Process
方法以执行转换。
4. 如何将 PDF 页面转换为 JPEG 图像?
使用 PDF to JPEG 转换器:
- 创建
Jpeg
类的实例。 - 通过
JpegOptions
设置转换选项(例如,分辨率、页码范围)。 - 添加输入/输出文件路径。
- 调用
Jpeg.Process
方法进行转换。
5. 如何将 PDF 转换为 PNG?
要将 PDF 转换为 PNG 格式:
- 创建
Png
类的实例和一个 PngOptions
对象。 - 添加输入 PDF 并指定输出文件夹。
- 设置选项,例如分辨率(例如,300 DPI)。
- 调用
Process
方法生成 PNG 图像。
6. 如何将 PDF 转换为 Excel (XLS/XLSX)?
要将 PDF 转换为 Excel:
- 实例化
PdfXls
类。 - 使用
PdfToXlsOptions
配置输入/输出路径和转换选项。 - 调用
Process
方法开始转换。
7. 如何将 PDF 转换为 HTML?
要将 PDF 文档转换为 HTML:
- 创建
PdfHtml
类的实例。 - 使用
PdfToHtmlOptions
或 HtmlToPdfOptions
配置转换选项。 - 添加输入/输出路径并调用
Process
方法。
PDF 表单处理
8. 如何使用表单编辑器编辑 PDF 表单?
PDF 表单编辑器 提供以下功能:
- 添加字段 (
FormEditorAddOptions
)。 - 更新字段 (
FormEditorSetOptions
)。 - 移除字段 (
FormRemoveSelectedFieldsOptions
)。
配置完表单字段后,运行 Process
方法。
9. 如何将 PDF 表单扁平化?
扁平化表单字段:
- 实例化
FormFlattener
类。 - 使用
FormFlattenAllFieldsOptions
扁平化所有字段,或使用 FormFlattenSelectedFieldsOptions
针对特定字段。 - 添加输入/输出文件并调用
Process
方法。
10. 如何从 PDF 表单导出数据?
要导出表单数据,使用 PDF 表单导出器。创建一个 FormExporterValuesToCsvOptions
对象,指定表单字段条件,并运行 Process
方法将数据导出为 CSV 格式。
PDF/A 和 TOC 管理
11. 如何将 PDF 转换为 PDF/A 格式?
要将 PDF 转换为 PDF/A:
- 使用
PdfAConverter
类。 - 在
PdfAConvertOptions
中配置 PDF/A 版本(例如,PDF/A-3B)。 - 添加输入/输出路径并调用
Process
方法。
12. 如何在 PDF 中生成目录 (TOC)?
要创建 TOC:
- 创建
TocGenerator
类的实例。 - 使用
TocOptions
定义 TOC 参数。 - 添加输入/输出文件并运行
Process
方法。
签名处理
13. 如何对 PDF 文档进行数字签名?
要添加数字签名:
- 实例化
Signature
类。 - 使用
SignOptions
配置 PFX 文件、密码和签名详细信息(例如,原因、联系方式)。 - 添加输入/输出文件并运行
Process
方法。
其他功能
14. 我可以使用 Documentize 拆分 PDF 文件吗?
是的,使用 PDF 拆分器:
- 实例化
Splitter
类。 - 使用
SplitOptions
配置拆分选项。 - 添加输入/输出路径并调用
Process
方法。
15. 如何将多个 PDF 文件合并为一个?
要合并 PDF:
- 实例化
Merger
类。 - 添加输入 PDF 并通过
MergeOptions
指定输出文件。 - 运行
Process
方法以合并文件。
16. Documentize 是否仅限于处理 PDF?
虽然 Documentize 主要专注于 PDF 操作,但它也支持转换为 DOC、XLS、HTML、JPEG 和 PNG 等格式。
许可和兼容性
17. 使用 Documentize 插件的系统要求是什么?
Documentize 支持:
- 操作系统:Windows 7-11、Windows Server 2003-2022、macOS (10.12+) 和 Linux。
- 框架:.NET Framework 4.0 到 8.0。
- IDE:与各种版本的 Visual Studio 兼容。
18. 如何为 Documentize 设置许可密钥?
要激活插件,请在项目中引用 Documentize 并在调用任何方法之前设置许可密钥。有关详细说明,请参考特定插件的文档。
19. 哪里可以找到更多 Documentize 插件的示例和文档?
完整的 API 文档和示例可以在 Documentize 网站上或通过开发环境中的 NuGet 包找到。