开发者指南
HTML Converter
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF,或将 PDF 转换为 HTML—保持布局和格式,以确保一致的专业结果。
PDF Extractor
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Images
轻松从 .NET 应用程序中提取 PDF 文档中的图像
Export Form Data
从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV,使用 C# .NET
PDF Manager
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Optimize PDF
使用Documentize的.NET工具轻松优化您的PDF——减小文件大小,提高性能,保持质量
Add Table
使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。
Add TOC
通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航
PDF Security
使用 Documentize 的 .NET 工具轻松加密、解密和设置权限,以保护敏感信息.
PDF Signature
使用 Documentize 的 .NET 工具数字签署 PDF——轻松确保安全、真实性和合规性。
PDF ChatGPT
使用 Documentize 的 ChatGPT 集成,利用 AI 增强您的 PDF——智能生成、编辑和分析内容。
PDF Timestamp Adder
使用 Documentize 的 .NET 工具向 PDF 添加时间戳——自动插入日期和时间,以增强文档跟踪。
PDF/A Converter
使用 Documentize 的 .NET 工具将 PDF 转换为 PDF/A 格式——轻松确保长期归档和合规性。
PDF 转 XLS 转换器
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
PDF to DOC Converter
使用Documentize的.NET工具将PDF转换为Word文档——保留格式和结构以便于编辑。
PDF to JPEG Converter
使用 Documentize 的 .NET 工具将 PDF 转换为 JPEG 图像——轻松提取文档中的高质量图像。
PDF to PNG Converter
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取高质量图像以用于网页和图形。
PDF to TIFF Converter
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业文档管理。
PDF Form Flattener
将交互式PDF表单转换为不可编辑的文档,使其免受未经授权的修改
开发者指南 的子部分
HTML Converter
Documentize HTML Converter for .NET 提供强大的文档转换功能,支持 PDF 和 HTML 格式之间的转换,非常适合 Web 应用程序、归档和报告生成。具有多种处理资源和布局的选项,该转换器可适应各种项目需求。
PDF 转 HTML 转换
将 PDF 文件转换为 HTML,以使文档可用于基于 Web 的查看或集成到 HTML 格式优先的应用程序中。
HTML 转 PDF 转换
将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。
将 PDF 转换为 HTML
要将 PDF 转换为 HTML:
- 配置选项: 使用
PdfToHtmlOptions自定义输出,选择嵌入式或外部资源。 - 定义输入和输出路径: 设置输入 PDF 和输出 HTML 的路径。
- 执行转换: 调用
HtmlConverter的Process方法以转换文件。
示例:将 PDF 转换为带嵌入式资源的 HTML
1// 步骤 1: 配置 PDF 转 HTML 转换的选项
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);PDF 转 HTML 转换的可用选项
- SaveDataType:
FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单一 HTML 文件。FileWithExternalResources: 将资源单独保存,适用于大型 HTML 文件。
将 HTML 转换为 PDF
要将 HTML 文档转换为 PDF,请按照以下步骤操作:
- 配置选项: 使用
HtmlToPdfOptions定义布局和媒体设置。 - 指定路径: 设置输入 HTML 和输出 PDF 文件路径。
- 执行转换: 运行
HtmlConverter的Process方法以转换文件。
示例:将 HTML 转换为 PDF
1// 步骤 1: 配置 HTML 转 PDF 转换的选项
2var options = new HtmlToPdfOptions();
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);HTML 转 PDF 转换的附加选项
媒体类型:
HtmlMediaType.Print: 适合生成适合打印的 PDF。HtmlMediaType.Screen: 在转换为为数字观看而设计的内容时使用。
布局调整:
PageLayoutOption: 调整 HTML 内容适应 PDF 布局的方式,例如ScaleToPageWidth确保内容缩放到 PDF 宽度。IsRenderToSinglePage: 启用在需要简明呈现时将整个 HTML 内容呈现到单个 PDF 页面。
该转换器在多种应用程序中非常灵活,从基于 Web 的内容生成 PDF报告,到转换 PDF 文档归档以实现 Web 可访问性。有关更多高级配置,请参阅完整的 Documentize 文档。
PDF Extractor
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Images
轻松从 .NET 应用程序中提取 PDF 文档中的图像
Export Form Data
从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV,使用 C# .NET
PDF Extractor 的子部分
Extract Text
Documentize PDF Extractor for .NET 使从 PDF 文档中提取文本变得简单。无论您需要纯文本、原始文本还是简洁文本,此插件都允许您高效地提取文本,同时根据您的需求保留格式或省略格式。
如何从 PDF 中提取文本
要从 PDF 文档中提取文本,请按照以下步骤操作:
- 创建一个
ExtractTextOptions的实例以配置提取选项。 - 使用
AddInput方法添加输入 PDF 文件。 - 运行
ExtractText方法以提取文本。 - 使用
ResultContainer.ResultCollection访问提取的文本。
1// 创建 ExtractTextOptions 对象以设置指令
2var options = new ExtractTextOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();文本提取模式
ExtractTextOptions 提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取未经格式化的文本,适用于原始数据处理。
- 扁平模式:通过其坐标显示 PDF 内容的定位文本片段。
1// 创建 ExtractTextOptions 对象以设置 TextFormattingMode
2var options = new ExtractTextOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();主要特性:
- 纯模式:提取文本时保留其原始格式。
- 原始模式:提取文本时不进行任何格式化。
- 扁平模式:提取文本时不带特殊字符或格式。
Extract Images
Documentize PDF Extractor for .NET 插件使您能够轻松地从 PDF 文档中提取图像。它扫描您的 PDF 文件,识别嵌入的图像,并在保持其原始质量和格式的同时提取这些图像。该工具增强了视觉内容的可访问性,并简化了从 PDF 中检索图像的过程。
如何从 PDF 中提取图像
要从 PDF 文件中提取图像,请按照以下步骤操作:
- 创建
ExtractImagesOptions类的实例。 - 使用
AddInput方法将输入文件路径添加到选项中。 - 使用
AddOutput方法设置图像的输出目录路径。 - 使用插件处理图像提取。
- 从结果容器中检索提取的图像。
1// 创建 ExtractImagesOptions 以设置指令
2var options = new ExtractImagesOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// 执行该过程
8var results = PdfExtractor.ExtractImages(options);
9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();从 PDF 文件提取图像到流而不使用文件夹
PdfExtractor 插件支持保存到流,这使您能够从 PDF 文件中提取图像到流,而不使用临时文件夹。
1// 创建 ExtractImagesOptions 以设置指令
2var options = new ExtractImagesOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 不设置输出 - 它将结果写入流
6// 执行该过程
7var results = PdfExtractor.ExtractImages(options);
8// 获取流
9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}关键特点:
- 提取嵌入图像:识别并提取 PDF 文档中的图像。
- 保持图像质量:确保提取的图像保持其原始质量。
- 灵活输出:以您喜欢的格式或位置保存提取的图像。
Export Form Data
Documentize PDF Extractor for .NET 插件提供了一种无缝的方式来从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV。这个动态工具简化了检索表单字段值的过程,便于数据管理、传输和分析。
如何从 PDF 导出表单数据
要将表单数据从 PDF 导出到 CSV,请按照以下步骤操作:
- 创建
ExtractImagesOptions类的实例。 - 使用
FormExporterValuesToCsvOptions类定义导出选项。 - 添加输入 PDF 文件并指定输出 CSV 文件。
- 运行
Process方法以执行导出。
1// 创建 ExtractFormDataToDsvOptions 对象以设置指令
2var options = new ExtractFormDataToDsvOptions(',', true);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// 执行处理
8PdfExtractor.ExtractFormData(options);主要特性:
- 导出表单数据:将 PDF 表单 (AcroForms) 中的数据提取到 CSV 或其他格式。
- 数据过滤:使用谓词根据字段类型或页面号码等标准过滤特定表单字段以便导出。
- 灵活输出:将导出的数据保存以供分析,或转移到电子表格、数据库或其他文档格式。
PDF Manager
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Optimize PDF
使用Documentize的.NET工具轻松优化您的PDF——减小文件大小,提高性能,保持质量
Add Table
使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。
Add TOC
通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航
PDF Manager 的子部分
Merge PDF
Documentize PDF 管理器 for .NET 是一个多功能工具,专为将多个 PDF 文档合并为一个文件而设计。它简化了 PDF 文件的整合,确保高效合并文档,并保持内容的一致性。该插件处理内部资源,如字体和图像,以优化合并后的文档。
如何合并 PDF
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建
MergeOptions实例以配置合并过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
PdfManager类的Merge方法执行合并。
1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行过程
9PdfManager.Merge(options);如何合并指定页面范围的 PDF
您也可以使用 MergeOptions 类合并输入 PDF 文件中的特定页面范围。这允许您将选定页面组合到最终输出文档中。
- 创建
Merger类的实例。 - 使用
MergeOptions配置页面范围。 - 添加具有指定页面范围的输入文件。
- 设置输出路径。
- 调用
Process方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 合并输入 PDF 的特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行过程
12merger.Process(mergeOptions);如何处理批量合并
PDF Merger 插件经过优化,以处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。
- 实例化
Merger类。 - 将所有输入 PDF 文件添加到
MergeOptions类。 - 指定输出路径。
- 调用
Process方法以合并批处理中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDF 进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);主要特点:
- 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
- 资源优化:合并过程中移除重复的字体和图像。
- 批量处理:一次合并大量 PDF 文档。
Split PDF
Documentize PDF Manager for .NET 是一款强大的工具,可以简化将大型PDF文档拆分为更小、更易管理的文件的过程。无论您是需要提取单独的页面,还是将文档划分为特定的部分,该插件都能高效实现,并且付出最少的努力。
如何拆分PDF
要将PDF文档拆分为单独的页面,请按照以下步骤操作:
- 创建
SplitOptions的实例以配置拆分选项。 - 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法为每个拆分页面添加输出文件。 - 在
PdfManager类中运行Split方法以拆分文档。
1// 创建SplitOptions对象以设置指令
2var options = new SplitOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
8// 执行处理
9PdfManager.Split(options);按页范围拆分PDF
您还可以通过指定页范围来拆分PDF。这允许您将特定部分或多个页面从PDF中提取到单独的文档中。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 定义页范围的输出(例如,页码 1-3)
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
9
10// 处理拆分
11splitter.Process(splitOptions);如何处理批量拆分
PDF Splitter 插件已针对处理大量PDF文档进行了优化。您可以利用批处理将数百个PDF拆分为单独的页面或部分。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 批量添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 定义每个文件的输出
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);主要特性:
- 按页面拆分PDF:将PDF文档拆解为单独的页面。
- 自定义拆分选项:根据您的需求配置拆分过程。
- 整齐的输出:轻松管理每个拆分页面或部分的输出文件。
Optimize PDF
Documentize PDF管理器 for .NET 是一个全面的插件,通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小、旋转页面、裁剪内容和调整文档大小。这些操作改善了PDF文件的质量和可管理性,使存储、共享和查看变得更加容易。
优化PDF
以下步骤演示如何通过减小PDF文档的文件大小而保持质量来优化PDF文档。
- 创建一个OptimizeOptions对象以配置优化设置。
- 添加输入PDF文件,并设置优化后文件的输出位置。
- 运行
PdfManager的Optimize方法以执行优化。
1
2// 创建OptimizeOptions对象以设置指令
3var options = new OptimizeOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9PdfManager.Optimize(options); 旋转PDF
使用RotateOptions类调整PDF文件中页面的方向。
- 创建一个RotateOptions对象并配置旋转角度。
- 添加输入PDF文件并指定输出文件位置。
- 使用SetRotation方法设置旋转角度(例如,90度)。
- 运行
PdfManager的Rotate方法。
1
2// 创建RotateOptions对象以设置指令
3var options = new RotateOptions();
4// 设置新的旋转
5options.Rotation = Rotation.On90;
6// 添加输入文件路径
7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
8// 设置输出文件路径
9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
10// 执行处理
11PdfManager.Rotate(options); 调整PDF大小
要调整PDF文档的大小,可以使用ResizeOptions类指定文档的新页面大小。
- 创建一个ResizeOptions对象以定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用SetPageSize方法指定新大小(例如,A4)。
- 运行
PdfManager的Resize方法。
1
2// 创建ResizeOptions对象以设置指令
3var options = new ResizeOptions();
4// 设置新的页面大小
5options.PageSize = PageSize.A3;
6// 添加输入文件路径
7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
8// 设置输出文件路径
9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
10// 执行处理
11PdfManager.Resize(options); 压缩PDF
在可行的情况下,通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来压缩PDF文档。
- 创建一个CompressOptions对象以配置优化设置。
- 添加输入文件并指定输出文件位置。
- 使用SetCropBox方法定义裁剪区域。
- 运行
PdfManager的Compress方法。
1
2// 创建CompressOptions对象以设置指令
3var options = new CompressOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9PdfManager.Compress(options); 主要特点:
- 优化:在不损失质量的情况下减小PDF文件大小。
- 旋转:调整PDF页面的方向。
- 调整大小:将页面调整为特定尺寸(例如,A4、信纸)。
- 压缩:从文档中删除未使用的页面资源和对象。
Add Table
Documentize PDF 管理器 for .NET 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单还是改善文档可读性,这个插件都可以在保持精确和高效的同时简化这一过程。其直观的 API 支持单文档和批量处理工作流,使其成为处理结构化数据的开发人员必不可少的工具。
创建带有表格的 PDF
按照以下步骤使用 TableOptions 类在 PDF 中创建结构化表格:
- 配置
TableOptions对象,以定义表格结构、内容和输入/输出文件。 - 将表格、行和单元格添加到您的 PDF 中。
- 使用
AddTable方法完成表格生成过程。
这里是一个示例:
1// 配置表格选项
2var options = new TableOptions();
3options.InsertPageBefore(1)
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("姓名")
7 .AddCell().AddParagraph("年龄")
8 .AddRow()
9 .AddCell().AddParagraph("鲍勃")
10 .AddCell().AddParagraph("12")
11 .AddRow()
12 .AddCell().AddParagraph("山姆")
13 .AddCell().AddParagraph("20")
14 .AddRow()
15 .AddCell().AddParagraph("桑迪")
16 .AddCell().AddParagraph("26")
17 .AddRow()
18 .AddCell().AddParagraph("汤姆")
19 .AddCell().AddParagraph("12")
20 .AddRow()
21 .AddCell().AddParagraph("吉姆")
22 .AddCell().AddParagraph("27");
23// 添加输入文件路径
24options.AddInput(new FileDataSource("path_to_input.pdf"));
25// 设置输出文件路径
26options.AddOutput(new FileDataSource("path_to_output.pdf"));
27// 执行过程
28PdfManager.AddTable(options);设置表格页码
按照以下步骤在 PDF 中的第 2 页后创建表格: 这里是一个示例:
1var options = new TableOptions();
2options.InsertPageBefore(2) // 在第 2 页之前添加表格
3 .AddTable()
4 .AddRow()
5 .AddCell().AddParagraph("姓名")
6 .AddCell().AddParagraph("年龄")
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_output.pdf"));
11// 执行过程
12PdfManager.AddTable(options);关键特性:
- 动态表格创建:轻松在 PDF 文档中生成结构化表格。
- 页面位置:精确地在 PDF 中的特定位置插入表格。
- 可自定义布局:调整表格结构、单元格对齐和样式。
Add TOC
Documentize PDF Manager for .NET 是一个强大的插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。此插件简化了将 TOC 添加到 PDF 的过程,使文档更易于导航和管理。
如何为 PDF 生成 TOC
要在 PDF 文件中创建目录,按照以下步骤操作:
- 创建一个
TocOptions实例以配置 TOC 生成设置。 - 使用
Title属性设置标题。 - 使用
Headings.Add方法设计 TOC 的标题。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定带有 TOC 的输出 PDF 文件。 - 调用
AddTableOfContents方法生成 TOC。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2));
7options.Headings.Add(new TocHeading("第一章", 3));
8options.Headings.Add(new TocHeading("第二章", 4));
9options.Headings.Add(new TocHeading("第三章", 5));
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 设置输出文件路径
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// 执行该过程
15PdfManager.AddTableOfContents(options);在 PDF 的 TOC 中生成书签
您可以使用 ‘GenerateBookmarks’ 属性来生成书签。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 在书签中生成链接
6options.GenerateBookmarks = true;
7// 设计标题
8options.Headings.Add(new TocHeading("引言", 2, false, 1));
9options.Headings.Add(new TocHeading("第一章", 3, true, 1));
10options.Headings.Add(new TocHeading("第二章", 4, true, 1));
11options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
12options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
13options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
14options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
15options.Headings.Add(new TocHeading("第三章", 5, true, 1));
16// 添加输入文件路径
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 设置输出文件路径
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// 执行该过程
21PdfManager.AddTableOfContents(options);如何将结果作为流获取
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2, false, 1));
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
9// 设置输出流
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// 执行该过程
14PdfManager.AddTableOfContents(options);自定义 TOC 标题
您可以通过修改 TocHeading 类自定义目录标题。例如,您可以使用 ‘GenerateNumbering’ 或手动完成。
用于页面链接的属性 ‘PageNumber’。您还可以使用 Level 属性。
1var heading = new TocHeading();
2heading.Text = "引言";
3heading.PageNumber = 5;
4heading.GenerateNumbering = true;
5heading.Level = 2;
6
7var tocOptions = new TocOptions();
8options.Headings.Add(heading);
9// 添加输入和输出文件
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// 使用自定义选项生成 TOC
14PdfManager.AddTableOfContents(tocOptions);关键特性:
- 动态 TOC 生成:为任何 PDF 文件创建目录,自动根据标题或书签生成条目。
- 自定义:控制 TOC 的外观和结构,包括样式、格式和深度级别。
- 高效工作流程:减少手动创建 TOC 的时间,尤其适用于大型或复杂文档。
PDF Security
Documentize PDF Security for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。
如何加密 PDF
要加密 PDF 文档,请按照以下步骤操作:
- 创建
EncryptionOptions的实例,并设置所需的用户和所有者密码。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
Security类的Process方法执行加密。
1// 创建 EncryptionOptions 对象以设置指令
2var options = new EncryptionOptions("123456", "qwerty");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);如何解密 PDF
要解密 PDF 文档,请按照以下步骤操作:
- 创建
DecryptionOptions的实例,并设置必要的密码。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
Security类的Process方法执行解密。
1// 创建 DecryptionOptions 对象以设置指令
2var options = new DecryptionOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);主要特点:
- 加密 PDF 文档:通过添加用户和所有者密码来保护您的 PDF 文件。
- 解密 PDF 文档:在需要时移除 PDF 的加密。
- 自动化:将加密和解密集成到您的 .NET 应用程序中,以实现自动化工作流程。
- 合规性:确保您的文档符合行业标准的文档安全性。
PDF Signature
Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名、确保真实性和保护 PDF 内容的简化流程。该插件支持可见和隐形签名,并提供自定义签名位置、原因、联系信息等选项。
如何签署 PDF 文档
要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:
- 使用 PFX 文件路径和密码实例化
SignOptions类。 - 将输入 PDF 和输出文件添加到选项中。
- 运行
Process方法以应用签名。
1// 创建 SignOptions 对象以设置说明
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Signature.Process(options);如何使用流进行 PFX 文件签名
您也可以使用作为流提供的 PFX 证书签署 PDF,而不是文件路径。这允许更灵活地处理证书存储。
- 用包含 PFX 的流和密码实例化
SignOptions。 - 添加输入和输出文件。
- 运行
Process方法以应用签名。
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行处理
6Signature.Process(options);如何添加隐形签名
要添加隐形签名(在文档上不会显示签名但可以保护文档),只需将 Visible 属性设置为 false。
- 创建
SignOptions的实例。 - 将
Visible设置为false。 - 添加输入和输出文件。
- 调用
Process以应用隐形签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置隐形签名
5signOptions.Visible = false;
6// 执行处理
7Signature.Process(options);如何为 PDF 文档的签名使用额外选项
在向 PFX 文件添加签名时,您可以使用额外选项,如原因、联系人、位置、页码。
- 使用 PFX 文件路径和密码实例化
SignOptions类。 - 将输入 PDF 和输出文件添加到选项中。
- 设置选项的值。
- 运行
Process方法以应用签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 可选参数
5options.Reason = "my Reason";
6options.Contact = "my Contact";
7options.Location = "my Location";
8options.PageNumber = 3;
9// 执行处理
10Signature.Process(options);主要功能:
- 数字签署 PDF 文档:使用可见或隐形数字签名保护您的文档。
- PFX 支持:使用 PFX 证书签署 PDF 文件。
- 可自定义选项:配置签名设置,如原因、位置和联系信息。
- 可见和隐形签名:选择签名是否在文档上可见。
PDF ChatGPT
Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 集成到 PDF 应用程序中。此插件允许开发者根据输入消息生成聊天响应,并将输出保存为 PDF 格式,使其适合直接在 PDF 文档中创建对话界面或分析报告。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:
- 创建
PdfChatGptRequestOptions类的实例以配置请求选项。 - 添加输入和输出 PDF 文件。
- 设置 API 密钥并指定参数,如最大令牌数和 ChatGPT 模型的查询。
- 运行
ProcessAsync方法以生成聊天完成内容。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // 设置您的 API 密钥
3options.MaxTokens = 1000; // 设置最大令牌数量
4options.Query = "分析此文本的关键主题。";
5
6// 添加输入 PDF 文件
7options.AddInput(new FileDataSource("input.pdf"));
8
9// 指定保存带有聊天响应的输出 PDF 的位置
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// 异步运行处理
13var result = await PdfChatGpt.ProcessAsync(options);主要功能:
- 聊天完成:根据自定义输入使用 ChatGPT API 生成响应。
- 系统和用户消息:提供系统上下文和用户输入以创建动态对话。
- PDF 输出:将生成的聊天完成内容保存为结构化 PDF 文件以供进一步使用。
- 异步处理:通过异步处理聊天完成内容确保应用程序的响应性。
添加系统和用户消息
为了创造更互动的对话,您可以添加系统和用户消息。这些消息有助于塑造对话上下文。
- 添加一个系统消息,为 ChatGPT 设置上下文。
- 添加一个用户消息,表示用户在对话中的输入。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // 设置您的 API 密钥
3
4// 添加系统消息以提供上下文
5options.AddSystemMessage("您是一个被训练来总结文本的 AI。");
6
7// 添加用户消息以查询 ChatGPT 模型
8options.AddUserMessage("请总结附加的文档。");
9
10// 添加输入和输出 PDF
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// 异步处理请求
15var result = await PdfChatGpt.ProcessAsync(options);PDF Timestamp Adder
Documentize PDF Timestamp Adder for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。它通过提供可信的时间参考来增强文档的完整性和真实性,确保符合数字签名标准。
如何向 PDF 添加时间戳
要向 PDF 文档添加安全时间戳,请按照以下步骤操作:
- 创建
AddTimestampOptions的实例 来配置时间戳过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput设置输出文件路径。 - 使用
Process方法执行时间戳操作。
1// 配置时间戳选项
2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
3
4// 添加输入 PDF 文件
5options.AddInput(new FileDataSource("path_to_pdf"));
6
7// 指定输出 PDF 文件
8options.AddOutput(new FileDataSource("path_to_result_pdf"));
9
10// 执行时间戳过程
11Timestamp.Process(options);如何使用自定义身份验证连接时间戳服务器
在连接时间戳服务器时,您可以提供基本身份验证凭据。这允许您与需要用户名和密码的服务器进行身份验证。
- 创建
AddTimestampOptions的实例,包括serverBasicAuthCredentials。 - 添加输入文件和输出文件路径。
- 调用
Process方法。
1// 使用身份验证配置时间戳选项
2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
3
4// 添加输入 PDF 文件
5options.AddInput(new FileDataSource("path_to_pdf"));
6
7// 指定输出 PDF 文件
8options.AddOutput(new FileDataSource("path_to_result_pdf"));
9
10// 执行时间戳过程
11Timestamp.Process(options);处理 PFX 文件和密码
AddTimestampOptions 类允许您使用 PFX 文件进行数字签名并配合密码使用。
- PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
- 密码保护:确保安全管理 PFX 文件的密码。
主要特性:
- 添加安全时间戳:轻松向您的 PDF 文档添加安全时间戳。
- 可自定义的时间戳服务器:使用自定义时间戳服务器 URL 和身份验证凭据。
- 自动化:将时间戳过程集成到您的 .NET 应用程序中,实现自动化工作流。
- 合规性:确保您的文档符合数字签名和时间戳的行业标准。
PDF/A Converter
Documentize PDF/A Converter for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 规范,提供了单一解决方案的转换和验证功能。
如何将 PDF 转换为 PDF/A
要将 PDF 文档转换为 PDF/A 格式,请按以下步骤操作:
- 创建
PdfAConvertOptions的实例以配置转换。 - 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
- 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加结果 PDF/A 的输出文件。 - 调用
Process方法以执行转换。
1var pdfAOptions = new PdfAConvertOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_3B
4};
5
6// 添加输入 PDF 文件
7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8
9// 指定输出 PDF/A 文件
10pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
11
12// 处理转换
13PdfAConverter.Process(pdfAOptions);验证 PDF/A 合规性
您可以使用 PdfAValidateOptions 类验证现有 PDF 文件的 PDF/A 合规性。
1var validationOptions = new PdfAValidateOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_1A
4};
5
6// 添加要验证的 PDF 文件
7validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8
9// 运行验证过程
10var resultContainer = PdfAConverter.Process(validationOptions);
11
12// 检查验证结果
13var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
14Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);PDF/A 转换的批处理
该插件支持批处理,允许您同时转换或验证多个 PDF 文件以符合 PDF/A 规范。
1var pdfAOptions = new PdfAConvertOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_3B
4};
5
6// 添加多个输入 PDF
7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
9
10// 为转换的 PDF/A 指定输出文件
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
13
14// 处理批量转换
15PdfAConverter.Process(pdfAOptions);主要特点:
- 转换为 PDF/A:无缝将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a,PDF/A-2b,PDF/A-3b),确保符合归档标准。
- 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
- 批处理:一次处理多个文件进行转换或验证。
- 高效工作流程:通过快速可靠的转换过程减少时间和精力。
PDF 转 XLS 转换器
Documentize PDF 转 XLS 转换器 for .NET 是一个通用且强大的工具,用于将 PDF 文档转换为 Excel 电子表格 (XLSX/XLS/CSV/XLSM/ODS)。通过利用此插件,开发人员可以无缝地将静态 PDF 数据转换为动态且可编辑的电子表格,从而简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件 (XLSX),请按照以下步骤操作:
- 使用
PdfToXlsOptions类配置转换设置。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定输出文件路径。 - 执行
Process方法以启动转换。
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.xlsx"));
7// 执行处理
8XlsConverter.Process(options);自定义 PDF 到 Excel 转换
PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 指定 XLS 格式
6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
7options.InsertBlankColumnAtFirst = true;
8options.MinimizeTheNumberOfWorksheets = true;
9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 执行处理
12XlsConverter.Process(options);支持的输出格式
PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:
- XLSX: Office Open XML (.xlsx) 文件格式(默认)。
- XLSM: 启用宏的 Excel 格式。
- CSV: 逗号分隔值。
- ODS: 开放文档电子表格。
- XMLSpreadSheet2003: Excel 2003 XML (.xls) 文件格式。
主要特性:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式:插入空白列或最小化工作表数量。
PDF to DOC Converter
Documentize PDF to DOC Converter for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。该插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使跨多个平台重用、编辑和共享内容变得简单。
如何将PDF转换为DOC/DOCX
要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:
- 创建一个
DocConversionOptions实例以配置转换过程。 - 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法添加结果文件的输出文件路径。 - 运行
Process方法以执行转换。
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.DocX, // 输出格式为DOCX
4 ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
5};
6
7// 添加输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
12
13// 处理转换
14DocConverter.Process(options);使用自定义选项转换PDF到DOC
PDF to DOC Converter 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制PDF在转换过程中的布局和结构处理。
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.Doc, // 输出格式为DOC
4 ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF的布局
5};
6
7// 添加输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
12
13// 处理转换
14DocConverter.Process(options);批量处理PDF到DOC/DOCX转换
PDF to DOC Converter 支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的示例:
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.DocX
4};
5
6// 添加多个输入PDF文件
7options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
8options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
9
10// 添加结果DOCX文件的输出路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
13
14// 处理批量转换
15DocConverter.Process(options);主要特性:
- DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
- 保持格式:在转换过程中保留原始布局、文本和格式。
- 批量处理:一次转换多个PDF文件。
- 自定义转换选项:通过不同模式(如增强流)微调转换过程,以获得更好的布局。
PDF to JPEG Converter
Documentize PDF to JPEG Converter for .NET 是一个强大的工具,简化了将 PDF 文档转换为高质量 JPEG 图像的过程。该插件旨在通过将 PDF 页面转换为广泛使用的图像格式,使您的内容更易于跨平台访问。
如何将 PDF 页面转换为 JPEG
要将 PDF 文档转换为 JPEG 图像,请按照以下步骤操作:
- 创建一个
PdfToJpegOptions实例以配置转换过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法设置 JPEG 图像的输出目录路径。 - 运行
Process方法将 PDF 页面转换为 JPEG 图像。
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8JpegConverter.Process(options);自定义 PDF 转 JPEG 转换
您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以 200 DPI 转换 PDF 的第一页:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 仅处理第一页
4options.PageList = new List<int> { 1 };
5// 设置输出分辨率为 200 DPI
6options.OutputResolution = 200;
7// 设置输出质量为 50
8options.Quality = 50;
9// 添加输入文件路径
10options.AddInput(new FileDataSource("path_to_input.pdf"));
11// 设置输出目录路径
12options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
13// 执行处理
14JpegConverter.Process(options);如何在没有目录的情况下获取结果,或以流的形式获取结果
Process 方法返回一个 ResultContainer 对象,该对象包含有关转换结果的信息。您可以获取转换后 JPEG 文件的流,如下所示:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = JpegConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}主要特性:
- 将 PDF 转换为 JPEG:轻松将整个 PDF 文档或特定页面转换为 JPEG 图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
- 页面集:选择特定页面进行转换。
- 快速转换:快速高效的过程,最小化工作量。
PDF to PNG Converter
Documentize PDF to PNG Converter for .NET 是一个高级工具,允许您将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问和易于共享。
如何将 PDF 转换为 PNG
要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:
- 创建
PdfToPngOptions实例以配置转换过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法设置 PNG 图像的输出目录路径。 - 运行
Process方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8PngConverter.Process(options);自定义 PDF 到 PNG 转换
您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页面:
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions()
3// 仅处理第一页
4options.PageList = new List<int> { 1 };
5// 设置输出分辨率为 200 dpi
6options.OutputResolution = 200;
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行处理
12PngConverter.Process(options);处理转换结果
Process 方法返回一个 ResultContainer 对象,该对象包含有关转换结果的信息。您可以获取转换后 PNG 文件的流,如下所示:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = PngConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}主要特点:
- 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
- 可自定义分辨率:设置所需的 DPI(例如,300 DPI)以获得高质量的图像输出。
- 页面集合:选择特定页面进行转换。
- 轻松输出管理:为每个转换后的 PNG 文件指定输出目录。
- 快速转换:快速、高效,并且配置所需的努力最小。
PDF to TIFF Converter
Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件确保您的内容在各个平台上都可访问,同时保持卓越的保真度和多功能性。 您可以通过调整分辨率、启用多页输出或选择页面来定制转换过程。
如何将 PDF 转换为 TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建
PdfToTiffOptions的实例以配置转换过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定 TIFF 图像的输出文件路径。 - 运行
Process方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8TiffConverter.Process(options);自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置页面
8options.PageList = [1, 3];
9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行处理
12TiffConverter.Process(options);多页 TIFF 创建
PDF to TIFF Converter 插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为一个 TIFF 文件,以便于存档或打印。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 启用多页 TIFF 输出
8options.MultiPage = true;
9// 执行处理
10TiffConverter.Process(options);自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置压缩和色深
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行处理
11TiffConverter.Process(options);如何处理转换结果
Process 方法返回一个 ResultContainer 对象,其中提供有关转换结果的详细信息。您可以获得转换后 TIFF 文件的流,如下所示:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = TiffConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}主要特点:
- 将 PDF 转换为 TIFF:轻松地将整个 PDF 文档或特定页面转换为 TIFF 图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
- 多页 TIFF:将多个 PDF 页面合并为一个多页 TIFF 文件。
- 页面集:选择特定页面进行转换。
- 快速转换:快速有效的处理,付出最少的努力。
PDF Form Flattener
Documentize PDF Form Flattener for .NET 插件旨在将交互式PDF表单转换为不可编辑的文档,确保其免受未经授权的修改。该工具将表单字段转换为静态内容,增强您的PDF文档的安全性。当您需要确保合同、协议或任何必须保持不变的表单字段的文档时,此工具特别有用。
如何在PDF中扁平化表单字段
要在PDF文档中扁平化表单字段,请按照以下步骤操作:
- 创建
FormFlattenerOptions类的实例。 - 将输入和输出文件添加到选项中。
- 调用
Process方法执行扁平化操作。
1// 创建FormFlattenerOptions对象以设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);如何获取PDF中的所有字段
您可以获取文档中包含多少字段的信息。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");如何在PDF中扁平化除了第一个字段以外的所有内容
您可以根据字段的位置或名称等标准选择性地只扁平化特定的表单字段。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
3// 创建FormFlattenerOptions对象以设置指令
4var options = new FormFlattenerOptions();
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 跳过1个字段。
8options.SkipFields.Add(fieldNames[0]);
9// 执行处理
10FormFlattener.Process(options);主要特性:
- 扁平化所有表单字段:将交互式表单字段转换为不可编辑的静态内容。
- 扁平化选定字段:可选择在PDF中扁平化特定字段,同时保留其他字段可编辑。
- 扁平化获取字段名称:获取PDF中的字段名称。