开发者指南
PDF Converter
PDF to HTML
使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,以获得一致、专业的结果。
PDF to HTML
使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,以获得一致、专业的结果。
PDF to DOC
使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。
HTML to PDF
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式,以获得一致、专业的结果。
PDF to JPEG
使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。
PDF to PDF/A
使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。
PDF to PNG
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。
PDF to TIFF
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。
PDF to XLS
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
PDF Extractor
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Images
轻松从 .NET 应用程序中提取 PDF 文档中的图像
Export Form Data
从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV,使用 C# .NET
PDF Manager
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Optimize PDF
使用Documentize的.NET工具轻松优化您的PDF——减小文件大小,提高性能,保持质量
Add Table
使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。
Add TOC
通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航
Use ChatGPT
使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。
PDF Security
Encrypt
使用 Documentize 的 .NET 工具加密您的 PDF 文件,以保护敏感信息。
Decrypt
使用 Documentize 的 .NET 工具解密您的 PDF 文件,以打开文档。
Encrypt
使用 Documentize 的 .NET 工具加密您的 PDF 文件,以保护敏感信息。
Decrypt
使用 Documentize 的 .NET 工具解密您的 PDF 文件,以打开文档。
Sign
使用 Documentize 的 .NET 工具数字签名 PDF 文件——轻松确保安全性、真实性和合规性。
PDF Form
PDF Form Flattener
将交互式 PDF 表单转换为不可编辑的文档,使其免受 unauthorized 修改
PDF Form Flattener
将交互式 PDF 表单转换为不可编辑的文档,使其免受 unauthorized 修改
开发者指南 的子部分
PDF Converter
PDF to HTML
使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,以获得一致、专业的结果。
PDF to DOC
使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。
HTML to PDF
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式,以获得一致、专业的结果。
PDF to JPEG
使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。
PDF to PDF/A
使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。
PDF to PNG
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。
PDF to TIFF
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。
PDF to XLS
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
PDF Converter 的子部分
PDF to HTML
Documentize PDF Converter for .NET 提供强大的文档 PDF 转换为 HTML 格式的功能,适用于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应不同的项目要求。
转换 PDF 为 HTML
将 PDF 文件转换为 HTML,使文档可用于 Web 浏览或集成到更喜欢 HTML 格式的应用程序中。
- 配置选项:使用
PdfToHtmlOptions自定义输出,选择嵌入资源或外部资源。 - 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
PdfConverter的Convert方法来转换文件。
示例:使用嵌入资源将 PDF 转换为 HTML
1// 创建 PdfToHtmlOptions 对象,以将输出数据类型设置为带嵌入资源的文件
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.html"));
7// 执行处理
8PdfConverter.Convert(options);可用于 PDF 转 HTML 转换的选项
- SaveDataType:
FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单个 HTML 文件。FileWithExternalResources: 将资源单独保存,适合大型 HTML 文件。
PDF to DOC
Documentize PDF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为 DOC 或 DOCX 格式。此插件无缝地将 PDF 页面转换为可编辑的 Microsoft Word 文档,使内容在多个平台之间的重用、编辑和共享变得简单。
如何将 PDF 转换为 DOC/DOCX
要将 PDF 文档转换为 DOC/DOCX 格式,请按照以下步骤操作:
- 创建一个
PdfToDocOptions的实例以配置转换过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出文件路径。 - 运行
Convert方法以执行转换。
1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 执行操作
8PdfConverter.Convert(options);使用自定义选项转换 PDF 到 DOC
PDF to DOC Converter 插件提供了多个选项,以自定义您的转换过程。您可以选择不同的模式,以控制在转换过程中 PDF 的布局和结构如何处理。
1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 设置模式
8options.Mode = DocConversionMode.Flow;
9// 执行操作
10PdfConverter.Convert(options);主要特点:
- DOC/DOCX 转换:将 PDF 文档转换为可编辑的 Microsoft Word 格式(DOC 或 DOCX)。
- 保持格式:在转换过程中保留原始布局、文本和格式。
- 自定义转换选项:通过不同模式微调转换过程,例如增强流模式,以获得更好的布局。
HTML to PDF
Documentize PDF Converter for .NET 提供强大的功能,用于在 HTML 和 PDF 格式之间转换文档,非常适合用于 Web 应用程序、归档和报告生成。凭借多种处理资源和布局的选项,转换器能够适应各种项目需求。
将 HTML 转换为 PDF
将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。 要将 HTML 文档转换为 PDF,请按照以下步骤操作:
- 配置选项:使用
HtmlToPdfOptions定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
- 执行转换:运行
PdfConverter的Convert方法以转换文件。
示例:将 HTML 转换为 PDF
1// 创建 HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.html"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.pdf"));
7// 执行过程
8PdfConverter.Convert(options);HTML 转 PDF 转换的其他选项
媒体类型:
HtmlMediaType.Print:适合生成适合打印的 PDF。HtmlMediaType.Screen:在转换为设计用于数字观看的内容时使用。
布局调整:
PageLayoutOption:调整 HTML 内容如何适应 PDF 布局,例如ScaleToPageWidth确保内容缩放到 PDF 宽度。IsRenderToSinglePage:如果需要进行简洁的展示,可启用将整个 HTML 内容呈现在单个 PDF 页面上。
该转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到转换 PDF 文档归档以便于 Web 可访问性。有关更高级的配置,请参考完整的 Documentize 文档。
PDF to JPEG
Documentize PDF Converter for .NET 是一款强大的工具,可以简化PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各平台上更易访问。
如何将PDF页面转换为JPEG
要将PDF文档转换为JPEG图像,请按照以下步骤操作:
- 创建一个
PdfToJpegOptions实例以配置转换过程。 - 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法设置JPEG图像的输出目录路径。 - 运行
Convert方法将PDF页面转换为JPEG图像。
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_input.pdf"));
6// 设置输出目录路径
7options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
8// 执行转换
9PdfConverter.Convert(options); 自定义PDF到JPEG转换
您可以通过调整分辨率、选择页面范围或设置图像质量来定制转换过程。以下是如何以200 DPI转换PDF的第一页:
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 仅处理第一页
5options.PageList = [1];
6// 设置输出分辨率为200 DPI
7options.OutputResolution = 200;
8// 设置输出质量为50
9options.Quality = 50;
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_input.pdf"));
12// 设置输出目录路径
13options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
14// 执行转换
15PdfConverter.Convert(options); 如何在没有目录的情况下获取结果,或以流的形式获取
Convert 方法返回一个 ResultContainer 对象,其中包含有关转换结果的信息。您可以获取已转换JPEG文件的流,如下所示:
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_input.pdf"));
6// 执行转换
7var results = PdfConverter.Convert(options);
8// 获取流结果
9foreach (var result in results.ResultCollection)
10{
11 var streamResultPage1 = result.ToStream();
12} 关键特性:
- 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
- 页面设置:选择特定页面进行转换。
- 快速转换:快速高效的过程,最小化努力。
PDF to PDF/A
Documentize PDF Converter for .NET 是一个强大的工具,旨在将PDF文档转换为PDF/A格式,确保您的内容符合长期归档标准。该插件还支持验证现有PDF文档的PDF/A合规性,提供转换和验证功能于单一解决方案中。
如何将PDF转换为PDF/A
要将PDF文档转换为PDF/A格式,请按照以下步骤操作:
- 创建一个
PdfToPdfAOptions的实例以配置转换。 - 指定所需的PDF/A版本(例如,PDF/A-3B)。
- 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法添加输出PDF/A文件。 - 调用
Convert方法以执行转换。
1// 创建选项类以设置转换过程
2var options = new PdfToPdfAOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// 添加源文件
8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // 替换为您的实际文件路径
9
10// 添加转换后文件保存的路径
11options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
12
13// 运行转换
14PdfConverter.Convert(options);验证PDF/A合规性
您可以使用 PdfAValidateOptions 类验证现有PDF文件的PDF/A合规性。
1// 创建选项类以设置验证过程
2var options = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// 添加要验证的一或多个文件
8options.AddInput(new FileDataSource("path_to_your_first_pdf_file.pdf")); // 替换为您的实际文件路径
9options.AddInput(new FileDataSource("path_to_your_second_pdf_file.pdf"));
10// 根据需要添加更多文件
11
12// 运行验证并获取结果
13var resultContainer = PdfConverter.Validate(options);
14
15// 检查 resultContainer.ResultCollection 属性以获取每个文件的验证结果:
16for (var i = 0; i < resultContainer.ResultCollection.Count; i++)
17{
18 var result = resultContainer.ResultCollection[i];
19 var validationResult = (PdfAValidationResult) result.Data;
20 var isValid = validationResult.IsValid; // 第 i 个文档的验证结果
21}主要功能:
- 转换为PDF/A:将PDF文件无缝转换为PDF/A格式(如PDF/A-1a、PDF/A-2b、PDF/A-3b),以确保符合归档标准。
- 验证PDF/A合规性:检查现有PDF文档是否符合PDF/A标准,并识别不合规的问题。
- 高效工作流程:通过快速可靠的转换过程来最小化时间和精力。
PDF to PNG
Documentize PDF Converter for .NET 是一款先进的工具,可以将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并且更易于分享。
如何将 PDF 转换为 PNG
要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:
- 创建一个
PdfToPngOptions实例以配置转换过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法设置 PNG 图像的输出目录路径。 - 运行
Convert方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);自定义 PDF 到 PNG 转换
您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页:
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 仅处理第一页
4options.PageList = [1];
5// 设置输出分辨率为 200 DPI
6options.OutputResolution = 200;
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行过程
12PdfConverter.Convert(options);处理转换结果
Convert 方法返回一个 ResultContainer 对象,该对象保存有关转换结果的信息。您可以如下获取转换后的 PNG 文件的流:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行过程
6var results = PdfConverter.Convert(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}主要特点:
- 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
- 可自定义的分辨率:设置所需的 DPI(例如,300 DPI)以获取高质量图像输出。
- 页面集:选择特定页面进行转换。
- 简单的输出管理:为每个转换后的 PNG 文件指定输出目录。
- 快速转换:快速、高效,配置所需的努力最小。
PDF to TIFF
Documentize PDF 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件可确保您的内容在各种平台上可访问,同时保持出色的保真度和灵活性。 您可以通过调整分辨率、启用多页输出或选择页面来自定义转换过程。
如何将 PDF 转换为 TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建一个
PdfToTiffOptions实例以配置转换过程。 - 使用
AddInput方法添加输入的 PDF 文件。 - 使用
AddOutput方法指定 TIFF 图像的输出文件路径。 - 运行
Convert方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置页面
8options.PageList = [1, 3];
9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行过程
12PdfConverter.Convert(options);多页 TIFF 创建
该插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为单个 TIFF 文件,以便高效归档或打印。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 启用多页 TIFF 输出
8options.MultiPage = true;
9// 执行过程
10PdfConverter.Convert(options);自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置压缩和色深
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行过程
11PdfConverter.Convert(options);如何处理转换结果
Convert 方法返回一个 ResultContainer 对象,提供有关转换结果的详细信息。您可以获取转换后 TIFF 文件的流,如下所示:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行过程
6var results = PdfConverter.Convert(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}主要特点:
- 将 PDF 转换为 TIFF: 轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
- 自定义分辨率: 调整分辨率(例如,300 dpi)以获得优质输出。
- 多页 TIFF: 将多个 PDF 页面合并为单个多页 TIFF 文件。
- 页面设置: 选择特定页面进行转换。
- 快速转换: 过程快速高效,尽量减少工作量。
PDF to XLS
Documentize PDF Converter for .NET 是一个多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过利用这个插件,开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件(XLSX),请遵循以下步骤:
- 使用
PdfToXlsOptions类配置转换设置。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定输出文件路径。 - 执行
Convert方法以启动转换。
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));
8// 执行处理
9PdfConverter.Convert(options); 自定义 PDF 到 Excel 转换
PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 指定 XLS 格式
7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
8options.InsertBlankColumnAtFirst = true;
9options.MinimizeTheNumberOfWorksheets = true;
10// 设置输出文件路径
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
12// 执行处理
13PdfConverter.Convert(options); 支持的输出格式
PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:
- XLSX:Office Open XML (.xlsx) 文件格式(默认)。
- XLSM:启用宏的 Excel 格式。
- CSV:逗号分隔值。
- ODS:开放文档电子表格。
- XMLSpreadSheet2003:Excel 2003 XML (.xls) 文件格式。
主要特点:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式:插入空白列或最小化工作表数量。
PDF Extractor
Extract Text
使用 Documentize 的 .NET 工具准确提取 PDF 中的文本——轻松检索、处理和分析内容。
Extract Images
轻松从 .NET 应用程序中提取 PDF 文档中的图像
Export Form Data
从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV,使用 C# .NET
PDF Extractor 的子部分
Extract Text
Documentize PDF Extractor for .NET 使从 PDF 文档中提取文本变得简单。无论您需要纯文本、原始文本还是简洁文本,此插件都允许您高效地提取文本,同时根据您的需求保留格式或省略格式。
如何从 PDF 中提取文本
要从 PDF 文档中提取文本,请按照以下步骤操作:
- 创建一个
ExtractTextOptions的实例以配置提取选项。 - 使用
AddInput方法添加输入 PDF 文件。 - 运行
ExtractText方法以提取文本。 - 使用
ResultContainer.ResultCollection访问提取的文本。
1// 创建 ExtractTextOptions 对象以设置指令
2var options = new ExtractTextOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();文本提取模式
ExtractTextOptions 提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取未经格式化的文本,适用于原始数据处理。
- 扁平模式:通过其坐标显示 PDF 内容的定位文本片段。
1// 创建 ExtractTextOptions 对象以设置 TextFormattingMode
2var options = new ExtractTextOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = PdfExtractor.ExtractText(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();主要特性:
- 纯模式:提取文本时保留其原始格式。
- 原始模式:提取文本时不进行任何格式化。
- 扁平模式:提取文本时不带特殊字符或格式。
Extract Images
Documentize PDF Extractor for .NET 插件使您能够轻松地从 PDF 文档中提取图像。它扫描您的 PDF 文件,识别嵌入的图像,并在保持其原始质量和格式的同时提取这些图像。该工具增强了视觉内容的可访问性,并简化了从 PDF 中检索图像的过程。
如何从 PDF 中提取图像
要从 PDF 文件中提取图像,请按照以下步骤操作:
- 创建
ExtractImagesOptions类的实例。 - 使用
AddInput方法将输入文件路径添加到选项中。 - 使用
AddOutput方法设置图像的输出目录路径。 - 使用插件处理图像提取。
- 从结果容器中检索提取的图像。
1// 创建 ExtractImagesOptions 以设置指令
2var options = new ExtractImagesOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// 执行该过程
8var results = PdfExtractor.ExtractImages(options);
9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();从 PDF 文件提取图像到流而不使用文件夹
PdfExtractor 插件支持保存到流,这使您能够从 PDF 文件中提取图像到流,而不使用临时文件夹。
1// 创建 ExtractImagesOptions 以设置指令
2var options = new ExtractImagesOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 不设置输出 - 它将结果写入流
6// 执行该过程
7var results = PdfExtractor.ExtractImages(options);
8// 获取流
9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}关键特点:
- 提取嵌入图像:识别并提取 PDF 文档中的图像。
- 保持图像质量:确保提取的图像保持其原始质量。
- 灵活输出:以您喜欢的格式或位置保存提取的图像。
Export Form Data
Documentize PDF Extractor for .NET 插件提供了一种无缝的方式来从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV。这个动态工具简化了检索表单字段值的过程,便于数据管理、传输和分析。
如何从 PDF 导出表单数据
要将表单数据从 PDF 导出到 CSV,请按照以下步骤操作:
- 创建
ExtractImagesOptions类的实例。 - 使用
FormExporterValuesToCsvOptions类定义导出选项。 - 添加输入 PDF 文件并指定输出 CSV 文件。
- 运行
Process方法以执行导出。
1// 创建 ExtractFormDataToDsvOptions 对象以设置指令
2var options = new ExtractFormDataToDsvOptions(',', true);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// 执行处理
8PdfExtractor.ExtractFormData(options);主要特性:
- 导出表单数据:将 PDF 表单 (AcroForms) 中的数据提取到 CSV 或其他格式。
- 数据过滤:使用谓词根据字段类型或页面号码等标准过滤特定表单字段以便导出。
- 灵活输出:将导出的数据保存以供分析,或转移到电子表格、数据库或其他文档格式。
PDF Manager
Merge PDF
使用 Documentize 的 .NET 工具轻松合并 PDF——将多个文件组合成一个,同时保持质量和结构。
Split PDF
轻松拆分PDF文档,使用Documentize的.NET工具—提取页面、创建新文件,以及精准管理文档
Optimize PDF
使用Documentize的.NET工具轻松优化您的PDF——减小文件大小,提高性能,保持质量
Add Table
使用 Documentize 的 .NET 工具生成专业 PDF 表格—轻松自定义布局、样式和数据。
Add TOC
通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航
Use ChatGPT
使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。
PDF Manager 的子部分
Merge PDF
Documentize PDF 管理器 for .NET 是一个多功能工具,专为将多个 PDF 文档合并为一个文件而设计。它简化了 PDF 文件的整合,确保高效合并文档,并保持内容的一致性。该插件处理内部资源,如字体和图像,以优化合并后的文档。
如何合并 PDF
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建
MergeOptions实例以配置合并过程。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
PdfManager类的Merge方法执行合并。
1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行过程
9PdfManager.Merge(options);如何合并指定页面范围的 PDF
您也可以使用 MergeOptions 类合并输入 PDF 文件中的特定页面范围。这允许您将选定页面组合到最终输出文档中。
- 创建
Merger类的实例。 - 使用
MergeOptions配置页面范围。 - 添加具有指定页面范围的输入文件。
- 设置输出路径。
- 调用
Process方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 合并输入 PDF 的特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行过程
12merger.Process(mergeOptions);如何处理批量合并
PDF Merger 插件经过优化,以处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。
- 实例化
Merger类。 - 将所有输入 PDF 文件添加到
MergeOptions类。 - 指定输出路径。
- 调用
Process方法以合并批处理中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDF 进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);主要特点:
- 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
- 资源优化:合并过程中移除重复的字体和图像。
- 批量处理:一次合并大量 PDF 文档。
Split PDF
Documentize PDF Manager for .NET 是一款强大的工具,可以简化将大型PDF文档拆分为更小、更易管理的文件的过程。无论您是需要提取单独的页面,还是将文档划分为特定的部分,该插件都能高效实现,并且付出最少的努力。
如何拆分PDF
要将PDF文档拆分为单独的页面,请按照以下步骤操作:
- 创建
SplitOptions的实例以配置拆分选项。 - 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法为每个拆分页面添加输出文件。 - 在
PdfManager类中运行Split方法以拆分文档。
1// 创建SplitOptions对象以设置指令
2var options = new SplitOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
8// 执行处理
9PdfManager.Split(options);按页范围拆分PDF
您还可以通过指定页范围来拆分PDF。这允许您将特定部分或多个页面从PDF中提取到单独的文档中。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 定义页范围的输出(例如,页码 1-3)
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
9
10// 处理拆分
11splitter.Process(splitOptions);如何处理批量拆分
PDF Splitter 插件已针对处理大量PDF文档进行了优化。您可以利用批处理将数百个PDF拆分为单独的页面或部分。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 批量添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 定义每个文件的输出
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);主要特性:
- 按页面拆分PDF:将PDF文档拆解为单独的页面。
- 自定义拆分选项:根据您的需求配置拆分过程。
- 整齐的输出:轻松管理每个拆分页面或部分的输出文件。
Optimize PDF
Documentize PDF管理器 for .NET 是一个全面的插件,通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小、旋转页面、裁剪内容和调整文档大小。这些操作改善了PDF文件的质量和可管理性,使存储、共享和查看变得更加容易。
优化PDF
以下步骤演示如何通过减小PDF文档的文件大小而保持质量来优化PDF文档。
- 创建一个OptimizeOptions对象以配置优化设置。
- 添加输入PDF文件,并设置优化后文件的输出位置。
- 运行
PdfManager的Optimize方法以执行优化。
1
2// 创建OptimizeOptions对象以设置指令
3var options = new OptimizeOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9PdfManager.Optimize(options); 旋转PDF
使用RotateOptions类调整PDF文件中页面的方向。
- 创建一个RotateOptions对象并配置旋转角度。
- 添加输入PDF文件并指定输出文件位置。
- 使用SetRotation方法设置旋转角度(例如,90度)。
- 运行
PdfManager的Rotate方法。
1
2// 创建RotateOptions对象以设置指令
3var options = new RotateOptions();
4// 设置新的旋转
5options.Rotation = Rotation.On90;
6// 添加输入文件路径
7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
8// 设置输出文件路径
9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
10// 执行处理
11PdfManager.Rotate(options); 调整PDF大小
要调整PDF文档的大小,可以使用ResizeOptions类指定文档的新页面大小。
- 创建一个ResizeOptions对象以定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用SetPageSize方法指定新大小(例如,A4)。
- 运行
PdfManager的Resize方法。
1
2// 创建ResizeOptions对象以设置指令
3var options = new ResizeOptions();
4// 设置新的页面大小
5options.PageSize = PageSize.A3;
6// 添加输入文件路径
7options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
8// 设置输出文件路径
9options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
10// 执行处理
11PdfManager.Resize(options); 压缩PDF
在可行的情况下,通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来压缩PDF文档。
- 创建一个CompressOptions对象以配置优化设置。
- 添加输入文件并指定输出文件位置。
- 使用SetCropBox方法定义裁剪区域。
- 运行
PdfManager的Compress方法。
1
2// 创建CompressOptions对象以设置指令
3var options = new CompressOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9PdfManager.Compress(options); 主要特点:
- 优化:在不损失质量的情况下减小PDF文件大小。
- 旋转:调整PDF页面的方向。
- 调整大小:将页面调整为特定尺寸(例如,A4、信纸)。
- 压缩:从文档中删除未使用的页面资源和对象。
Add Table
Documentize PDF 管理器 for .NET 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单还是改善文档可读性,这个插件都可以在保持精确和高效的同时简化这一过程。其直观的 API 支持单文档和批量处理工作流,使其成为处理结构化数据的开发人员必不可少的工具。
创建带有表格的 PDF
按照以下步骤使用 TableOptions 类在 PDF 中创建结构化表格:
- 配置
TableOptions对象,以定义表格结构、内容和输入/输出文件。 - 将表格、行和单元格添加到您的 PDF 中。
- 使用
AddTable方法完成表格生成过程。
这里是一个示例:
1// 配置表格选项
2var options = new TableOptions();
3options.InsertPageBefore(1)
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("姓名")
7 .AddCell().AddParagraph("年龄")
8 .AddRow()
9 .AddCell().AddParagraph("鲍勃")
10 .AddCell().AddParagraph("12")
11 .AddRow()
12 .AddCell().AddParagraph("山姆")
13 .AddCell().AddParagraph("20")
14 .AddRow()
15 .AddCell().AddParagraph("桑迪")
16 .AddCell().AddParagraph("26")
17 .AddRow()
18 .AddCell().AddParagraph("汤姆")
19 .AddCell().AddParagraph("12")
20 .AddRow()
21 .AddCell().AddParagraph("吉姆")
22 .AddCell().AddParagraph("27");
23// 添加输入文件路径
24options.AddInput(new FileDataSource("path_to_input.pdf"));
25// 设置输出文件路径
26options.AddOutput(new FileDataSource("path_to_output.pdf"));
27// 执行过程
28PdfManager.AddTable(options);设置表格页码
按照以下步骤在 PDF 中的第 2 页后创建表格: 这里是一个示例:
1var options = new TableOptions();
2options.InsertPageBefore(2) // 在第 2 页之前添加表格
3 .AddTable()
4 .AddRow()
5 .AddCell().AddParagraph("姓名")
6 .AddCell().AddParagraph("年龄")
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_output.pdf"));
11// 执行过程
12PdfManager.AddTable(options);关键特性:
- 动态表格创建:轻松在 PDF 文档中生成结构化表格。
- 页面位置:精确地在 PDF 中的特定位置插入表格。
- 可自定义布局:调整表格结构、单元格对齐和样式。
Add TOC
Documentize PDF Manager for .NET 是一个强大的插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。此插件简化了将 TOC 添加到 PDF 的过程,使文档更易于导航和管理。
如何为 PDF 生成 TOC
要在 PDF 文件中创建目录,按照以下步骤操作:
- 创建一个
TocOptions实例以配置 TOC 生成设置。 - 使用
Title属性设置标题。 - 使用
Headings.Add方法设计 TOC 的标题。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定带有 TOC 的输出 PDF 文件。 - 调用
AddTableOfContents方法生成 TOC。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2));
7options.Headings.Add(new TocHeading("第一章", 3));
8options.Headings.Add(new TocHeading("第二章", 4));
9options.Headings.Add(new TocHeading("第三章", 5));
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 设置输出文件路径
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// 执行该过程
15PdfManager.AddTableOfContents(options);在 PDF 的 TOC 中生成书签
您可以使用 ‘GenerateBookmarks’ 属性来生成书签。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 在书签中生成链接
6options.GenerateBookmarks = true;
7// 设计标题
8options.Headings.Add(new TocHeading("引言", 2, false, 1));
9options.Headings.Add(new TocHeading("第一章", 3, true, 1));
10options.Headings.Add(new TocHeading("第二章", 4, true, 1));
11options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
12options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
13options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
14options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
15options.Headings.Add(new TocHeading("第三章", 5, true, 1));
16// 添加输入文件路径
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 设置输出文件路径
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// 执行该过程
21PdfManager.AddTableOfContents(options);如何将结果作为流获取
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2, false, 1));
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
9// 设置输出流
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// 执行该过程
14PdfManager.AddTableOfContents(options);自定义 TOC 标题
您可以通过修改 TocHeading 类自定义目录标题。例如,您可以使用 ‘GenerateNumbering’ 或手动完成。
用于页面链接的属性 ‘PageNumber’。您还可以使用 Level 属性。
1var heading = new TocHeading();
2heading.Text = "引言";
3heading.PageNumber = 5;
4heading.GenerateNumbering = true;
5heading.Level = 2;
6
7var tocOptions = new TocOptions();
8options.Headings.Add(heading);
9// 添加输入和输出文件
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// 使用自定义选项生成 TOC
14PdfManager.AddTableOfContents(tocOptions);关键特性:
- 动态 TOC 生成:为任何 PDF 文件创建目录,自动根据标题或书签生成条目。
- 自定义:控制 TOC 的外观和结构,包括样式、格式和深度级别。
- 高效工作流程:减少手动创建 TOC 的时间,尤其适用于大型或复杂文档。
Use ChatGPT
Documentize PDF Manager for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。此插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,适合在 PDF 文档中直接创建对话界面或分析报告。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件,请按照以下步骤操作:
- 创建
ChatGptRequestOptions类的实例以配置请求选项。 - 添加输入和输出的 PDF 文件。
- 设置 API 密钥,并指定参数,如最大标记数和 ChatGPT 模型的查询。
- 运行
CreatePdfByChatGptRequestAsync方法以生成聊天完成。
1var options = new ChatGptRequestOptions();
2// 设置输出文件路径
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4options.ApiKey = "您的 API 密钥。"; // 您需要提供密钥以访问 API。
5options.MaxTokens = 1000; // 生成聊天完成的最大标记数。
6
7// 添加请求消息。
8options.Messages.Add(new Message
9{
10 Content = "您是一个有用的助手。",
11 Role = Role.System
12});
13options.Messages.Add(new Message
14{
15 Content = "历史上最大的比萨饼直径是多少?",
16 Role = Role.User
17});
18
19// 处理请求。
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT API 聊天完成对象。添加系统和用户消息
为了创建更互动的对话,您可以同时添加系统消息和用户消息。这些消息有助于塑造对话上下文。
- 添加设置 ChatGPT 上下文的系统消息。
- 添加表示用户输入的用户消息。
1var options = new ChatGptRequestOptions();
2// 设置输出文件路径
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4
5// 添加 PDF 文本源。
6// 如果有多个源,则每个文档中的文本将作为角色为“用户”的单独消息添加到请求消息集合中。
7options.AddInput(new FileDataSource("TextSource.pdf"));
8
9options.ApiKey = "您的 API 密钥。"; // 您需要提供密钥以访问 API。
10options.MaxTokens = 1000; // 生成聊天完成的最大标记数。
11
12// 添加请求消息。
13// 在这种情况下,系统消息的内容为 "您是一个有用的助手。" 默认添加。
14// 查询消息的角色默认是“用户”。
15options.Query = "提供文本中有多少个字母?";
16
17// 处理请求。
18var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
19
20var fileResultPath = result.ResultCollection[0].Data;
21var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // ChatGPT API 聊天完成对象。关键特点:
- 聊天完成:根据自定义输入使用 ChatGPT API 生成响应。
- 系统和用户消息:提供系统上下文和用户输入以创建动态对话。
- PDF 输出:将生成的聊天完成保存到结构化 PDF 文件中以供进一步使用。
- 异步处理:通过异步处理聊天完成确保响应式应用程序。
PDF Security
PDF Security 的子部分
Encrypt
Documentize PDF Security for .NET 是一款强大的工具,旨在通过提供加密、解密和签名功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密,并防止未经授权的访问。
如何加密 PDF
要加密 PDF 文档,请按照以下步骤操作:
- 创建
EncryptOptions的实例,设置所需的用户和拥有者密码。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
PdfSecurity类的Encrypt方法执行加密。
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);主要特点:
- 加密 PDF 文档:通过添加用户和拥有者密码来保护您的 PDF 文件。
- 自动化:将加密和解密集成到您的 .NET 应用程序中,以实现自动化工作流程。
- 合规性:确保您的文档符合行业标准的文档安全性。
Decrypt
Documentize PDF Security for .NET 是一款强大的工具,旨在通过提供加密、解密和签名功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密,并保护免受未经授权的访问。
如何解密 PDF
要解密 PDF 文档,请按照以下步骤进行操作:
- 创建
DecryptionOptions的实例,并提供必要的密码。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法添加输出 PDF 文件。 - 使用
PdfSecurity类的Decrypt方法执行解密。
1// 创建 DecryptOptions 对象以设置指令
2var options = new DecryptOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行过程
8PdfSecurity.Decrypt(options);主要特点:
- 解密 PDF 文档:在需要时去除 PDF 的加密。
- 自动化:将加密和解密集成到您的 .NET 应用程序中,以实现自动化工作流。
- 合规性:确保您的文档符合行业标准的文档安全性。
Sign
Documentize PDF Security for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了一个简化的流程来添加签名,确保真实性并保护 PDF 内容。该插件支持可见和不可见签名,并提供选项自定义签名的位置、原因、联系信息等。
如何签署 PDF 文档
要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:
- 使用 PFX 文件路径和密码实例化
SignOptions类。 - 将输入 PDF 和输出文件添加到选项中。
- 运行
Sign方法以应用签名。
1// 创建 SignOptions 对象以设置指令
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行该过程
8PdfSecurity.Sign(options);如何使用流处理 PFX 文件
您还可以使用作为流提供的 PFX 证书来签署 PDF,而不是文件路径。这允许更灵活地处理证书存储。
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行该过程
6PdfSecurity.Sign(options);如何应用不可见签名
要添加不可见签名(一种在文档上不显示签名的安全文档),只需将 Visible 属性设置为 false。
- 创建
SignOptions的实例。 - 将
Visible设置为false。 - 添加输入和输出文件。
- 调用
Sign以应用不可见签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置不可见签名
5signOptions.Visible = false;
6// 执行该过程
7PdfSecurity.Sign(options);如何在 PDF 文档的签名中使用额外选项
您可以在向 PFX 文件添加签名时使用额外选项,如原因、联系方式、位置、页码。
- 使用 PFX 文件路径和密码实例化
SignOptions类。 - 将输入 PDF 和输出文件添加到选项中。
- 设置选项的值。
- 运行
Sign方法以应用签名。
1// 创建 SignOptions 对象以设置指令
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 可选参数
8options.Reason = "my Reason";
9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// 执行该过程
13PdfSecurity.Sign(options);如何向 PDF 添加时间戳
要向 PDF 文档添加安全时间戳,请按照以下步骤进行:
- 创建
AddTimestampOptions的实例 以配置时间戳处理。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput设置输出文件路径。 - 使用
Sign方法执行时间戳处理。
1// 创建 SignOptions 对象以设置指令
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行该过程
9PdfSecurity.Sign(options);如何使用时间戳服务器的自定义身份验证
您可以在连接到时间戳服务器时提供基本身份验证凭据。这允许您与需要用户名和密码的服务器进行身份验证。
1// 使用身份验证配置时间戳选项
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");主要特点:
- 数字签署 PDF 文档:使用可见或不可见的数字签名来保护您的文档。
- PFX 支持:使用 PFX 证书签署 PDF 文件。
- 可自定义选项:配置签名设置,如原因、位置和联系方式。
- 可见和不可见签名:选择签名是否在文档上可见。
- 可自定义的时间戳服务器:使用自定义时间戳服务器 URL 和身份验证凭据。
PDF Form
PDF Form Flattener
将交互式 PDF 表单转换为不可编辑的文档,使其免受 unauthorized 修改
PDF Form 的子部分
PDF Form Flattener
Documentize PDF Form Flattener for .NET 插件旨在将交互式 PDF 表单转换为不可编辑的文档,使其免受 unauthorized 修改。该工具将表单字段转变为静态内容,提高您 PDF 文档的安全性。特别适用于需要保护合同、协议或任何必须保持不变的表单字段的文档。
如何在 PDF 中展平表单字段
要在 PDF 文档中展平表单字段,请按照以下步骤进行:
- 创建
FormFlattenerOptions类的实例。 - 将输入和输出文件添加到选项中。
- 调用
Process方法执行展平操作。
1// 创建 FormFlattenerOptions 对象设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);如何获取 PDF 中的所有字段
您可以获取文档中包含多少个字段的信息。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");如何在 PDF 中展平除第一个字段外的所有内容
您可以根据字段的位置或名称等标准选择性地展平特定的表单字段。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
3// 创建 FormFlattenerOptions 对象设置指令
4var options = new FormFlattenerOptions();
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 跳过 1 个字段。
8options.SkipFields.Add(fieldNames[0]);
9// 执行处理
10FormFlattener.Process(options);主要特性:
- 展平所有表单字段:将交互式表单字段转换为不可编辑的静态内容。
- 选择性展平字段:可选择性地展平 PDF 中的特定字段,同时保持其他字段可编辑。
- 获取字段名称:获取 PDF 中的字段名称。