概述

Documentize 是一个综合平台,为 .NET 应用程序提供管理 PDF 文档的 SDK。这些 SDK 简化了与 PDF 处理相关的复杂任务,提升了文档工作流程,使用户的操作更加直观和高效。以下是其主要功能的概述:

核心功能

  • PDF 转换

    • 将 PDF 转换为多种格式,如 Microsoft Word (DOC/DOCX)、Excel (XLS/XLSX)、HTML、JPEG 和 PNG。
    • 支持将 PDF 转换为 PDF/A 格式,适合长期存档和符合保存标准。
  • 文档操作

    • 合并和拆分 PDF:轻松将多个 PDF 文件合并或将大型文档分割成较小、更易管理的部分。
    • 优化 PDF:压缩和增强 PDF 文档,减小文件大小而不影响内容质量。
  • 文本提取

    • 以精确的方式提取文本,支持结构化和非结构化数据格式。
  • 数字签名

    • 对 PDF 文档进行数字签名,以确保其真实性和完整性,为敏感文件提供安全性和可信度。

专用 SDK

  • PDF 到 DOC 转换器:准确地将 PDF 内容转换为可编辑的 Word 文档,同时保持格式和布局。
  • PDF 到 Excel 转换器:从 PDF 中提取表格数据并转换为 Excel 电子表格,以便进行进一步的数据分析。
  • ChatGPT 集成:启用与 ChatGPT 的互动,在 PDF 中嵌入对话式 AI 响应,以增强文档的独特性。

使用与兼容性

Documentize SDK 专为无缝集成到 .NET 应用程序 而构建,支持包括 WindowsmacOSLinux 在内的多个平台。SDK 提供灵活且强大的 API,满足多样化的文档处理需求,同时确保高性能和可靠性。

有关 SDK 的更多详细信息及其在您项目中的集成,请访问 官方网站

概述 的子部分

安装

Documentize SDK 可以通过多种方法安装,适用于不同的开发环境和偏好。以下是推荐的安装 Documentize 的方法:

1. NuGet(首选方法)

NuGet 是安装 Documentize 最直接和首选的方法,确保您始终在开发环境中拥有最新版本和更新。有关此安装方法的更多详细信息,请查看 如何使用 NuGet 安装 Documentize SDK

2. MSI 安装程序

如果您希望将 Documentize DLL 直接安装到系统中,MSI 安装程序是一个方便的选项。此方法非常适合那些可能希望在多个项目中使用 Documentize 的开发者,而无需手动管理 DLL 文件。有关此安装方法的更多详细信息,请查看 如何使用 MSI 安装 Documentize SDK

3. ZIP 压缩文件

对于喜欢手动操作的开发者,ZIP 压缩文件包含 Documentize DLL,可以提取并直接添加到您的项目中。有关此安装方法的更多详细信息,请查看 如何使用 ZIP 安装 Documentize SDK

2024年12月28日

安装 的子部分

系统要求

Documentize SDK 旨在与 .NET 应用程序集成,并支持多种操作系统和开发环境。以下是主要的系统要求:

支持的操作系统

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 到 Windows Server 2022 (x64, x86)
  • :Microsoft Azure

macOS

  • macOS 10.12 (Sierra) 及更高版本

Linux

  • 兼容多种 Linux 发行版:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • 支持 Android 8.0 (Oreo) 及更高版本。

开发环境

  • Microsoft Visual Studio
    • Visual Studio 2010 及更高版本(包括 2019 和 2022)
  • 支持针对 .NET 平台的任何开发环境。

支持的 .NET 框架

  • .NET Framework 4.0 及更高版本
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

附加说明

  • Adobe Acrobat 不是 运行 Documentize SDK 所需,但建议用于查看 PDF 文件。
2024年12月28日

声明

Documentize.com SDKs 在 .NET 应用程序中使用时需要 完全信任 权限集。此权限级别对于 SDK 执行某些系统级操作至关重要,例如访问注册表设置、系统文件和解析字体。

为什么需要完全信任

Documentize SDK 利用核心 .NET 系统类,这些类通常需要更高的权限,原因如下:

  • 注册表访问: 某些操作可能需要读取或写入系统注册表。
  • 系统文件: 访问超出应用程序虚拟目录的系统文件可能是某些任务所必需的,例如处理字体或执行文件操作。

中等信任环境的限制

在强制 中等信任 安全的托管环境中,几个重要权限受到限制或不可用。这可能会阻止 SDK 在此类环境中正常运行。以下限制适用于 中等信任

  • OleDbPermission:无法使用 ADO.NET 托管的 OLE DB 数据提供程序访问数据库。
  • EventLogPermission:禁止访问 Windows 事件日志。
  • ReflectionPermission:防止使用反射,这可能影响某些动态操作。
  • RegistryPermission:拒绝访问系统注册表。
  • WebPermission:通信仅限于 <trust> 元素中配置的预定义地址或范围。
  • FileIOPermission:对文件的访问仅限于应用程序的虚拟目录中的文件。
2024年12月28日

非Windows环境

Documentize SDK支持**.NET Standard 2.0**,这使它们可以在Linux或其他非Windows环境中运行的.NET Core应用程序中使用。为了确保最佳性能和正确的文本呈现,请按照以下步骤操作:

Linux推荐设置

1. 安装libgdiplus软件包

这个软件包提供必要的GDI+功能,对于呈现和处理PDF至关重要。您可以通过在终端中运行以下命令来安装它:

sudo apt-get install libgdiplus

2. 安装Microsoft兼容字体

为了正确的文本呈现,请使用以下命令安装Microsoft TrueType字体:

sudo apt-get install ttf-mscorefonts-installer

这些字体应放置在/usr/share/fonts/truetype/msttcorefonts目录中。如果您的系统将字体存储在不同的目录中,请在进行Documentize SDK操作之前更新代码中的路径:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));

提示

通过确保这些安装完成并正确配置字体路径,您可以在Linux或其他非Windows系统上最大化Documentize SDK的性能。

2024年12月28日

评估

您可以轻松下载 Documentize SDK 进行评估。评估版与购买版完全相同,唯一的区别在于许可证的应用方式。

评估版限制

尽管评估版提供对所有功能的完全访问权限,但在应用许可证之前,它包含以下限制:

  • 所有输出文档中插入评估水印。
  • 任何 PDF 文档的前四页仅可以查看或编辑。

要移除这些限制并解锁完整版,只需通过向项目中添加几行代码来应用许可证。

2024年12月28日

开发者指南

PDF安全性

使用C# .NET加密和解密PDF文档

PDF 表格生成器

轻松生成 PDF 文档中的结构化表格,理想用于组织数据、创建交互式表单及增强内容可读性。

PDF优化器

减小文件大小,旋转页面,裁剪内容,调整文档大小

PDF 合并器

使用 C# .NET 将多个 PDF 文档合并为一个文件

PDF签名

.NET插件提供简化的签名添加流程,确保真实性并保护PDF内容

PDF 分割器

.NET 工具,简化将大型 PDF 文档拆分为更小、更易管理的文件的过程

PDF ChatGPT

将 ChatGPT API 集成到 .NET PDF 应用程序

PDF文本提取器

.NET插件允许您高效提取文本,同时根据您的需求保留格式或省略格式

PDF 时间戳添加器

使用 C# .NET 为您的 PDF 文档添加安全时间戳

PDF/A 转换器

.NET 插件将 PDF 文档转换为 PDF/A 格式,确保您的内容仍符合长期归档标准

PDF转XLS转换器

借助Documentize强大的.NET插件,轻松将PDF文档转换为Excel电子表格(XLS/XLSX)。

PDF转DOC转换器

.NET工具允许将PDF文档转换为DOC或DOCX格式

PDF转JPEG转换器

.NET插件简化了将PDF文档转换为高质量JPEG图像的过程

PDF转PNG转换器

.NET插件允许您将PDF文档转换为高质量的PNG图像

PDF 转 TIFF 转换器

.NET 插件简化 PDF 文档转换为高质量 TIFF 图像

HTML 转换器

Documentize HTML 转换器 PDF 到 HTML 和 HTML 到 PDF 功能的全面指南。

2024年10月10日

开发者指南 的子部分

PDF安全性

Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的PDF文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。

关键功能:

  • 加密PDF文档:通过添加用户和所有者密码,保护您的PDF文件。
  • 解密PDF文档:在需要时去除PDF文件的加密。
  • 设置权限:控制打印、复制和修改内容等权限。
  • 自动化:将加密和解密集成到您的.NET应用程序中,以实现自动化工作流程。
  • 合规性:确保您的文档符合行业标准的文档安全性。

如何加密PDF文档

要加密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 创建EncryptionOptions的实例,并设置所需的用户和所有者密码。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行加密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置加密选项
 5var opt = new EncryptionOptions("user_password", "owner_password");
 6
 7// 添加输入PDF文件
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// 指定输出加密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// 执行加密处理
14plugin.Process(opt);

如何解密PDF文档

要解密PDF文档,请按照以下步骤操作:

  1. 创建Security类的实例。
  2. 创建DecryptionOptions的实例,并提供必要的密码。
  3. 使用AddInput方法添加加密的PDF文件。
  4. 使用AddOutput设置输出文件路径。
  5. 使用Process方法执行解密。
 1// 实例化Security插件
 2var plugin = new Security();
 3
 4// 配置解密选项
 5var opt = new DecryptionOptions("user_password");
 6
 7// 添加输入加密PDF文件
 8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
 9
10// 指定输出解密后的PDF文件
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// 执行解密处理
14plugin.Process(opt);

设置PDF文档的权限

在加密PDF时,您可以设置各种权限以控制文档的使用方式。

  • 打印:允许或禁止打印文档。
  • 复制:允许或禁止复制内容。
  • 修改:允许或禁止对文档的修改。

要设置权限,您可以相应地配置EncryptionOptions

PDF 表格生成器

.NET 的 Documentize 表格生成器 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论是组织数据、设计表单还是改善文档可读性, هذا 插件都可以在保持精确性和效率的同时简化流程。它直观的 API 支持单个文档和批处理工作流,使其成为处理结构化数据的开发者必备工具。

主要特点:

  • 动态表格创建:轻松生成 PDF 文档中的结构化表格。
  • 丰富的内容支持:使用文本、HTML、图像和 LaTeX 内容填充表格。
  • 页面放置:精确地在 PDF 中的特定位置插入表格。
  • 可定制的布局:调整表格结构、单元格对齐和样式。
  • 批处理:同时处理多个文档以实现最大效率。

使用表格创建 PDF

按照以下步骤使用 TableGenerator 类在 PDF 中创建结构化表格:

  1. 实例化 TableGenerator 类。
  2. 配置 TableOptions 对象以定义表格结构、内容和输入/输出文件。
  3. 向 PDF 添加表格、行和单元格。
  4. 使用 Process 方法完成表格生成过程。

以下是一个示例:

 1var generator = new TableGenerator();
 2var options = new TableOptions();
 3
 4// 指定输入和输出 PDF 文件
 5options.AddInput(new FileDataSource("input.pdf"));
 6options.AddOutput(new FileDataSource("output.pdf"));
 7
 8// 定义一个包含行和单元格的表格
 9options
10    .InsertPageAfter(1) // 在第一页后添加表格
11    .AddTable()
12        .AddRow()
13            .AddCell().AddParagraph(new TextFragment("单元格 1"))
14            .AddCell().AddParagraph(new TextFragment("单元格 2"))
15            .AddCell().AddParagraph(new TextFragment("单元格 3"));
16
17// 在文档中生成表格
18generator.Process(options);

向表格添加丰富内容

PDF 文档中的表格可以包含多种内容类型,以增强其功能和外观。下面是向表格单元格添加 HTML 内容的示例:

1options
2    .AddTable()
3        .AddRow()
4            .AddCell().AddParagraph(new HtmlFragment("<h1>标题 1</h1>"))
5            .AddCell().AddParagraph(new HtmlFragment("<h2>标题 2</h2>"))
6            .AddCell().AddParagraph(new HtmlFragment("<h3>标题 3</h3>"));

表格中支持的内容类型

PDF 表格生成器 支持多种内容类型,使开发者能够根据各种用例自定义表格:

  • HtmlFragment:添加基于 HTML 的内容,如标题、列表和格式化文本。
  • TeXFragment:包含用于数学公式和科学计数法的 LaTeX 内容。
  • TextFragment:插入普通或格式化文本。
  • Image:将图像直接嵌入表格单元格中。

定制表格布局和结构

该插件提供了调整表格结构的灵活性,包括行高、列宽和单元格对齐。这些定制选项允许您设计与文档的布局和样式需求相匹配的表格。

处理表格生成

在添加所有内容并定制表格结构之后,通过调用 Process 方法完成该过程。此方法生成表格并更新 PDF 文档。以下是处理结果的方法:

1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);

PDF 表格生成器的用例

  1. 数据报告:以清晰有序的格式呈现分析、财务报告或调查结果。
  2. 表单设计:创建具有结构化表格布局的交互式表单。
  3. 文档增强:改善用户手册、指南或教学材料的可读性和可用性。
  4. 批处理:自动生成多个 PDF 文档的表格。

PDF优化器

Documentize PDF优化器 是一个综合插件,通过高级优化技术增强PDF文档。它的设计旨在帮助减小文件大小,旋转页面,裁剪内容,并调整文档大小。这些操作改善了PDF文件的质量和可管理性,使得它们更容易存储、分享和查看。

主要特性:

  • 优化:减小PDF文件大小而不损失质量。
  • 旋转:调整PDF页面的方向。
  • 裁剪:去除文档中不必要的边距或内容。
  • 调整大小:将页面调整为特定尺寸(例如,A4,Letter)。

优化PDF文档

以下步骤演示如何优化PDF文档,通过减小文件大小而保持质量。

  1. 创建Optimizer类的实例。
  2. 创建OptimizeOptions对象以配置优化设置。
  3. 添加输入PDF文件,并设置优化后文件的输出位置。
  4. 运行Process方法以执行优化。
1  
2var optimizer = new Optimizer();  
3var optimizeOptions = new OptimizeOptions();  
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));  
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));  
6optimizer.Process(optimizeOptions);  

调整PDF文档大小

要调整PDF文档的大小,使用ResizeOptions类来指定文档的新页面大小。

  1. 实例化Optimizer类。
  2. 创建ResizeOptions对象以定义页面大小。
  3. 添加输入文件并设置所需的输出位置。
  4. 使用SetPageSize方法指定新大小(例如,A4)。
  5. 调用Process方法以应用更改。
1  
2var optimizer = new Optimizer();  
3var resizeOptions = new ResizeOptions();  
4resizeOptions.AddInput(new FileDataSource("input.pdf"));  
5resizeOptions.SetPageSize(PageSize.A4);  
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(resizeOptions);  

旋转PDF页面

使用RotateOptions类来调整PDF文件中页面的方向。

  1. 实例化Optimizer类。
  2. 创建RotateOptions对象并配置旋转角度。
  3. 添加输入PDF文件并指定输出文件位置。
  4. 使用SetRotation方法设置旋转角度(例如,90度)。
  5. 使用Process方法执行旋转。
1  
2var optimizer = new Optimizer();  
3var rotateOptions = new RotateOptions();  
4rotateOptions.AddInput(new FileDataSource("input.pdf"));  
5rotateOptions.SetRotation(90);  
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(rotateOptions);  

裁剪PDF文档

裁剪去除PDF文档中不必要的内容或边距。可以使用CropOptions类来定义裁剪区域。

  1. 创建Optimizer类的实例。
  2. 使用CropOptions对象定义裁剪区域。
  3. 添加输入文件并指定输出文件位置。
  4. 使用SetCropBox方法定义裁剪区域。
  5. 使用Process方法执行裁剪。
1  
2var optimizer = new Optimizer();  
3var cropOptions = new CropOptions();  
4cropOptions.AddInput(new FileDataSource("input.pdf"));  
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域  
6cropOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(cropOptions);  

PDF 合并器

Documentize PDF 合并器 for .NET 是一款多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效地合并,并且在内容上保持一致。该插件处理内部资源,如字体和图像,以优化合并后的文档。

主要特性:

  • 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
  • 资源优化:合并过程中删除重复的字体和图像。
  • 批量处理:一次性合并大量的 PDF 文档。
  • 安全合并:确保文档完整性,无数据丢失或内容损坏。

如何合并 PDF 文档

要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:

  1. 创建 Merger 类的实例。
  2. 创建 MergeOptions 类的实例以配置合并过程。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 设置输出文件路径。
  5. 使用 Process 方法执行合并。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加要合并的输入 PDF 文件
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF
13merger.Process(mergeOptions);

如何合并带页码范围的 PDF

您还可以使用 MergeOptions 类合并输入 PDF 文件中的特定页码范围。这使您可以将选定的页面合并到最终输出文档中。

  1. 创建 Merger 类的实例。
  2. 使用 MergeOptions 配置页码范围。
  3. 添加带有指定页码范围的输入文件。
  4. 设置输出路径。
  5. 调用 Process 方法。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 合并输入 PDF 的特定页面
 5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
 7
 8// 指定输出文件路径
 9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF
12merger.Process(mergeOptions);

如何处理批量合并

PDF 合并器 插件经过优化,以处理大量 PDF 文档。通过利用批量处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。

  1. 实例化 Merger 类。
  2. 将所有输入 PDF 文件添加到 MergeOptions 类。
  3. 指定输出路径。
  4. 调用 Process 方法以合并批量中的所有文件。
 1var merger = new Merger();
 2var mergeOptions = new MergeOptions();
 3
 4// 添加大量 PDF 进行合并
 5for (int i = 1; i <= 100; i++)
 6{
 7    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
 8}
 9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);

PDF签名

Documentize PDF Signature for .NET 插件允许用户对PDF文档进行数字签名。它提供了一种简化的流程来添加签名,确保真实性,并保护PDF内容。该插件支持可见和不可见签名,并提供自定义签名位置、原因、联系信息等选项。

主要特点:

  • 数字签名PDF文档:使用可见或不可见的数字签名保护您的文档。
  • PFX支持:使用PFX证书对PDF文件进行签名。
  • 可自定义选项:配置签名设置,如原因、位置和联系信息。
  • 可见和不可见签名:选择签名是否在文档上可见。

如何签署PDF文档

要使用PFX文件签署PDF文档,请按照以下步骤操作:

  1. 创建Signature类的实例。
  2. 使用PFX文件路径和密码实例化SignOptions类。
  3. 将输入PDF和输出文件添加到选项中。
  4. 运行Process方法以应用签名。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 添加输入PDF并指定输出文件  
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 8
 9// 配置签名选项  
10signOptions.Reason = "合同协议";  
11signOptions.Contact = "johndoe@example.com";  
12signOptions.Location = "纽约";  
13signOptions.PageNumber = 1;  
14signOptions.Visible = true;  
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);  
16
17// 将签名应用于文档  
18signature.Process(signOptions);  

如何使用PFX文件流

您还可以使用作为流提供的PFX证书而不是文件路径来签名PDF。这允许更灵活地处理证书存储。

  1. 创建Signature类的实例。
  2. 用包含PFX及密码的流实例化SignOptions
  3. 添加输入和输出文件。
  4. 运行Process方法以应用签名。
 1  
 2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");  
 3var signature = new Signature();  
 4var signOptions = new SignOptions(pfxStream, "pfxPassword");  
 5
 6// 添加输入和输出文件  
 7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 9
10// 应用签名  
11signature.Process(signOptions);  

如何应用不可见签名

要添加一个不可见的签名(即保护文档而不在文档上显示签名),只需将Visible属性设置为false

  1. 创建SignOptions的实例。
  2. Visible设置为false
  3. 添加输入和输出文件。
  4. 调用Process以应用不可见签名。
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4
 5// 配置不可见签名  
 6signOptions.Visible = false;  
 7
 8// 添加输入和输出文件  
 9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));  
11
12// 处理签名  
13signature.Process(signOptions);  

PDF 分割器

Documentize PDF 分割器 for .NET 是一个强大的工具,简化了将大型 PDF 文档拆分为更小、更易管理文件的过程。无论您是需要提取单独的页面还是将文档划分为特定部分,这个插件都可以让您高效地实现,并且付出最少的努力。

主要特点:

  • 按页面拆分 PDF:将 PDF 文档拆分为单独的页面。
  • 批量处理:一次性拆分大量 PDF。
  • 自定义拆分选项:根据您的需求配置拆分过程。
  • 有序输出:轻松管理每个拆分页面或部分的输出文件。

如何拆分 PDF 文档

要将 PDF 文档拆分为单独的页面,请按照以下步骤操作:

  1. 创建 Splitter 类的实例。
  2. 创建 SplitOptions 的实例以配置拆分选项。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 方法为每个拆分页面添加输出文件。
  5. 运行 Process 方法以拆分文档。
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 添加输入 PDF 文件  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面指定输出文件  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12
13// 处理拆分操作  
14splitter.Process(splitOptions);  

按页面范围拆分 PDF

您还可以通过指定页面范围来拆分 PDF。这使您能够从 PDF 中提取特定部分或多个页面到单独的文档中。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 添加输入 PDF  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为页面范围定义输出(例如:页面 1-3)  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10
11// 处理拆分  
12splitter.Process(splitOptions);  

如何处理批量拆分

PDF 分割器 插件已优化以处理大量 PDF 文档。您可以利用批量处理将数百个 PDF 拆分为单独的页面或部分。

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// 批量添加输入 PDF 文件  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 为每个文件定义输出  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12
13// 处理批量拆分  
14splitter.Process(splitOptions);  

PDF ChatGPT

Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 集成到 PDF 应用程序中。该插件允许开发者根据输入消息生成聊天响应,并将输出以 PDF 格式保存,非常适合在 PDF 文档中直接创建对话接口或分析报告。

主要特点:

  • 聊天补全:根据自定义输入使用 ChatGPT API 生成响应。
  • 系统和用户消息:提供系统上下文和用户输入,以创建动态对话。
  • PDF 输出:将生成的聊天补全保存为结构化 PDF 文件以供进一步使用。
  • 异步处理:通过异步处理聊天补全,确保应用程序的响应能力。

生成聊天响应

要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:

  1. 创建 PdfChatGptRequestOptions 类的实例以配置请求选项。
  2. 添加输入和输出 PDF 文件。
  3. 设置 API 密钥并指定参数,如最大令牌数和 ChatGPT 模型的查询。
  4. 运行 ProcessAsync 方法生成聊天补全。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4options.MaxTokens = 1000;  // 设置最大令牌数  
 5options.Query = "分析此文本的关键主题。";  
 6
 7// 添加输入 PDF 文件  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// 指定保存包含聊天回复的输出 PDF 的位置  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// 创建 PdfChatGpt 插件的实例  
14var plugin = new PdfChatGpt();  
15
16// 异步运行该过程  
17var result = await plugin.ProcessAsync(options);  

添加系统和用户消息

要创建更具交互性的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。

  1. 添加设置 ChatGPT 上下文的系统消息。
  2. 添加表示用户输入的用户消息以进行对话。
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // 设置您的 API 密钥  
 4
 5// 添加上下文的系统消息  
 6options.AddSystemMessage("您是一个经过训练的 AI,用于总结文本。");  
 7
 8// 添加用户消息以查询 ChatGPT 模型  
 9options.AddUserMessage("请总结附加的文档。");  
10
11// 添加输入和输出 PDF  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// 异步处理请求  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDF文本提取器

Documentize PDF文本提取器 for .NET 简化了从PDF文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,此插件都允许您高效提取文本,同时根据需求保留格式或省略格式。

关键功能:

  • 纯模式:提取文本时保留其原始格式。
  • 原始模式:提取时不保留任何格式。
  • 简单模式:提取文本时不包含特殊字符或格式。
  • 批量处理:一次从多个PDF中提取文本。

如何从PDF文档中提取文本

要从PDF文档中提取文本,请按照以下步骤操作:

  1. 创建 TextExtractor 类的实例。
  2. 创建 TextExtractorOptions 的实例以配置提取选项。
  3. 使用 AddInput 方法添加输入PDF文件。
  4. 运行 Process 方法提取文本。
  5. 使用 ResultContainer.ResultCollection 访问提取的文本。
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 处理文本提取
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// 打印提取的文本
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

从多个PDF中提取文本

该插件允许您同时从多个PDF中提取文本,确保快速和高效的处理。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加多个输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// 处理提取
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 输出提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

文本提取模式

TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。

  1. 纯模式:保留原始格式,包括空格和对齐。
  2. 原始模式:提取不带格式的文本,适用于原始数据处理。
  3. 简单模式:提取文本时不包含特殊字符或附加格式。
1var textExtractorOptions = new TextExtractorOptions();
2
3// 设置为纯模式
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 处理和输出
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

如何处理批量处理

对于大型文档集,您可以利用批量处理,使您能够一次从多个PDF中提取文本。

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// 添加多个输入PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// 为每个文件定义输出
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 处理提取的文本
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

PDF 时间戳添加器

Documentize PDF 时间戳添加器 for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。

主要特点:

  • 添加安全时间戳:轻松为您的 PDF 文档添加安全时间戳。
  • 可定制的时间戳服务器:使用自定义的时间戳服务器 URL 和身份验证凭据。
  • 自动化:将时间戳功能集成到您的 .NET 应用程序中,实现自动化工作流程。
  • 合规性:确保您的文档符合数字签名和时间戳的行业标准。

如何为 PDF 文档添加时间戳

要为 PDF 文档添加安全时间戳,请按照以下步骤操作:

  1. 创建 Timestamp 类的实例。
  2. 创建 AddTimestampOptions 实例,以配置时间戳处理过程。
  3. 使用 AddInput 方法添加输入 PDF 文件。
  4. 使用 AddOutput 设置输出文件路径。
  5. 使用 Process 方法执行时间戳处理。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");  
 7
 8// 添加输入 PDF 文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出 PDF 文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

如何使用带有时间戳服务器的自定义身份验证

在连接到时间戳服务器时,您可以提供基本身份验证凭据。这使您能够对需要用户名和密码的服务器进行身份验证。

  1. 创建 Timestamp 类的实例。
  2. 创建 AddTimestampOptions 实例,包括 serverBasicAuthCredentials
  3. 添加输入文件和输出文件路径。
  4. 调用 Process 方法。
 1  
 2// 实例化时间戳插件  
 3var plugin = new Timestamp();  
 4
 5// 使用身份验证配置时间戳选项  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");  
 7
 8// 添加输入 PDF 文件  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// 指定输出 PDF 文件  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// 执行时间戳处理  
15plugin.Process(opt);  

处理 PFX 文件和密码

AddTimestampOptions 类允许您使用 PFX 文件进行数字签名,并提供密码。

  • PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
  • 密码保护:确保您安全管理 PFX 文件的密码。

PDF/A 转换器

Documentize PDF/A 转换器 for .NET 是一个强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 标准,提供转换和验证功能于一体的解决方案。

关键特性:

  • 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(例如 PDF/A-1a、PDF/A-2b、PDF/A-3b)以确保符合归档标准。
  • 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
  • 批量处理:同时处理多个文件进行转换或验证。
  • 高效工作流程:通过快速可靠的转换过程减少时间和精力。

如何将 PDF 转换为 PDF/A

要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤进行:

  1. 创建 PdfAConverter 类的实例。
  2. 创建 PdfAConvertOptions 实例以配置转换。
  3. 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
  4. 使用 AddInput 方法添加输入 PDF 文件。
  5. 使用 AddOutput 方法添加生成的 PDF/A 输出文件。
  6. 调用 Process 方法以执行转换。
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 添加输入 PDF 文件  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 指定输出的 PDF/A 文件  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13
14// 处理转换  
15pdfAConverter.Process(pdfAOptions);  

验证 PDF/A 合规性

您可以使用 PdfAValidateOptions 类验证现有 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7
 8// 添加待验证的 PDF 文件  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// 运行验证过程  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13
14// 检查验证结果  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);  

PDF/A 转换的批量处理

该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// 添加多个输入 PDF  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// 指定转换后的 PDF/A 输出文件  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15
16// 处理批量转换  
17pdfAConverter.Process(pdfAOptions);  

PDF转XLS转换器

Documentize PDF转XLS转换器 for .NET 是一款多功能且强大的工具,用于将PDF文档转换为Excel电子表格(XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态PDF数据转换为动态且可编辑的电子表格,从而简化数据处理、分析和共享。

主要特点:

  • 灵活的转换选项:将PDF文件转换为XLSX、XLS、CSV或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 可定制的输出:配置页面范围、工作表名称和输出格式。
  • 批量处理:同时处理多个PDF文件,实现高效。
  • 高级格式化:插入空白列或减少工作表数量。

如何将PDF转换为Excel

要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤进行:

  1. 创建XlsConverter类的实例。
  2. 使用PdfToXlsOptions类配置转换设置。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定输出文件路径。
  5. 执行Process方法以启动转换。
 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加输入和输出文件路径  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// 执行转换  
10converter.Process(options);  

自定义PDF转Excel转换

PdfToXlsOptions类允许您自定义转换过程。例如,要将PDF转换为XLSX文件,设置工作表名称,并启用高级格式化选项:

 1  
 2var options = new PdfToXlsOptions  
 3{  
 4    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // 指定XLSX格式  
 5    WorksheetName = "MySheet",                    // 命名工作表  
 6    InsertBlankColumnAtFirst = true               // 在开头插入一列空白  
 7};  
 8
 9// 添加输入和输出文件  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
12
13// 处理转换  
14converter.Process(options);  

批量处理PDF到XLS转换

通过批量处理,您可以一次性将多个PDF文件转换为Excel电子表格。以下是一个示例:

 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加多个输入文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 指定输出文件路径  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// 执行批量转换  
14converter.Process(options);  

处理转换结果

转换过程中,Process方法将返回一个ResultContainer对象,其中包含操作的详细信息。以下是如何检索转换后的文件路径:

1  
2var resultContainer = converter.Process(options);  
3
4// 访问输出文件路径  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine("转换后的文件路径: " + result.Data.ToString());  

支持的输出格式

PdfToXlsOptions.ExcelFormat枚举提供多种输出格式:

  • XLSX:Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM:宏启用Excel格式。
  • CSV:逗号分隔值。
  • ODS:开放文档电子表格。
  • XMLSpreadSheet2003:Excel 2003 XML格式。

PDF转DOC转换器

Documentize PDF转DOC转换器 for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。这个插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和分享。

主要特性:

  • DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
  • 保持格式:在转换过程中保留原始布局、文本和格式。
  • 批量处理:一次转换多个PDF文件。
  • 自定义转换选项:通过不同模式(如增强流模式)微调转换过程,以获得更好的布局。

如何将PDF转换为DOC/DOCX

要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:

  1. 创建DocConverter类的实例。
  2. 创建DocConversionOptions实例以配置转换过程。
  3. 使用AddInput方法添加输入的PDF文件。
  4. 使用AddOutput方法添加生成的DOC/DOCX文件的输出路径。
  5. 运行Process方法以执行转换。
 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // 输出格式为DOCX
 5    ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15docConverter.Process(options);

使用自定义选项将PDF转换为DOC

PDF转DOC转换器插件提供多种选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中如何处理PDF的布局和结构。

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // 输出格式为DOC
 5    ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
 6};
 7
 8// 添加输入PDF文件
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15docConverter.Process(options);

批量处理PDF到DOC/DOCX转换

PDF转DOC转换器支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的一个示例:

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// 添加多个输入PDF文件
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加生成的DOCX文件的输出路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16docConverter.Process(options);

PDF转JPEG转换器

Documentize PDF转JPEG转换器 for .NET 是一个强大的工具,简化了将PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各种平台上更加可访问。

主要特性:

  • 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
  • 页面范围:选择要转换的特定页面或范围。
  • 批量处理:一次转换多个PDF页面或整个文档。
  • 快速转换:高效快速的过程,几乎不需要额外的努力。

如何将PDF页面转换为JPEG

要将PDF文档转换为JPEG图像,请按照以下步骤操作:

  1. 创建Jpeg类的实例。
  2. 创建JpegOptions的实例以配置转换过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定JPEG图像的输出文件路径。
  5. 运行Process方法将PDF页面转换为JPEG图像。
 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 指定JPEG图像的输出目录  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// 处理PDF到JPEG的转换  
12converter.Process(options);  

自定义PDF到JPEG的转换

您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以300 dpi转换PDF的第一页:

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 设置输出分辨率为300 dpi,仅转换第一页  
 6options.OutputResolution = 300;  
 7options.PageRange = new PageRange(1);  
 8
 9// 添加输入和输出路径  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
12
13// 处理转换  
14converter.Process(options);  

PDF到JPEG转换的批量处理

PDF转JPEG转换器插件支持批量处理,允许您将PDF的多个页面转换为单独的JPEG文件。

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面设置输出路径  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));  
11
12// 处理批量转换  
13converter.Process(options);  

如何处理转换结果

Process方法返回一个ResultContainer对象,该对象包含有关转换结果的信息。您可以打印转换后JPEG文件的路径,如下所示:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// 打印JPEG图像的输出路径  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDF转PNG转换器

Documentize PDF转PNG转换器 for .NET 是一个先进的工具,允许您将PDF文档转换为高质量的PNG图像。该插件旨在通过将PDF页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并更易于共享。

关键特性:

  • 将PDF转换为PNG:快速有效地将整个PDF文档或特定页面转换为PNG图像。
  • 可自定义分辨率:设置所需的DPI(例如,300 DPI)以获得高质量的图像输出。
  • 批处理:一次转换多个PDF页面或整个文档。
  • 轻松的输出管理:为每个转换后的PNG文件指定输出目录。
  • 快速转换:快速、高效,配置所需的努力最小。

如何将PDF转换为PNG

要将PDF文档转换为PNG图像,请按照以下步骤操作:

  1. 创建Png类的实例。
  2. 创建PngOptions的实例以配置转换过程。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定PNG图像的输出目录。
  5. 运行Process方法将PDF页面转换为PNG图像。
 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
 7
 8// 指定PNG图像的输出目录  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// 处理PDF到PNG的转换  
12converter.Process(options);  

自定义PDF到PNG的转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以300 DPI仅转换PDF的第一页:

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 设置输出分辨率为300 DPI  
 6options.OutputResolution = 300;  
 7
 8// 仅转换第一页  
 9options.PageRange = new PageRange(1);  
10
11// 添加输入和输出路径  
12options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
14
15// 处理转换  
16converter.Process(options);  

PDF到PNG的批处理

PDF转PNG转换器插件还支持批处理,允许您将多个页面甚至整个PDF文档转换为单独的PNG文件。

 1  
 2var converter = new Png();  
 3var options = new PngOptions();  
 4
 5// 添加输入PDF文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// 为每个页面设置输出路径  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));  
11
12// 处理批量转换  
13converter.Process(options);  

处理转换结果

处理完转换后,Process方法返回一个ResultContainer对象,包含转换结果。您可以按如下方式打印PNG图像的输出路径:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// 打印PNG图像的输出路径  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

PDF 转 TIFF 转换器

Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。该插件确保您的内容在各种平台上均可访问,同时保持出色的保真度和灵活性。

主要特点:

  • 将 PDF 转换为 TIFF:轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
  • 多页 TIFF:将多个 PDF 页面合并为单个多页 TIFF 文件。
  • 页面范围:转换特定页面或范围,以实现精确结果。
  • 批处理:一次性转换多个 PDF 文档或页面。
  • 快速转换:快速高效的过程,最小努力即可完成。

如何将 PDF 页面转换为 TIFF

要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:

  1. 创建 TiffConverter 类的实例。
  2. 创建 PdfToTiffOptions 的实例以配置转换过程。
  3. 使用 AddInput 方法添加输入的 PDF 文件。
  4. 使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
  5. 运行 Process 方法将 PDF 页面转换为 TIFF 图像。
 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 添加输入的 PDF 文件
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 指定 TIFF 图像的输出文件
 8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
 9
10// 处理 PDF 到 TIFF 的转换
11converter.Process(options);

自定义 PDF 到 TIFF 转换

您可以通过调整分辨率、启用多页输出或选择页面范围来自定义转换过程。以下是如何将 PDF 的第一页以 300 dpi 转换为 TIFF 文件:

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 将输出分辨率设置为 300 dpi 并仅转换第一页
 5options.OutputResolution = 300;
 6options.PageList = new List<int> { 1 };
 7
 8// 添加输入和输出路径
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// 处理转换
13converter.Process(options);

多页 TIFF 创建

PDF to TIFF Converter 插件支持多页 TIFF 生成,使您能够将多个 PDF 页面合并为一个 TIFF 文件,以便高效存档或打印。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions
 3{
 4    MultiPage = true // 启用多页 TIFF 输出
 5};
 6
 7// 添加输入的 PDF 文件
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// 指定多页 TIFF 的输出文件
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// 处理转换
14converter.Process(options);

PDF 到 TIFF 转换的批处理

PDF to TIFF Converter 插件还支持批处理,允许您同时将多个 PDF 页面或整个文档转换为单独的 TIFF 文件。

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// 添加输入的 PDF 文件
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// 为各个页面设置输出路径
 8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// 处理批转换
12converter.Process(options);

如何处理转换结果

Process 方法返回一个 ResultContainer 对象,其中提供了关于转换结果的详细信息。您可以打印转换后的 TIFF 文件的路径,如下所示:

1ResultContainer resultContainer = converter.Process(options);
2
3// 打印 TIFF 图像的输出路径
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6    Console.WriteLine(result.Data.ToString());
7}

HTML 转换器

Documentize HTML 转换器 for .NET 提供了强大的文档转换功能,可以在 PDF 和 HTML 格式之间转换,适合于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应各种项目需求。

主要特点

PDF 到 HTML 转换

将 PDF 文件转换为 HTML,使文档可供基于 Web 的查看或集成到首选 HTML 格式的应用程序中。

HTML 到 PDF 转换

将 HTML 内容转变为高质量的 PDF,适用于生成可打印的报告、归档 Web 内容或创建可共享的文档格式。


详细指南

将 PDF 转换为 HTML

要将 PDF 转换为 HTML:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 设置转换选项:使用 PdfToHtmlOptions 自定义输出,选择内嵌资源或外部资源。
  3. 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
  4. 执行转换:调用 Process 方法以转换文件。

示例:将 PDF 转换为带内嵌资源的 HTML

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 PDF 到 HTML 转换的选项  
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.pdf"));  
options.AddOutput(new FileDataSource("output.html"));  

// 第四步:运行转换  
converter.Process(options);  

PDF 到 HTML 转换的可用选项

  • SaveDataType

    • FileWithEmbeddedResources:生成一个包含所有内嵌资源的单一 HTML 文件。
    • FileWithExternalResources:单独保存资源,适用于大型 HTML 文件。
  • 输出自定义

    • BasePath:设置 HTML 文档中资源的基础路径。
    • IsRenderToSinglePage:可选择将所有 PDF 内容呈现在单个 HTML 页面上。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF,请按以下步骤操作:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 配置 PDF 选项:使用 HtmlToPdfOptions 定义布局和媒体设置。
  3. 指定路径:设置输入 HTML 和输出 PDF 文件路径。
  4. 执行转换:运行 Process 方法以完成转换。

示例:将 HTML 转换为 PDF

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 HTML 到 PDF 转换的选项  
var options = new HtmlToPdfOptions();  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.html"));  
options.AddOutput(new FileDataSource("output.pdf"));  

// 第四步:执行转换  
converter.Process(options);  

HTML 到 PDF 转换的其他选项

  • 媒体类型

    • HtmlMediaType.Print:适合生成适合打印的 PDF。
    • HtmlMediaType.Screen:在转换为数字查看设计的内容时使用。
  • 布局调整

    • PageLayoutOption:调整 HTML 内容在 PDF 布局中的适配方式,例如 ScaleToPageWidth 可确保内容比例适应 PDF 的宽度。
    • IsRenderToSinglePage:如果需要简洁的演示,启用在单个 PDF 页面上呈现整个 HTML 内容。

这个转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到将 PDF 文档归档转换为 Web 可访问格式。有关更高级的配置,请参考完整的 Documentize 文档。

常见问题解答

此常见问题解答提供有关 Documentize .NET 插件 的全面信息,涵盖 PDF 转换、表单处理和目录生成 (TOC) 等功能和特性。


常见问题

1. 什么是 Documentize for .NET?

Documentize for .NET 是一个强大的库,用于以编程方式管理和处理 PDF 文档。它包括用于将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成 TOC 以及确保 PDF/A 合规性以用于长期存档的插件。

2. 如何安装 Documentize 的 .NET 插件?

您可以通过从官方网站下载程序集文件或直接从 NuGet 获取包的方式安装 Documentize 插件。每个插件的文档中都有详细的安装说明。


PDF 转换插件

3. 如何将 PDF 文档转换为 Word (DOC/DOCX) 文件?

要使用 PDF to DOC 转换器 将 PDF 文档转换为 Word 格式:

  1. 实例化 PdfDoc 类。
  2. 创建 PdfToDocOptions 对象以配置转换选项。
  3. 添加输入 PDF 和输出 DOC/DOCX 文件路径。
  4. 调用 Process 方法以执行转换。

4. 如何将 PDF 页面转换为 JPEG 图像?

使用 PDF to JPEG 转换器

  1. 创建 Jpeg 类的实例。
  2. 通过 JpegOptions 设置转换选项(例如,分辨率、页码范围)。
  3. 添加输入/输出文件路径。
  4. 调用 Jpeg.Process 方法进行转换。

5. 如何将 PDF 转换为 PNG?

要将 PDF 转换为 PNG 格式:

  1. 创建 Png 类的实例和一个 PngOptions 对象。
  2. 添加输入 PDF 并指定输出文件夹。
  3. 设置选项,例如分辨率(例如,300 DPI)。
  4. 调用 Process 方法生成 PNG 图像。

6. 如何将 PDF 转换为 Excel (XLS/XLSX)?

要将 PDF 转换为 Excel:

  1. 实例化 PdfXls 类。
  2. 使用 PdfToXlsOptions 配置输入/输出路径和转换选项。
  3. 调用 Process 方法开始转换。

7. 如何将 PDF 转换为 HTML?

要将 PDF 文档转换为 HTML:

  1. 创建 PdfHtml 类的实例。
  2. 使用 PdfToHtmlOptionsHtmlToPdfOptions 配置转换选项。
  3. 添加输入/输出路径并调用 Process 方法。

PDF 表单处理

8. 如何使用表单编辑器编辑 PDF 表单?

PDF 表单编辑器 提供以下功能:

  • 添加字段 (FormEditorAddOptions)。
  • 更新字段 (FormEditorSetOptions)。
  • 移除字段 (FormRemoveSelectedFieldsOptions)。
    配置完表单字段后,运行 Process 方法。

9. 如何将 PDF 表单扁平化?

扁平化表单字段:

  1. 实例化 FormFlattener 类。
  2. 使用 FormFlattenAllFieldsOptions 扁平化所有字段,或使用 FormFlattenSelectedFieldsOptions 针对特定字段。
  3. 添加输入/输出文件并调用 Process 方法。

10. 如何从 PDF 表单导出数据?

要导出表单数据,使用 PDF 表单导出器。创建一个 FormExporterValuesToCsvOptions 对象,指定表单字段条件,并运行 Process 方法将数据导出为 CSV 格式。


PDF/A 和 TOC 管理

11. 如何将 PDF 转换为 PDF/A 格式?

要将 PDF 转换为 PDF/A:

  1. 使用 PdfAConverter 类。
  2. PdfAConvertOptions 中配置 PDF/A 版本(例如,PDF/A-3B)。
  3. 添加输入/输出路径并调用 Process 方法。

12. 如何在 PDF 中生成目录 (TOC)?

要创建 TOC:

  1. 创建 TocGenerator 类的实例。
  2. 使用 TocOptions 定义 TOC 参数。
  3. 添加输入/输出文件并运行 Process 方法。

签名处理

13. 如何对 PDF 文档进行数字签名?

要添加数字签名:

  1. 实例化 Signature 类。
  2. 使用 SignOptions 配置 PFX 文件、密码和签名详细信息(例如,原因、联系方式)。
  3. 添加输入/输出文件并运行 Process 方法。

其他功能

14. 我可以使用 Documentize 拆分 PDF 文件吗?

是的,使用 PDF 拆分器

  1. 实例化 Splitter 类。
  2. 使用 SplitOptions 配置拆分选项。
  3. 添加输入/输出路径并调用 Process 方法。

15. 如何将多个 PDF 文件合并为一个?

要合并 PDF:

  1. 实例化 Merger 类。
  2. 添加输入 PDF 并通过 MergeOptions 指定输出文件。
  3. 运行 Process 方法以合并文件。

16. Documentize 是否仅限于处理 PDF?

虽然 Documentize 主要专注于 PDF 操作,但它也支持转换为 DOC、XLS、HTML、JPEG 和 PNG 等格式。


许可和兼容性

17. 使用 Documentize 插件的系统要求是什么?

Documentize 支持:

  • 操作系统:Windows 7-11、Windows Server 2003-2022、macOS (10.12+) 和 Linux。
  • 框架:.NET Framework 4.0 到 8.0。
  • IDE:与各种版本的 Visual Studio 兼容。

18. 如何为 Documentize 设置许可密钥?

要激活插件,请在项目中引用 Documentize 并在调用任何方法之前设置许可密钥。有关详细说明,请参考特定插件的文档。

19. 哪里可以找到更多 Documentize 插件的示例和文档?

完整的 API 文档和示例可以在 Documentize 网站上或通过开发环境中的 NuGet 包找到。


 中文