安装 的子部分
系统要求
Documentize SDK 旨在与 .NET 应用程序集成,并支持多种操作系统和开发环境。以下是主要系统要求:
支持的操作系统
Windows
- Windows 7 (x64, x86)
- Windows 8, 8.1 (x64, x86)
- Windows 10 (x64, x86)
- Windows 11 (x64, x86)
- Windows Server 2003 到 Windows Server 2022 (x64, x86)
- 云: Microsoft Azure
macOS
- macOS 10.12 (Sierra) 及更高版本
Linux
- 兼容多种 Linux 发行版:
- Ubuntu (16.04, 18.04, 20.04, 22.04)
- CentOS (7, 8)
- Debian (9, 10)
- OpenSUSE (Leap 15+, SLES 12+)
Android
- 支持 Android 8.0 (Oreo) 及更高版本。
开发环境
- Microsoft Visual Studio:
- Visual Studio 2010 及更高版本(包括 2019 和 2022)
- 支持任何以 .NET 平台为目标的开发环境。
支持的 .NET 框架
- .NET Framework 4.0 及更高版本
- .NET Standard 2.0 (.NET Core 3.1+)
- .NET 6.0, .NET 7.0, .NET 8.0
其他说明
- 运行 Documentize SDK 不需要 Adobe Acrobat,但建议使用 Adobe Acrobat 查看 PDF 文件。
声明
Documentize.com SDK 在 .NET 应用程序中使用时需要完全信任权限集。此权限级别对于 SDK 执行某些系统级操作至关重要,例如访问注册表设置、系统文件和解析字体。
为什么需要完全信任
Documentize SDK 利用核心 .NET 系统类,这些类通常需要提升的权限,原因如下:
- 注册表访问:某些操作可能需要读取或写入系统注册表。
- 系统文件:访问超出应用程序虚拟目录的系统文件可能对于某些任务是必要的,例如处理字体或执行文件操作。
中级信任环境的限制
在强制执行中级信任安全的托管环境中,几个重要权限受到限制或不可用。这可能会阻止 SDK 在此类环境中正常运行。在中级信任下适用以下限制:
- OleDbPermission:不能使用 ADO.NET 管理的 OLE DB 数据提供程序来访问数据库。
- EventLogPermission:禁止访问 Windows 事件日志。
- ReflectionPermission:阻止使用反射,这可能会影响某些动态操作。
- RegistryPermission:拒绝访问系统注册表。
- WebPermission:通信限制在
<trust>
元素中配置的预定义地址或范围内。 - FileIOPermission:对文件的访问限制在应用程序的虚拟目录内。
Non-Windows Environment
Documentize SDKs 支持 .NET Standard 2.0,这使得它们可以在运行于Linux或其他非Windows环境的.NET Core应用程序中使用。为了确保最佳性能和正确的文本渲染,请按照以下步骤操作:
推荐的Linux设置
1. 安装libgdiplus包
该包提供必要的GDI+功能,这对于渲染和处理PDF至关重要。您可以在终端中运行以下命令进行安装:
sudo apt-get install libgdiplus
2. 安装微软兼容字体
为了正确渲染文本,请使用以下命令安装微软的TrueType字体:
sudo apt-get install ttf-mscorefonts-installer
这些字体应放置在 /usr/share/fonts/truetype/msttcorefonts
目录中。如果您的系统将字体存储在其他目录中,请在对Documentize SDKs执行任何操作之前,更新代码中的路径:
Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));
提示
通过确保这些安装完成并正确配置字体路径,您可以最大化Documentize SDKs在Linux或其他非Windows系统上的性能。
License and Evaluation
评估 Documentize for .NET
当您开始使用 Documentize 产品时,可以立即使用免费的评估许可证。此许可证允许开发人员和企业在购买之前探索、测试并将 Documentize 功能集成到他们的应用程序中。
什么是评估许可证?
评估许可证是每个 Documentize 产品中包含的内置无限期试用模式。它使您能够访问大多数核心功能,以便您可以在现实场景中充分评估产品的能力。无论您是在生成、编辑还是转换文档,都可以测试与您的技术栈的性能和集成。
评估许可证的关键特性
- ✅ 无需安装 – 只需下载并开始使用 Documentize 产品。
- 🧪 探索核心功能 – 测试文档转换、操作和导出等基本功能。
- 💻 面向开发者 – 适合概念验证 (POC)、集成测试或技术评估。
- 🔁 易于升级 – 随时切换到完整许可证,而无需更改您的实现。
如果您想升级到完整许可证,需要添加以下代码:
License.Set("path_to_your_license_file.lic");
评估模式的限制
虽然评估许可证提供广泛访问权限,但有一些限制旨在保护许可的产品:
- 所生成的 PDF 文档中的所有页面都有水印。
- 在评估版本中,您只能处理文档的前四页。
- 评估许可证不适用于生产或商业部署。
要获取没有限制的完全访问权限,您需要购买有效的 Documentize 许可证并在您的项目中应用它。
如何开始使用评估许可证
无需特殊设置。只需下载您想要的 Documentize SDK,并开始使用。如果未应用许可证文件,产品将自动以评估模式运行。
要测试有效许可证的行为,您也可以请求临时完整功能许可证以进行深入评估。
何时使用评估许可证
如果您满足以下条件,应使用评估许可证:
- 您第一次探索 Documentize 的功能。
- 您想确认与您的应用程序或平台的兼容性。
- 您需要在购买之前构建原型或概念验证。
- 您正在比较文档自动化解决方案。
今天就开始使用 Documentize
无风险评估 Documentize 产品,看看它们如何提升您的文档工作流程。当您准备好进入生产阶段时,升级到完整许可证的过程既快速又无缝。
📘 需要帮助吗?访问我们的文档或联系我们以获得帮助。
开发者指南
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF,或将 PDF 转换为 HTML—保持布局和格式,以确保一致的专业结果。
使用 Documentize 的 .NET 工具轻松加密、解密和设置权限,以保护敏感信息.
使用 Documentize 的 .NET 工具轻松优化您的 PDF——减小文件大小、提升性能并保持质量
使用 Documentize 的 .NET 工具轻松合并 PDFs——将多个文件合并为一个,同时保持质量和结构。
使用 Documentize 的 .NET 工具生成专业的 PDF 表格——轻松自定义布局、样式和数据。
.NET 插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航
使用 Documentize 的 .NET 工具数字签署 PDF——轻松确保安全、真实性和合规性。
使用Documentize的.NET工具轻松拆分PDF——提取页面、创建新文件并精确管理文档
使用 Documentize 的 ChatGPT 集成增强您的 PDF——智能生成、编辑和分析内容。
轻松地从.NET应用程序中提取PDF文档中的图像
使用 Documentize 的 .NET 工具准确提取 PDF 中文本——轻松检索、处理和分析内容。
使用 Documentize 的 .NET 工具向 PDF 添加时间戳——自动插入日期和时间,以增强文档跟踪。
使用 Documentize 的 .NET 工具将 PDF 转换为 PDF/A 格式——轻松确保长期归档和合规性。
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
使用Documentize的.NET工具将PDF转换为Word文档——保留格式和结构以便于编辑。
使用 Documentize 的 .NET 工具将 PDF 转换为 JPEG 图像——轻松提取文档中的高质量图像。
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取高质量图像以用于网页和图形。
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业文档管理。
将交互式PDF表单转换为不可编辑的文档,使其免受未经授权的修改
开发者指南 的子部分
HTML Converter
Documentize HTML Converter for .NET 提供强大的文档转换功能,支持 PDF 和 HTML 格式之间的转换,非常适合 Web 应用程序、归档和报告生成。具有多种处理资源和布局的选项,该转换器可适应各种项目需求。
PDF 转 HTML 转换
将 PDF 文件转换为 HTML,以使文档可用于基于 Web 的查看或集成到 HTML 格式优先的应用程序中。
HTML 转 PDF 转换
将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。
将 PDF 转换为 HTML
要将 PDF 转换为 HTML:
- 配置选项: 使用
PdfToHtmlOptions
自定义输出,选择嵌入式或外部资源。 - 定义输入和输出路径: 设置输入 PDF 和输出 HTML 的路径。
- 执行转换: 调用
HtmlConverter
的 Process
方法以转换文件。
示例:将 PDF 转换为带嵌入式资源的 HTML
1// 步骤 1: 配置 PDF 转 HTML 转换的选项
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);
PDF 转 HTML 转换的可用选项
- SaveDataType:
FileWithEmbeddedResources
: 生成一个包含所有嵌入资源的单一 HTML 文件。FileWithExternalResources
: 将资源单独保存,适用于大型 HTML 文件。
将 HTML 转换为 PDF
要将 HTML 文档转换为 PDF,请按照以下步骤操作:
- 配置选项: 使用
HtmlToPdfOptions
定义布局和媒体设置。 - 指定路径: 设置输入 HTML 和输出 PDF 文件路径。
- 执行转换: 运行
HtmlConverter
的 Process
方法以转换文件。
示例:将 HTML 转换为 PDF
1// 步骤 1: 配置 HTML 转 PDF 转换的选项
2var options = new HtmlToPdfOptions();
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);
HTML 转 PDF 转换的附加选项
媒体类型:
HtmlMediaType.Print
: 适合生成适合打印的 PDF。HtmlMediaType.Screen
: 在转换为为数字观看而设计的内容时使用。
布局调整:
PageLayoutOption
: 调整 HTML 内容适应 PDF 布局的方式,例如 ScaleToPageWidth
确保内容缩放到 PDF 宽度。IsRenderToSinglePage
: 启用在需要简明呈现时将整个 HTML 内容呈现到单个 PDF 页面。
该转换器在多种应用程序中非常灵活,从基于 Web 的内容生成 PDF报告,到转换 PDF 文档归档以实现 Web 可访问性。有关更多高级配置,请参阅完整的 Documentize 文档。
PDF Security
Documentize PDF Security for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强您的 PDF 文档的安全性。它确保您的敏感信息保持机密,并受到未授权访问的保护。
如何加密 PDF
要加密 PDF 文档,请按照以下步骤操作:
- 创建
EncryptionOptions
的实例,并设置所需的用户和所有者密码。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加输出 PDF 文件。 - 使用
Security
类的 Process
方法执行加密。
1// 创建 EncryptionOptions 对象以设置指令
2var options = new EncryptionOptions("123456", "qwerty");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);
如何解密 PDF
要解密 PDF 文档,请按照以下步骤操作:
- 创建
DecryptionOptions
的实例,并设置必要的密码。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加输出 PDF 文件。 - 使用
Security
类的 Process
方法执行解密。
1// 创建 DecryptionOptions 对象以设置指令
2var options = new DecryptionOptions("123456");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Security.Process(options);
主要特点:
- 加密 PDF 文档:通过添加用户和所有者密码来保护您的 PDF 文件。
- 解密 PDF 文档:在需要时移除 PDF 的加密。
- 自动化:将加密和解密集成到您的 .NET 应用程序中,以实现自动化工作流程。
- 合规性:确保您的文档符合行业标准的文档安全性。
PDF Optimizer
Documentize PDF Optimizer 是一个全面的插件,通过先进的优化技术增强 PDF 文档。它旨在帮助减少文件大小、旋转页面、裁剪内容和调整文档尺寸。这些操作可以提高 PDF 文件的质量和可管理性,使其更易于存储、共享和查看。
优化 PDF
以下步骤演示了如何通过减少文件大小同时保持质量来优化 PDF 文档。
- 创建一个 OptimizeOptions 对象以配置优化设置。
- 添加输入 PDF 文件并设置优化文件的输出位置。
- 运行
Optimizer
的 Process
方法以执行优化。
1// 创建 OptimizeOptions 对象以设置指令
2var options = new OptimizeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);
旋转 PDF
使用 RotateOptions 类来调整 PDF 文件中页面的方向。
- 创建一个 RotateOptions 对象并配置旋转角度。
- 添加输入 PDF 文件并指定输出文件位置。
- 使用 SetRotation 方法设置旋转角度(例如,90 度)。
- 运行
Optimizer
的 Process
方法。
1// 创建 RotateOptions 对象以设置指令
2var options = new RotateOptions();
3// 设置新的旋转
4options.Rotation = Rotation.On90;
5// 添加输入文件路径
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// 设置输出文件路径
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// 执行处理
10Optimizer.Process(options);
调整 PDF 尺寸
要调整 PDF 文档的大小,可以使用 ResizeOptions 类来指定文档的新页面大小。
- 创建一个 ResizeOptions 对象以定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用 SetPageSize 方法指定新尺寸(例如,A4)。
- 运行
Optimizer
的 Process
方法。
1// 创建 ResizeOptions 对象以设置指令
2var options = new ResizeOptions();
3// 设置新的页面尺寸
4options.PageSize = PageSize.A3;
5// 添加输入文件路径
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// 设置输出文件路径
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// 执行处理
10Optimizer.Process(options);
压缩 PDF
通过消除未使用的页面资源、合并相同的资产和丢弃冗余对象来在可行的情况下压缩 PDF 文档。
- 创建一个 CompressOptions 对象以配置优化设置。
- 添加输入文件并指定输出文件位置。
- 使用 SetCropBox 方法定义裁剪区域。
- 运行
Optimizer
的 Process
方法。
1// 创建 CompressOptions 对象以设置指令
2var options = new CompressOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Optimizer.Process(options);
主要特点:
- 优化:在不损失质量的情况下减少 PDF 文件大小。
- 旋转:调整 PDF 页面的方向。
- 调整大小:将页面调整为特定尺寸(例如,A4、Letter)。
- 压缩:从文档中删除未使用的页面资源和对象。
PDF Merger
Documentize PDF Merger for .NET 是一个多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档能够高效合并并保持内容的一致性。该插件处理内部资源,例如字体和图像,以优化合并后的文档。
如何合并 PDF
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建一个
MergeOptions
的实例以配置合并过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加输出 PDF 文件。 - 使用
Merger
类的 Process
方法执行合并。
1// 创建 MergeOptions 对象以设置指令
2var options = new MergeOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// 执行处理
9Merger.Process(options);
如何合并具有页面范围的 PDFs
您还可以使用 MergeOptions
类从输入 PDF 文件中合并特定的页面范围。这允许您将所选页面合并到最终输出文档中。
- 创建
Merger
类的实例。 - 使用
MergeOptions
配置页面范围。 - 添加具有指定页面范围的输入文件。
- 设置输出路径。
- 调用
Process
方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 从输入 PDFs 中合并特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 执行处理
12merger.Process(mergeOptions);
如何处理批量合并
PDF Merger 插件经过优化,能够处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,确保高效和快速的文档管理。
- 实例化
Merger
类。 - 将所有输入 PDF 文件添加到
MergeOptions
类中。 - 指定输出路径。
- 调用
Process
方法以合并批量中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDFs 进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);
主要特点:
- 合并多个 PDFs:轻松将多个 PDF 文件合并为一个。
- 资源优化:合并过程中移除重复的字体和图像。
- 批量处理:一次性合并大量 PDF 文档。
PDF Table Generator
Documentize Table Generator for .NET 是一个多功能插件,旨在简化将表格集成到 PDF 文档中的过程。无论您是在组织数据、设计表单,还是提高文档的可读性,该插件都能在保持精确和高效的同时简化过程。其直观的 API 支持单个文档和批处理工作流,使其成为处理结构化数据的开发者必备工具。
创建包含表格的 PDF
按照以下步骤使用 TableGenerator
类在 PDF 中创建结构化表格:
- 配置
TableOptions
对象以定义表格结构、内容和输入/输出文件。 - 将表格、行和单元格添加到您的 PDF。
- 使用
Process
方法完成表格生成过程。
这里是一个示例:
1var options = new TableOptions();
2
3// 指定输入和输出 PDF 文件
4options.AddInput(new FileDataSource("input.pdf"));
5options.AddOutput(new FileDataSource("output.pdf"));
6
7// 定义包含行和单元格的表格
8options
9 .InsertPageBefore(1) // 在第一页之前添加表格
10 .AddTable()
11 .AddRow()
12 .AddCell().AddParagraph("Cell 1")
13 .AddCell().AddParagraph("Cell 2")
14 .AddCell().AddParagraph("Cell 3");
15
16// 在文档中生成表格
17TableGenerator.Process(options);
设置表格的页码
按照以下步骤在 PDF 中的第 2 页之后创建表格:
这里是一个示例:
1var options = new TableOptions();
2
3// 指定输入和输出 PDF 文件
4options.AddInput(new FileDataSource("input.pdf"));
5options.AddOutput(new FileDataSource("output.pdf"));
6
7// 定义包含行和单元格的表格
8options
9 .InsertPageAfter(2) // 在第 2 页之后添加表格
10 .AddTable()
11 .AddRow()
12 .AddCell().AddParagraph("Cell 1")
13 .AddCell().AddParagraph("Cell 2")
14 .AddCell().AddParagraph("Cell 3");
15
16// 在文档中生成表格
17TableGenerator.Process(options);
处理表格生成
在添加所有内容并自定义表格结构后,通过调用 Process
方法完成该过程。此方法生成表格并更新 PDF 文档。以下是如何处理结果:
1var resultContainer = generator.Process(options);
2
3// 输出生成结果的数量
4Console.WriteLine("结果数量: " + resultContainer.ResultCollection.Count);
关键功能:
- 动态表格创建:轻松生成结构化的 PDF 表格。
- 丰富的内容支持:使用文本、HTML、图像和 LaTeX 内容填充表格。
- 页码放置:在 PDF 中精确插入表格到特定位置。
- 可定制的布局:调整表格结构、单元格对齐和样式。
PDF TOC Generator
Documentize PDF TOC Generator for .NET 是一个强大的插件,旨在通过动态生成目录 (TOC) 来增强 PDF 文档的组织和导航。这个插件简化了将 TOC 添加到 PDF 的过程,使文档更易于导航和管理。
如何为 PDF 生成 TOC
要在 PDF 文件中创建目录,请按照以下步骤操作:
- 创建一个
TocOptions
实例以配置 TOC 生成设置。 - 使用
Title
属性设置标题。 - 使用
Headings.Add
方法设计 TOC 的标题。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法指定输出 PDF 文件及 TOC。 - 调用
Process
方法生成 TOC。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2));
7options.Headings.Add(new TocHeading("第一章", 3));
8options.Headings.Add(new TocHeading("第二章", 4));
9options.Headings.Add(new TocHeading("第三章", 5));
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
12// 设置输出文件路径
13options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
14// 执行处理
15TocGenerator.Process(options);
在 PDF 的 TOC 中生成书签
您可以使用 ‘GenerateBookmarks’ 属性生成书签。
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 在书签中生成链接
6options.GenerateBookmarks = true;
7// 设计标题
8options.Headings.Add(new TocHeading("引言", 2, false, 1));
9options.Headings.Add(new TocHeading("第一章", 3, true, 1));
10options.Headings.Add(new TocHeading("第二章", 4, true, 1));
11options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
12options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
13options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
14options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
15options.Headings.Add(new TocHeading("第三章", 5, true, 1));
16// 添加输入文件路径
17options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
18// 设置输出文件路径
19options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
20// 执行处理
21TocGenerator.Process(options);
自定义 TOC 标题
您可以通过修改 TocHeading
类来自定义目录标题。例如,您可以使用 ‘GenerateNumbering’ 或手动完成。
‘PageNumber’ 属性用于页面链接。您也可以使用 Level 属性。
1var heading = new TocHeading();
2heading.Text = "引言";
3heading.PageNumber = 5;
4heading.GenerateNumbering = true;
5heading.Level = 2;
6
7var tocOptions = new TocOptions();
8options.Headings.Add(heading);
9// 添加输入和输出文件
10tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
12
13// 使用自定义选项生成 TOC
14TocGenerator.Process(tocOptions);
如何获取结果流
1// 创建 TocOptions 对象以设置指令
2var options = new TocOptions();
3// 设置标题
4options.Title = "我的目录";
5// 设计标题
6options.Headings.Add(new TocHeading("引言", 2, false, 1));
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
9// 设置输出流
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamDataSource(outputStream));
12options.CloseOutputStreams = false;
13// 执行处理
14TocGenerator.Process(options);
主要特点:
- 动态 TOC 生成:为任何 PDF 文件创建 TOC,自动根据标题或书签生成条目。
- 批处理:一次为多个 PDF 文档生成 TOC。
- 定制:控制 TOC 的外观和结构,包括样式、格式和深度级别。
- 高效工作流程:最大限度减少手动创建 TOC 的时间,特别是对于大型或复杂文档。
PDF Signature
Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名、确保真实性和保护 PDF 内容的简化流程。该插件支持可见和隐形签名,并提供自定义签名位置、原因、联系信息等选项。
如何签署 PDF 文档
要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:
- 使用 PFX 文件路径和密码实例化
SignOptions
类。 - 将输入 PDF 和输出文件添加到选项中。
- 运行
Process
方法以应用签名。
1// 创建 SignOptions 对象以设置说明
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8Signature.Process(options);
如何使用流进行 PFX 文件签名
您也可以使用作为流提供的 PFX 证书签署 PDF,而不是文件路径。这允许更灵活地处理证书存储。
- 用包含 PFX 的流和密码实例化
SignOptions
。 - 添加输入和输出文件。
- 运行
Process
方法以应用签名。
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
5// 执行处理
6Signature.Process(options);
如何添加隐形签名
要添加隐形签名(在文档上不会显示签名但可以保护文档),只需将 Visible
属性设置为 false
。
- 创建
SignOptions
的实例。 - 将
Visible
设置为 false
。 - 添加输入和输出文件。
- 调用
Process
以应用隐形签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 配置隐形签名
5signOptions.Visible = false;
6// 执行处理
7Signature.Process(options);
如何为 PDF 文档的签名使用额外选项
在向 PFX 文件添加签名时,您可以使用额外选项,如原因、联系人、位置、页码。
- 使用 PFX 文件路径和密码实例化
SignOptions
类。 - 将输入 PDF 和输出文件添加到选项中。
- 设置选项的值。
- 运行
Process
方法以应用签名。
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
4// 可选参数
5options.Reason = "my Reason";
6options.Contact = "my Contact";
7options.Location = "my Location";
8options.PageNumber = 3;
9// 执行处理
10Signature.Process(options);
主要功能:
- 数字签署 PDF 文档:使用可见或隐形数字签名保护您的文档。
- PFX 支持:使用 PFX 证书签署 PDF 文件。
- 可自定义选项:配置签名设置,如原因、位置和联系信息。
- 可见和隐形签名:选择签名是否在文档上可见。
PDF Splitter
Documentize PDF Splitter for .NET 是一款强大的工具,简化了将大型PDF文档拆分为更小、更易管理文件的过程。无论您需要提取单个页面还是将文档划分为特定部分,这个插件都能高效地帮您实现,并且所需的努力最小化。
如何拆分PDF
要将PDF文档拆分为单独的页面,请遵循以下步骤:
- 创建一个
SplitOptions
实例以配置拆分选项。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法为每个拆分页面添加输出文件。 - 在
Splitter
类中运行Process
方法以拆分文档。
1var splitOptions = new SplitOptions();
2
3// 添加输入PDF文件
4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
5
6// 为每个页面指定输出文件
7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// 处理拆分操作
12Splitter.Process(splitOptions);
关键特性:
- 按页面拆分PDF:将PDF文档拆分为单独的页面。
- 批量处理:一次性拆分大量PDF。
- 自定义拆分选项:根据您的需求配置拆分过程。
- 有序输出:轻松管理每个拆分页面或部分的输出文件。
PDF ChatGPT
Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。此插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,使其适合在 PDF 文档中直接创建对话界面或分析报告。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件,请按照以下步骤操作:
- 创建
PdfChatGptRequestOptions
类的实例以配置请求选项。 - 添加输入和输出 PDF 文件。
- 设置 API 密钥,并指定参数,例如最大令牌数和 ChatGPT 模型的查询。
- 运行
ProcessAsync
方法以生成聊天响应。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // 设置您的 API 密钥
3options.MaxTokens = 1000; // 设置最大令牌数
4options.Query = "分析此文本的关键主题。";
5
6// 添加输入 PDF 文件
7options.AddInput(new FileDataSource("input.pdf"));
8
9// 指定保存聊天响应的输出 PDF 的位置
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// 创建 PdfChatGpt 插件的实例
13var plugin = new PdfChatGpt();
14
15// 异步运行处理
16var result = await plugin.ProcessAsync(options);
主要特点:
- 聊天完成: 使用 ChatGPT API 根据自定义输入生成响应。
- 系统和用户消息: 提供系统上下文和用户输入以创建动态对话。
- PDF 输出: 将生成的聊天完成保存在结构化的 PDF 文件中以供进一步使用。
- 异步处理: 通过异步处理聊天完成确保应用程序的响应性。
添加系统和用户消息
要创建更为互动的对话,您可以同时添加系统和用户消息。这些消息有助于塑造对话上下文。
- 添加一个系统消息,以设置 ChatGPT 的上下文。
- 添加一个用户消息,以表示用户的输入。
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // 设置您的 API 密钥
3
4// 添加上下文的系统消息
5options.AddSystemMessage("您是一个被训练来总结文本的人工智能。");
6
7// 添加用户消息以查询 ChatGPT 模型
8options.AddUserMessage("请总结附加的文档。");
9
10// 添加输入和输出 PDF
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// 异步处理请求
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);
Documentize PDF Image Extractor for .NET 插件使您能够轻松地从PDF文档中提取图像。它扫描您的PDF文件,识别嵌入的图像,并在保持原始质量和格式的同时提取它们。这个工具提高了视觉内容的可访问性,并简化了从PDF中检索图像的过程。
如何从PDF中提取图像
要从PDF文件中提取图像,请遵循以下步骤:
- 创建
ImageExtractorOptions
类的实例。 - 使用
AddInput
方法将输入文件路径添加到选项中。 - 使用
AddOutput
方法设置图像的输出目录路径。 - 使用插件处理图像提取。
- 从结果容器中检索提取的图像。
1// 创建 ImageExtractorOptions 以设置指令
2var options = new ImageExtractorOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// 执行处理
8var results = ImageExtractor.Process(options);
9// 获取图像结果路径
10var imageExtracted = results.ResultCollection[0].ToFile();
从PDF文件提取图像到流,不使用文件夹
ImageExtractor 插件支持保存到流,这允许您从PDF文件中提取图像到流,而无需使用临时文件夹。
1// 创建 ImageExtractorOptions 以设置指令
2var options = new ImageExtractorOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 不设置输出 - 它将结果写入流
6// 执行处理
7var results = ImageExtractor.Process(options);
8// 获取流
9var ms = results.ResultCollection[0].ToStream();
10// 为演示复制数据到文件
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
主要特性:
- 提取嵌入图像:识别并提取PDF文档中的图像。
- 保持图像质量:确保提取的图像保留其原始质量。
- 灵活输出:以您喜欢的格式或位置保存提取的图像。
Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要的是纯文本、原始文本还是普通文本,该插件都可以高效地提取文本,同时根据您的需要保留格式或省略格式。
如何从 PDF 中提取文本
要从 PDF 文档中提取文本,请按照以下步骤操作:
- 创建
TextExtractorOptions
的实例以配置提取选项。 - 使用
AddInput
方法添加输入 PDF 文件。 - 运行
Process
方法以提取文本。 - 使用
ResultContainer.ResultCollection
访问提取的文本。
1// 创建 TextExtractorOptions 对象以设置指令
2var options = new TextExtractorOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();
文本提取模式
TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取不带格式的文本,适用于原始数据处理。
- 扁平模式:根据坐标表示 PDF 内容与定位文本片段。
1// 创建 TextExtractorOptions 对象以设置 TextFormattingMode
2var options = new TextExtractorOptions(TextFormattingMode.Pure);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 执行处理
6var results = TextExtractor.Process(options);
7// 从 ResultContainer 对象中获取提取的文本
8var textExtracted = results.ResultCollection[0].ToString();
主要特点:
- 纯模式:在保留原始格式的同时提取文本。
- 原始模式:提取不带任何格式的文本。
- 扁平模式:提取没有特殊字符或格式的文本。
PDF Timestamp Adder
Documentize PDF Timestamp Adder for .NET 是一款强大的工具,旨在为您的 PDF 文档添加安全时间戳。它通过提供可信的时间参考来增强文档的完整性和真实性,确保符合数字签名标准。
如何向 PDF 添加时间戳
要向 PDF 文档添加安全时间戳,请按照以下步骤操作:
- 创建
AddTimestampOptions
的实例 来配置时间戳过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行时间戳操作。
1// 配置时间戳选项
2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
3
4// 添加输入 PDF 文件
5options.AddInput(new FileDataSource("path_to_pdf"));
6
7// 指定输出 PDF 文件
8options.AddOutput(new FileDataSource("path_to_result_pdf"));
9
10// 执行时间戳过程
11Timestamp.Process(options);
如何使用自定义身份验证连接时间戳服务器
在连接时间戳服务器时,您可以提供基本身份验证凭据。这允许您与需要用户名和密码的服务器进行身份验证。
- 创建
AddTimestampOptions
的实例,包括 serverBasicAuthCredentials
。 - 添加输入文件和输出文件路径。
- 调用
Process
方法。
1// 使用身份验证配置时间戳选项
2var options = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
3
4// 添加输入 PDF 文件
5options.AddInput(new FileDataSource("path_to_pdf"));
6
7// 指定输出 PDF 文件
8options.AddOutput(new FileDataSource("path_to_result_pdf"));
9
10// 执行时间戳过程
11Timestamp.Process(options);
处理 PFX 文件和密码
AddTimestampOptions
类允许您使用 PFX 文件进行数字签名并配合密码使用。
- PFX 流或文件路径:您可以提供 PFX 文件的流或文件路径。
- 密码保护:确保安全管理 PFX 文件的密码。
主要特性:
- 添加安全时间戳:轻松向您的 PDF 文档添加安全时间戳。
- 可自定义的时间戳服务器:使用自定义时间戳服务器 URL 和身份验证凭据。
- 自动化:将时间戳过程集成到您的 .NET 应用程序中,实现自动化工作流。
- 合规性:确保您的文档符合数字签名和时间戳的行业标准。
PDF/A Converter
Documentize PDF/A Converter for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档是否符合 PDF/A 规范,提供了单一解决方案的转换和验证功能。
如何将 PDF 转换为 PDF/A
要将 PDF 文档转换为 PDF/A 格式,请按以下步骤操作:
- 创建
PdfAConvertOptions
的实例以配置转换。 - 指定所需的 PDF/A 版本(例如,PDF/A-3B)。
- 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加结果 PDF/A 的输出文件。 - 调用
Process
方法以执行转换。
1var pdfAOptions = new PdfAConvertOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_3B
4};
5
6// 添加输入 PDF 文件
7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8
9// 指定输出 PDF/A 文件
10pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
11
12// 处理转换
13PdfAConverter.Process(pdfAOptions);
验证 PDF/A 合规性
您可以使用 PdfAValidateOptions
类验证现有 PDF 文件的 PDF/A 合规性。
1var validationOptions = new PdfAValidateOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_1A
4};
5
6// 添加要验证的 PDF 文件
7validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8
9// 运行验证过程
10var resultContainer = PdfAConverter.Process(validationOptions);
11
12// 检查验证结果
13var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
14Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);
PDF/A 转换的批处理
该插件支持批处理,允许您同时转换或验证多个 PDF 文件以符合 PDF/A 规范。
1var pdfAOptions = new PdfAConvertOptions
2{
3 PdfAVersion = PdfAStandardVersion.PDF_A_3B
4};
5
6// 添加多个输入 PDF
7pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
9
10// 为转换的 PDF/A 指定输出文件
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
13
14// 处理批量转换
15PdfAConverter.Process(pdfAOptions);
主要特点:
- 转换为 PDF/A:无缝将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a,PDF/A-2b,PDF/A-3b),确保符合归档标准。
- 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,并识别不合规的问题。
- 批处理:一次处理多个文件进行转换或验证。
- 高效工作流程:通过快速可靠的转换过程减少时间和精力。
PDF 转 XLS 转换器
Documentize PDF 转 XLS 转换器 for .NET 是一个通用且强大的工具,用于将 PDF 文档转换为 Excel 电子表格 (XLSX/XLS/CSV/XLSM/ODS)。通过利用此插件,开发人员可以无缝地将静态 PDF 数据转换为动态且可编辑的电子表格,从而简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件 (XLSX),请按照以下步骤操作:
- 使用
PdfToXlsOptions
类配置转换设置。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法指定输出文件路径。 - 执行
Process
方法以启动转换。
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.xlsx"));
7// 执行处理
8XlsConverter.Process(options);
自定义 PDF 到 Excel 转换
PdfToXlsOptions
类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 指定 XLS 格式
6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
7options.InsertBlankColumnAtFirst = true;
8options.MinimizeTheNumberOfWorksheets = true;
9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 执行处理
12XlsConverter.Process(options);
支持的输出格式
PdfToXlsOptions.ExcelFormat
枚举提供了一系列输出格式:
- XLSX: Office Open XML (.xlsx) 文件格式(默认)。
- XLSM: 启用宏的 Excel 格式。
- CSV: 逗号分隔值。
- ODS: 开放文档电子表格。
- XMLSpreadSheet2003: Excel 2003 XML (.xls) 文件格式。
主要特性:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式:插入空白列或最小化工作表数量。
PDF to DOC Converter
Documentize PDF to DOC Converter for .NET 是一个强大的工具,旨在将PDF文档转换为DOC或DOCX格式。该插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使跨多个平台重用、编辑和共享内容变得简单。
如何将PDF转换为DOC/DOCX
要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:
- 创建一个
DocConversionOptions
实例以配置转换过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法添加结果文件的输出文件路径。 - 运行
Process
方法以执行转换。
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.DocX, // 输出格式为DOCX
4 ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
5};
6
7// 添加输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
12
13// 处理转换
14DocConverter.Process(options);
使用自定义选项转换PDF到DOC
PDF to DOC Converter 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制PDF在转换过程中的布局和结构处理。
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.Doc, // 输出格式为DOC
4 ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF的布局
5};
6
7// 添加输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// 添加输出Word文档路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
12
13// 处理转换
14DocConverter.Process(options);
批量处理PDF到DOC/DOCX转换
PDF to DOC Converter 支持批量处理,允许您一次转换多个PDF文件。以下是批量转换的示例:
1var options = new DocConversionOptions()
2{
3 SaveFormat = SaveFormat.DocX
4};
5
6// 添加多个输入PDF文件
7options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
8options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
9
10// 添加结果DOCX文件的输出路径
11options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
13
14// 处理批量转换
15DocConverter.Process(options);
主要特性:
- DOC/DOCX转换:将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
- 保持格式:在转换过程中保留原始布局、文本和格式。
- 批量处理:一次转换多个PDF文件。
- 自定义转换选项:通过不同模式(如增强流)微调转换过程,以获得更好的布局。
PDF to JPEG Converter
Documentize PDF to JPEG Converter for .NET 是一个强大的工具,简化了将 PDF 文档转换为高质量 JPEG 图像的过程。该插件旨在通过将 PDF 页面转换为广泛使用的图像格式,使您的内容更易于跨平台访问。
如何将 PDF 页面转换为 JPEG
要将 PDF 文档转换为 JPEG 图像,请按照以下步骤操作:
- 创建一个
PdfToJpegOptions
实例以配置转换过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法设置 JPEG 图像的输出目录路径。 - 运行
Process
方法将 PDF 页面转换为 JPEG 图像。
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8JpegConverter.Process(options);
自定义 PDF 转 JPEG 转换
您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下是如何以 200 DPI 转换 PDF 的第一页:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 仅处理第一页
4options.PageList = new List<int> { 1 };
5// 设置输出分辨率为 200 DPI
6options.OutputResolution = 200;
7// 设置输出质量为 50
8options.Quality = 50;
9// 添加输入文件路径
10options.AddInput(new FileDataSource("path_to_input.pdf"));
11// 设置输出目录路径
12options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
13// 执行处理
14JpegConverter.Process(options);
如何在没有目录的情况下获取结果,或以流的形式获取结果
Process 方法返回一个 ResultContainer
对象,该对象包含有关转换结果的信息。您可以获取转换后 JPEG 文件的流,如下所示:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToJpegOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = JpegConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特性:
- 将 PDF 转换为 JPEG:轻松将整个 PDF 文档或特定页面转换为 JPEG 图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
- 页面集:选择特定页面进行转换。
- 快速转换:快速高效的过程,最小化工作量。
PDF to PNG Converter
Documentize PDF to PNG Converter for .NET 是一个高级工具,允许您将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问和易于共享。
如何将 PDF 转换为 PNG
要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:
- 创建
PdfToPngOptions
实例以配置转换过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法设置 PNG 图像的输出目录路径。 - 运行
Process
方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8PngConverter.Process(options);
自定义 PDF 到 PNG 转换
您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页面:
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions()
3// 仅处理第一页
4options.PageList = new List<int> { 1 };
5// 设置输出分辨率为 200 dpi
6options.OutputResolution = 200;
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行处理
12PngConverter.Process(options);
处理转换结果
Process 方法返回一个 ResultContainer
对象,该对象包含有关转换结果的信息。您可以获取转换后 PNG 文件的流,如下所示:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = PngConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特点:
- 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
- 可自定义分辨率:设置所需的 DPI(例如,300 DPI)以获得高质量的图像输出。
- 页面集合:选择特定页面进行转换。
- 轻松输出管理:为每个转换后的 PNG 文件指定输出目录。
- 快速转换:快速、高效,并且配置所需的努力最小。
PDF to TIFF Converter
Documentize PDF to TIFF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件确保您的内容在各个平台上都可访问,同时保持卓越的保真度和多功能性。
您可以通过调整分辨率、启用多页输出或选择页面来定制转换过程。
如何将 PDF 转换为 TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建
PdfToTiffOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法指定 TIFF 图像的输出文件路径。 - 运行
Process
方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行处理
8TiffConverter.Process(options);
自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置页面
8options.PageList = [1, 3];
9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行处理
12TiffConverter.Process(options);
多页 TIFF 创建
PDF to TIFF Converter 插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为一个 TIFF 文件,以便于存档或打印。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 启用多页 TIFF 输出
8options.MultiPage = true;
9// 执行处理
10TiffConverter.Process(options);
自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 将 PDF 中的 2 页转换为 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置压缩和色深
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行处理
11TiffConverter.Process(options);
如何处理转换结果
Process 方法返回一个 ResultContainer
对象,其中提供有关转换结果的详细信息。您可以获得转换后 TIFF 文件的流,如下所示:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行处理
6var results = TiffConverter.Process(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特点:
- 将 PDF 转换为 TIFF:轻松地将整个 PDF 文档或特定页面转换为 TIFF 图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得更高质量的输出。
- 多页 TIFF:将多个 PDF 页面合并为一个多页 TIFF 文件。
- 页面集:选择特定页面进行转换。
- 快速转换:快速有效的处理,付出最少的努力。
Documentize PDF Form Flattener for .NET 插件旨在将交互式PDF表单转换为不可编辑的文档,确保其免受未经授权的修改。该工具将表单字段转换为静态内容,增强您的PDF文档的安全性。当您需要确保合同、协议或任何必须保持不变的表单字段的文档时,此工具特别有用。
如何在PDF中扁平化表单字段
要在PDF文档中扁平化表单字段,请按照以下步骤操作:
- 创建
FormFlattenerOptions
类的实例。 - 将输入和输出文件添加到选项中。
- 调用
Process
方法执行扁平化操作。
1// 创建FormFlattenerOptions对象以设置指令
2var options = new FormFlattenerOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 执行处理
8FormFlattener.Process(options);
如何获取PDF中的所有字段
您可以获取文档中包含多少字段的信息。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
如何在PDF中扁平化除了第一个字段以外的所有内容
您可以根据字段的位置或名称等标准选择性地只扁平化特定的表单字段。
1// 获取字段名称
2var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");
3// 创建FormFlattenerOptions对象以设置指令
4var options = new FormFlattenerOptions();
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// 跳过1个字段。
8options.SkipFields.Add(fieldNames[0]);
9// 执行处理
10FormFlattener.Process(options);
主要特性:
- 扁平化所有表单字段:将交互式表单字段转换为不可编辑的静态内容。
- 扁平化选定字段:可选择在PDF中扁平化特定字段,同时保留其他字段可编辑。
- 扁平化获取字段名称:获取PDF中的字段名称。
常见问题解答
此常见问题解答提供有关 Documentize .NET 插件 功能和特性的全面信息,涵盖 PDF 转换、表单处理和目录生成(TOC)等方面。
一般问题
1. 什么是 Documentize for .NET?
Documentize for .NET 是一个强大的库,用于以编程方式管理和处理 PDF 文档。它包括将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成目录以及确保长期归档的 PDF/A 合规性等功能的插件。
2. 如何安装 Documentize 插件 for .NET?
您可以通过从官方网站下载程序集文件或直接从 NuGet 获取软件包来安装 Documentize 插件。每个插件的文档中提供详细的安装说明。
PDF 转换插件
3. 如何将 PDF 文档转换为 Word(DOC/DOCX)文件?
要使用 PDF 到 DOC 转换器 将 PDF 文档转换为 Word 格式:
- 实例化
PdfDoc
类。 - 创建
PdfToDocOptions
对象以配置转换选项。 - 添加输入 PDF 和输出 DOC/DOCX 文件路径。
- 调用
Process
方法执行转换。
4. 如何将 PDF 页转换为 JPEG 图像?
使用 PDF 到 JPEG 转换器:
- 创建
Jpeg
类的实例。 - 通过
JpegOptions
设置转换选项(例如,分辨率,页面范围)。 - 添加输入/输出文件路径。
- 调用
Jpeg.Process
方法运行转换。
5. 如何将 PDF 转换为 PNG?
要将 PDF 转换为 PNG 格式:
- 创建
Png
类的实例和 PngOptions
对象。 - 添加输入 PDF 并指定输出文件夹。
- 设置选项,如分辨率(例如,300 DPI)。
- 调用
Process
方法生成 PNG 图像。
6. 如何将 PDF 转换为 Excel(XLS/XLSX)?
要将 PDF 转换为 Excel:
- 实例化
PdfXls
类。 - 使用
PdfToXlsOptions
配置输入/输出路径和转换选项。 - 调用
Process
方法开始转换。
7. 如何将 PDF 转换为 HTML?
要将 PDF 文档转换为 HTML:
- 创建
PdfHtml
类的实例。 - 使用
PdfToHtmlOptions
或 HtmlToPdfOptions
配置转换选项。 - 添加输入/输出路径并调用
Process
方法。
PDF 表单处理
8. 如何使用表单编辑器编辑 PDF 表单?
PDF 表单编辑器 提供以下功能:
- 添加字段(
FormEditorAddOptions
)。 - 更新字段(
FormEditorSetOptions
)。 - 删除字段(
FormRemoveSelectedFieldsOptions
)。
配置表单字段后,运行 Process
方法。
9. 如何扁平化 PDF 表单?
要扁平化表单字段:
- 实例化
FormFlattener
类。 - 使用
FormFlattenAllFieldsOptions
扁平化所有字段或使用 FormFlattenSelectedFieldsOptions
定位特定字段。 - 添加输入/输出文件并调用
Process
方法。
10. 如何导出 PDF 表单中的数据?
要导出表单数据,请使用 PDF 表单导出器。创建 FormExporterValuesToCsvOptions
对象,指定表单字段条件,并运行 Process
方法将数据导出为 CSV 格式。
PDF/A 和 TOC 管理
11. 如何将 PDF 转换为 PDF/A 格式?
要将 PDF 转换为 PDF/A:
- 使用
PdfAConverter
类。 - 在
PdfAConvertOptions
中配置 PDF/A 版本(例如,PDF/A-3B)。 - 添加输入/输出路径并调用
Process
方法。
12. 如何在 PDF 中生成目录(TOC)?
要创建 TOC:
- 创建
TocGenerator
类的实例。 - 使用
TocOptions
定义 TOC 参数。 - 添加输入/输出文件并运行
Process
方法。
签名处理
13. 如何对 PDF 文档进行数字签名?
要添加数字签名:
- 实例化
Signature
类。 - 使用
SignOptions
配置 PFX 文件、密码和签名详细信息(例如,原因、联系信息)。 - 添加输入/输出文件并运行
Process
方法。
附加功能
14. 我可以使用 Documentize 拆分 PDF 文件吗?
可以,使用 PDF 拆分器:
- 实例化
Splitter
类。 - 使用
SplitOptions
配置拆分选项。 - 添加输入/输出路径并调用
Process
方法。
15. 如何将多个 PDF 文件合并为一个?
要合并 PDF:
- 实例化
Merger
类。 - 添加输入 PDF,并通过
MergeOptions
指定输出文件。 - 运行
Process
方法合并文件。
16. Documentize 是否仅限于处理 PDF?
虽然 Documentize 主要专注于 PDF 操作,但它也支持与 DOC、XLS、HTML、JPEG 和 PNG 等格式之间的转换。
许可和兼容性
17. 使用 Documentize 插件的系统要求是什么?
Documentize 支持:
- 操作系统:Windows 7-11,Windows Server 2003-2022,macOS(10.12+),以及 Linux。
- 框架:.NET Framework 4.0 至 8.0。
- IDE:与各种版本的 Visual Studio 兼容。
18. 如何设置 Documentize 的许可证密钥?
要激活插件,请在项目中引用 Documentize 并在调用任何方法之前设置许可证密钥。有关详细说明,请参考特定插件的文档。
19. 在哪里可以找到更多 Documentize 插件的示例和文档?
完整的 API 文档和示例可以在 Documentize 网站上找到,或通过您开发环境中的 NuGet 包获取。