安装
Documentize SDK 可以通过多种方法安装,适合不同的开发环境和偏好。以下是推荐的安装 Documentize 的方法:
1. NuGet(首选方法)
NuGet 是安装 Documentize 的最简单和首选的方法,确保您始终在开发环境中获得最新版本和更新。有关此安装方法的更多详细信息,请查看 如何使用 NuGet 安装 Documentize SDK。
2. MSI 安装程序
如果您希望将 Documentize DLL 直接安装到您的系统上,MSI 安装程序是一个方便的选择。此方法非常适合希望在多个项目中使用 Documentize 的开发人员,而无需手动管理 DLL 文件。有关此安装方法的更多详细信息,请查看 如何使用 MSI 安装 Documentize SDK。
3. ZIP 包
对于喜欢手动方法的开发人员,ZIP 包包含 Documentize DLL,可以直接提取并添加到您的项目中。有关此安装方法的更多详细信息,请查看 如何使用 ZIP 安装 Documentize SDK。
安装 的子部分
系统要求
Documentize SDKs 旨在与 .NET 应用程序集成,并支持多种操作系统和开发环境。以下是关键的系统要求:
支持的操作系统
Windows
- Windows 7 (x64, x86)
- Windows 8, 8.1 (x64, x86)
- Windows 10 (x64, x86)
- Windows 11 (x64, x86)
- Windows Server 2003 到 Windows Server 2022 (x64, x86)
- 云: Microsoft Azure
macOS
- macOS 10.12 (Sierra) 及更高版本
Linux
- 兼容多个 Linux 发行版:
- Ubuntu (16.04, 18.04, 20.04, 22.04)
- CentOS (7, 8)
- Debian (9, 10)
- OpenSUSE (Leap 15+, SLES 12+)
Android
- 支持 Android 8.0 (Oreo) 及更高版本。
开发环境
- Microsoft Visual Studio:
- Visual Studio 2010 及更高版本(包括 2019 和 2022)
- 支持任何针对 .NET 平台的开发环境。
支持的 .NET 框架
- .NET Framework 4.0 及更高版本
- .NET Standard 2.0 (.NET Core 3.1+)
- .NET 6.0, .NET 7.0, .NET 8.0
其他说明
- 运行 Documentize SDKs 不需要 Adobe Acrobat,但推荐使用 Adobe Acrobat 来查看 PDF 文件。
声明
在 .NET 应用程序中使用 Documentize.com SDK 时,需要完全信任权限集。此权限级别对于 SDK 执行某些系统级操作至关重要,例如访问注册表设置、系统文件以及解析字体。
为什么需要完全信任
Documentize SDK 利用核心 .NET 系统类,这些类通常因以下原因需要提升的权限:
- 注册表访问:某些操作可能需要读取或写入系统注册表。
- 系统文件:访问应用程序虚拟目录之外的系统文件可能在某些任务中是必要的,例如处理字体或执行文件操作。
中级信任环境的限制
在实施中级信任安全的托管环境中,几个重要权限受到限制或不可用。这可能会阻止 SDK 在这种环境中正常运行。以下限制适用于中级信任:
- OleDbPermission:无法使用 ADO.NET 管理的 OLE DB 数据提供程序访问数据库。
- EventLogPermission:禁止访问 Windows 事件日志。
- ReflectionPermission:禁止使用反射,这可能影响某些动态操作。
- RegistryPermission:拒绝访问系统注册表。
- WebPermission:通信限制在
<trust>
元素中配置的预定义地址或范围内。 - FileIOPermission:对文件的访问仅限于应用程序的虚拟目录中的文件。
非Windows环境
Documentize SDK支持**.NET Standard 2.0**,这使它们可以在运行于Linux或其他非Windows环境的.NET Core应用中使用。为确保最佳性能和正确的文本渲染,请遵循以下步骤:
推荐的Linux设置
1. 安装libgdiplus包
该包提供必要的GDI+功能,这是渲染和处理PDF的关键。您可以通过在终端中运行以下命令来安装:
sudo apt-get install libgdiplus
2. 安装Microsoft兼容字体
为确保正确的文本渲染,请使用以下命令安装Microsoft的TrueType字体:
sudo apt-get install ttf-mscorefonts-installer
这些字体应放置在/usr/share/fonts/truetype/msttcorefonts
目录中。如果您的系统在不同的目录中存储字体,请在对Documentize SDK进行任何操作之前更新代码中的路径:
Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));
提示
通过确保这些安装完成并正确配置字体路径,您可以最大化Documentize SDK在Linux或其他非Windows系统上的性能。
评估
您可以轻松下载用于评估的Documentize SDK。评估版本与购买的版本完全相同,唯一的区别在于您如何应用许可证。
评估版本限制
尽管评估版本提供对所有功能的完全访问,但在应用许可证之前,它包含以下限制:
- 所有输出文档中插入评估水印。
- 任何PDF文档只能查看或编辑前四页。
要解除这些限制并解锁完整版,只需通过向您的项目添加几行代码来应用许可证。
开发者指南 的子部分
PDF ChatGPT
Documentize ChatGPT for .NET 插件是一个强大的工具,旨在将 ChatGPT API 与 PDF 应用程序集成。该插件允许开发人员根据输入消息生成聊天响应,并将输出保存为 PDF 格式,非常适合在 PDF 文档中直接创建对话界面或分析报告。
主要特点:
- 聊天完成:使用 ChatGPT API 根据自定义输入生成响应。
- 系统与用户消息:提供系统上下文和用户输入,以创建动态对话。
- PDF 输出:将生成的聊天完成保存到结构化的 PDF 文件中以供进一步使用。
- 异步处理:通过异步处理聊天完成确保应用程序的响应性。
生成聊天响应
要使用 ChatGPT 插件生成聊天响应并将其保存到 PDF 文件中,请按照以下步骤操作:
- 创建
PdfChatGptRequestOptions
类的实例,以配置请求选项。 - 添加输入和输出 PDF 文件。
- 设置 API 密钥并指定参数,例如最大令牌数和 ChatGPT 模型的查询。
- 运行
ProcessAsync
方法以生成聊天完成。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4options.MaxTokens = 1000; // 设置最大令牌数
5options.Query = "分析此文本的关键主题。";
6
7// 添加输入 PDF 文件
8options.AddInput(new FileDataSource("input.pdf"));
9
10// 指定保存聊天响应的输出 PDF 文件的位置
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// 创建 PdfChatGpt 插件的实例
14var plugin = new PdfChatGpt();
15
16// 异步运行处理
17var result = await plugin.ProcessAsync(options);
添加系统和用户消息
要创建更互动的对话,您可以添加系统消息和用户消息。这些消息有助于塑造对话上下文。
- 添加设置 ChatGPT 上下文的系统消息。
- 添加代表用户输入的用户消息。
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // 设置您的 API 密钥
4
5// 添加用于上下文的系统消息
6options.AddSystemMessage("您是一个被训练来总结文本的 AI。");
7
8// 添加用户消息以查询 ChatGPT 模型
9options.AddUserMessage("请总结附加的文档。");
10
11// 添加输入和输出 PDF
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// 异步处理请求
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
PDF 合并器
Documentize PDF 合并器 for .NET 是一个多功能工具,旨在将多个 PDF 文档合并为一个文件。它简化了 PDF 文件的整合,确保您的文档高效合并并保持内容一致性。该插件处理内部资源,如字体和图像,以优化合并后的文档。
主要特性:
- 合并多个 PDF:轻松将多个 PDF 文件合并为一个。
- 资源优化:在合并期间去除重复的字体和图像。
- 批量处理:一次性合并大量 PDF 文档。
- 安全合并:确保文档完整性,不会丢失数据或内容损坏。
如何合并 PDF 文档
要将多个 PDF 文档合并为一个文件,请按照以下步骤操作:
- 创建
Merger
类的实例。 - 创建
MergeOptions
的实例以配置合并过程。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行合并。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加待合并的输入 PDF 文件
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// 指定输出文件路径
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
11
12// 合并 PDF 文件
13merger.Process(mergeOptions);
如何合并带有页面范围的 PDF
您还可以使用 MergeOptions
类合并输入 PDF 文件的特定页面范围。这允许您将选定页面合并到最终输出文档中。
- 创建
Merger
类的实例。 - 使用
MergeOptions
配置页面范围。 - 添加带有指定页面范围的输入文件。
- 设置输出路径。
- 调用
Process
方法。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 从输入 PDF 中合并特定页面
5mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
7
8// 指定输出文件路径
9mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
10
11// 合并 PDF 文件
12merger.Process(mergeOptions);
如何处理批量合并
PDF 合并器 插件经过优化,可处理大量 PDF 文档。通过利用批处理功能,您可以在一次操作中合并数百个 PDF,从而确保高效快速的文档管理。
- 实例化
Merger
类。 - 将所有输入 PDF 文件添加到
MergeOptions
类。 - 指定输出路径。
- 调用
Process
方法以合并批次中的所有文件。
1var merger = new Merger();
2var mergeOptions = new MergeOptions();
3
4// 添加大量 PDF 文件进行合并
5for (int i = 1; i <= 100; i++)
6{
7 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
8}
9
10// 指定输出文件路径
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
12
13// 处理批量合并
14merger.Process(mergeOptions);
PDF 签名
Documentize PDF Signature for .NET 插件允许用户对 PDF 文档进行数字签名。它提供了添加签名的简化流程,确保真实性并保护 PDF 内容。该插件支持可见和不可见的签名,并提供定制签名位置、原因、联系信息等选项。
主要特性:
- 数字签名 PDF 文档:用可见或不可见的数字签名保护您的文档。
- PFX 支持:使用 PFX 证书对 PDF 文件进行签名。
- 可定制选项:配置签名设置,如原因、位置和联系信息。
- 可见和不可见签名:选择签名是否在文档上可见。
如何签署 PDF 文档
要使用 PFX 文件签署 PDF 文档,请按照以下步骤操作:
- 创建
Signature
类的实例。 - 用 PFX 文件路径和密码实例化
SignOptions
类。 - 将输入 PDF 和输出文件添加到选项中。
- 运行
Process
方法应用签名。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 添加输入 PDF 并指定输出文件
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// 配置签名选项
9signOptions.Reason = "合同协议";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "纽约";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// 将签名应用到文档
17signature.Process(signOptions);
如何使用流处理 PFX 文件
您还可以使用作为流提供的 PFX 证书来签署 PDF,而不是文件路径。这使证书存储的处理更加灵活。
- 创建
Signature
类的实例。 - 使用包含 PFX 和密码的流实例化
SignOptions
。 - 添加输入和输出文件。
- 运行
Process
方法应用签名。
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// 添加输入和输出文件
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// 应用签名
10signature.Process(signOptions);
如何应用不可见签名
要添加不可见签名(在文档上不显示签名以保护文档),只需将 Visible
属性设置为 false
。
- 创建
SignOptions
的实例。 - 将
Visible
设置为 false
。 - 添加输入和输出文件。
- 调用
Process
应用不可见签名。
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// 配置不可见签名
5signOptions.Visible = false;
6
7// 添加输入和输出文件
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// 处理签名
12signature.Process(signOptions);
PDF 文本提取器
Documentize PDF 文本提取器 for .NET 简化了从 PDF 文档中提取文本的过程。无论您需要纯文本、原始文本还是简单文本,这个插件都允许您高效地提取文本,同时根据需要保留格式或省略它。
主要特点:
- 纯模式:提取文本同时保留其原始格式。
- 原始模式:提取没有任何格式的文本。
- 简单模式:提取没有特殊字符或格式的文本。
- 批处理:一次从多个 PDF 提取文本。
如何从 PDF 文档中提取文本
要从 PDF 文档中提取文本,请按照以下步骤操作:
- 创建
TextExtractor
类的实例。 - 创建
TextExtractorOptions
的实例以配置提取选项。 - 使用
AddInput
方法添加输入 PDF 文件。 - 运行
Process
方法以提取文本。 - 使用
ResultContainer.ResultCollection
访问提取的文本。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 处理文本提取
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// 输出提取的文本
12var extractedText = resultContainer.ResultCollection[0];
13Console.WriteLine(extractedText);
从多个 PDF 提取文本
该插件允许您同时从多个 PDF 提取文本,确保快速和高效的处理。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加多个输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
8
9// 处理提取
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 输出提取的文本
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
文本提取模式
TextExtractor 插件提供三种提取模式,根据您的需求提供灵活性。
- 纯模式:保留原始格式,包括空格和对齐。
- 原始模式:提取没有格式的文本,适合原始数据处理。
- 简单模式:提取没有特殊字符或附加格式的文本。
1
2var textExtractorOptions = new TextExtractorOptions();
3
4// 设置为纯模式
5textExtractorOptions.Mode = ExtractionMode.Pure;
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// 处理并输出
9var resultContainer = extractor.Process(textExtractorOptions);
10Console.WriteLine(resultContainer.ResultCollection[0]);
如何处理批处理
对于大型文档集,您可以利用批处理,允许您一次从多个 PDF 提取文本。
1
2using var extractor = new TextExtractor();
3var textExtractorOptions = new TextExtractorOptions();
4
5// 添加多个输入 PDF
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
7textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
8
9// 为每个文件定义输出
10var resultContainer = extractor.Process(textExtractorOptions);
11
12// 处理提取的文本
13foreach (var result in resultContainer.ResultCollection)
14{
15 Console.WriteLine(result);
16}
PDF/A 转换器
Documentize PDF/A 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为 PDF/A 格式,确保您的内容符合长期归档标准。该插件还支持验证现有 PDF 文档的 PDF/A 合规性,提供转换和验证功能于一体的解决方案。
主要特性:
- 转换为 PDF/A:无缝地将 PDF 文件转换为 PDF/A 格式(如 PDF/A-1a、PDF/A-2b、PDF/A-3b),确保符合归档标准。
- 验证 PDF/A 合规性:检查现有 PDF 文档是否符合 PDF/A 标准,如果不合规则识别问题。
- 批量处理:同时处理多个文件以进行转换或验证。
- 高效工作流程:通过快速和可靠的转换流程最小化时间和精力的浪费。
如何将 PDF 转换为 PDF/A
要将 PDF 文档转换为 PDF/A 格式,请按照以下步骤操作:
- 创建
PdfAConverter
类的实例。 - 创建
PdfAConvertOptions
类的实例以配置转换。 - 指定所需的 PDF/A 版本(例如 PDF/A-3B)。
- 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法添加输出文件以生成 PDF/A。 - 调用
Process
方法以执行转换。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加输入 PDF 文件
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 指定输出 PDF/A 文件
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// 处理转换
15pdfAConverter.Process(pdfAOptions);
验证 PDF/A 合规性
您可以使用 PdfAValidateOptions
类验证现有 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// 添加要验证的 PDF 文件
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 运行验证过程
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// 检查验证结果
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A 验证通过: " + validationResult.IsValid);
PDF/A 转换的批量处理
该插件支持批量处理,允许您一次转换或验证多个 PDF 文件的 PDF/A 合规性。
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// 添加多个输入 PDF
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// 指定输出文件以获得转换后的 PDF/A
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// 处理批量转换
17pdfAConverter.Process(pdfAOptions);
PDF安全性
Documentize PDF安全性 for .NET 是一款强大的工具,旨在通过提供加密和解密功能来增强你的PDF文档的安全性。它确保你的敏感信息保持机密,并受到未授权访问的保护。
主要特点:
- 加密PDF文档:通过添加用户和所有者密码来保护你的PDF文件。
- 解密PDF文档:在需要时移除PDF的加密。
- 设置权限:控制打印、复制和修改内容等权限。
- 自动化:将加密和解密集成到你的.NET应用程序中,实现自动化工作流程。
- 合规性:确保你的文档符合行业安全标准。
如何加密PDF文档
要加密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 使用所需的用户和所有者密码创建
EncryptionOptions
的实例。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行加密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置加密选项
5var opt = new EncryptionOptions("用户密码", "所有者密码");
6
7// 添加输入PDF文件
8opt.AddInput(new FileDataSource("pdf文件路径"));
9
10// 指定输出加密PDF文件
11opt.AddOutput(new FileDataSource("加密pdf文件路径"));
12
13// 执行加密过程
14plugin.Process(opt);
如何解密PDF文档
要解密PDF文档,请按照以下步骤操作:
- 创建
Security
类的实例。 - 使用必要的密码创建
DecryptionOptions
的实例。 - 使用
AddInput
方法添加加密PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行解密。
1// 实例化Security插件
2var plugin = new Security();
3
4// 配置解密选项
5var opt = new DecryptionOptions("用户密码");
6
7// 添加输入加密PDF文件
8opt.AddInput(new FileDataSource("加密pdf文件路径"));
9
10// 指定输出解密PDF文件
11opt.AddOutput(new FileDataSource("解密pdf文件路径"));
12
13// 执行解密过程
14plugin.Process(opt);
设置PDF文档的权限
在加密PDF时,可以设置各种权限来控制文档的使用方式。
- 打印:允许或禁止打印文档。
- 复制:允许或禁止复制内容。
- 修改:允许或禁止对文档进行修改。
要设置权限,可以相应地配置EncryptionOptions
。
PDF分割器
Documentize PDF分割器 for .NET 是一款强大的工具,简化了将大型PDF文档拆分为较小、可管理文件的过程。无论您需要提取单独的页面还是将文档分为特定部分,这个插件都能让您高效地实现,且付出最小的努力。
主要特点:
- 按页面拆分PDF:将PDF文档分解成单独的页面。
- 批量处理:一次性拆分大量PDF。
- 自定义拆分选项:根据您的要求配置拆分过程。
- 有序输出:轻松管理每个拆分页面或部分的输出文件。
如何拆分PDF文档
要将PDF文档拆分为单独的页面,请按照以下步骤操作:
- 创建
Splitter
类的实例。 - 创建
SplitOptions
的实例以配置拆分选项。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法为每个拆分页面添加输出文件。 - 运行
Process
方法以拆分文档。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 为每个页面指定输出文件
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
11
12// 处理拆分操作
13splitter.Process(splitOptions);
按页面范围拆分PDF
您还可以通过指定页面范围来拆分PDF。这允许您将特定部分或多个页面从PDF提取到单独的文档中。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 添加输入PDF
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// 定义页面范围的输出(例如,第1-3页)
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
9
10// 处理拆分
11splitter.Process(splitOptions);
如何处理批量拆分
PDF分割器 插件经过优化,可处理大量PDF文档。您可以利用批量处理将数百个PDF拆分为单独的页面或部分。
1var splitter = new Splitter();
2var splitOptions = new SplitOptions();
3
4// 批量添加输入PDF文件
5splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 为每个文件定义输出
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
11
12// 处理批量拆分
13splitter.Process(splitOptions);
PDF时间戳添加器
Documentize PDF时间戳添加器 for .NET 是一款强大的工具,旨在为您的PDF文档添加安全时间戳。通过提供可信的时间参考,它增强了文档的完整性和真实性,确保符合数字签名标准。
关键特性:
- 添加安全时间戳:轻松为您的PDF文档添加安全时间戳。
- 可自定义的时间戳服务器:使用自定义的时间戳服务器URL和身份验证凭据。
- 自动化:将时间戳集成到您的.NET应用程序中,以实现自动化工作流。
- 合规性:确保您的文档符合数字签名和时间戳的行业标准。
如何为PDF文档添加时间戳
要为PDF文档添加安全时间戳,请按照以下步骤操作:
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
的实例以配置时间戳过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
设置输出文件路径。 - 使用
Process
方法执行时间戳处理。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
7
8// 添加输入PDF文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出PDF文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
如何使用自定义身份验证与时间戳服务器
在连接到时间戳服务器时,您可以提供基本身份验证凭据。这允许您对需要用户名和密码的服务器进行身份验证。
- 创建
Timestamp
类的实例。 - 创建
AddTimestampOptions
的实例,包括serverBasicAuthCredentials
。 - 添加输入文件和输出文件路径。
- 调用
Process
方法。
1
2// 实例化时间戳插件
3var plugin = new Timestamp();
4
5// 使用身份验证配置时间戳选项
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
7
8// 添加输入PDF文件
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// 指定输出PDF文件
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// 执行时间戳处理
15plugin.Process(opt);
处理PFX文件和密码
AddTimestampOptions
类允许您使用PFX文件进行数字签名以及密码。
- PFX流或文件路径:您可以提供PFX文件的流或文件路径。
- 密码保护:确保安全管理PFX文件的密码。
PDF优化器
Documentize PDF优化器是一个综合插件,通过先进的优化技术增强PDF文档。它旨在帮助减小文件大小,旋转页面,裁剪内容和调整文档尺寸。这些操作提高了PDF文件的质量和可管理性,使其更易于存储、共享和查看。
主要特性:
- 优化:在不降低质量的前提下减小PDF文件大小。
- 旋转:调整PDF页面的朝向。
- 裁剪:去除文档中不必要的边距或内容。
- 调整尺寸:将页面调整为特定尺寸(例如,A4,信纸)。
优化PDF文档
以下步骤演示如何通过减小文件大小来优化PDF文档,同时保持质量。
- 创建Optimizer类的实例。
- 创建一个OptimizeOptions对象,以配置优化设置。
- 添加输入PDF文件并设置优化后文件的输出位置。
- 运行Process方法以执行优化。
1var optimizer = new Optimizer();
2var optimizeOptions = new OptimizeOptions();
3optimizeOptions.AddInput(new FileDataSource("input.pdf"));
4optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
5optimizer.Process(optimizeOptions);
调整PDF文档尺寸
要调整PDF文档的尺寸,可以使用ResizeOptions类来指定文档的新页面大小。
- 实例化Optimizer类。
- 创建一个ResizeOptions对象来定义页面大小。
- 添加输入文件并设置所需的输出位置。
- 使用SetPageSize方法指定新大小(例如,A4)。
- 调用Process方法以应用更改。
1var optimizer = new Optimizer();
2var resizeOptions = new ResizeOptions();
3resizeOptions.AddInput(new FileDataSource("input.pdf"));
4resizeOptions.SetPageSize(PageSize.A4);
5resizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(resizeOptions);
旋转PDF页面
使用RotateOptions类来调整PDF文件中页面的朝向。
- 实例化Optimizer类。
- 创建一个RotateOptions对象并设置旋转角度。
- 添加输入PDF文件并指定输出文件位置。
- 使用SetRotation方法设置旋转角度(例如,90度)。
- 使用Process方法执行旋转。
1var optimizer = new Optimizer();
2var rotateOptions = new RotateOptions();
3rotateOptions.AddInput(new FileDataSource("input.pdf"));
4rotateOptions.SetRotation(90);
5rotateOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(rotateOptions);
裁剪PDF文档
裁剪可以去除PDF文档中不需要的内容或边距。CropOptions类可以用来定义裁剪区域。
- 创建Optimizer类的实例。
- 使用CropOptions对象定义裁剪区域。
- 添加输入文件并指定输出文件位置。
- 使用SetCropBox方法定义裁剪区域。
- 使用Process方法执行裁剪。
1var optimizer = new Optimizer();
2var cropOptions = new CropOptions();
3cropOptions.AddInput(new FileDataSource("input.pdf"));
4cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // 定义裁剪区域
5cropOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(cropOptions);
PDF转DOC转换器
Documentize PDF转DOC转换器 for .NET 是一款强大的工具,旨在将PDF文档转换为DOC或DOCX格式。此插件无缝地将PDF页面转换为可编辑的Microsoft Word文档,使内容在多个平台上易于重用、编辑和共享。
主要特性:
- DOC/DOCX转换: 将PDF文档转换为可编辑的Microsoft Word格式(DOC或DOCX)。
- 保持格式: 在转换过程中保留原始布局、文本和格式。
- 批处理: 一次转换多个PDF文件。
- 自定义转换选项: 通过不同模式(如增强流)微调转换过程,以获得更好的布局。
如何将PDF转换为DOC/DOCX
要将PDF文档转换为DOC/DOCX格式,请按照以下步骤操作:
- 创建
PdfDoc
类的实例。 - 创建
PdfToDocOptions
的实例以配置转换过程。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法添加结果DOC/DOCX文件的输出路径。 - 运行
Process
方法以执行转换。
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.DocX, // 输出格式为DOCX
5 ConversionMode = ConversionMode.EnhancedFlow // 优化布局和格式
6};
7
8// 添加输入的PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// 处理转换
15pdfToWord.Process(options);
使用自定义选项转换PDF为DOC
PDF转DOC转换器 插件提供了多个选项来定制您的转换过程。您可以选择不同的模式来控制在转换过程中PDF的布局和结构如何处理。
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.Doc, // 输出格式为DOC
5 ConversionMode = ConversionMode.Precise // 尽可能保持原始PDF布局
6};
7
8// 添加输入的PDF文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// 添加输出Word文档路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// 处理转换
15pdfToWord.Process(options);
PDF到DOC/DOCX的批处理转换
PDF转DOC转换器 支持批处理,允许您一次转换多个PDF文件。下面是批量转换的示例:
1var pdfToWord = new PdfDoc();
2var options = new PdfToDocOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// 添加多个输入PDF文件
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// 添加结果DOCX文件的输出文件路径
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// 处理批量转换
16pdfToWord.Process(options);
PDF转XLS转换器
Documentize PDF转XLS转换器 for .NET 是一个强大的工具,能够无缝地将PDF文档转换为Excel电子表格(XLS/XLSX)。此插件增强了PDF内容的可访问性和可用性,使数据以电子表格格式更易于操作和分析。
主要特点:
- 将PDF转换为Excel:将PDF文件转换为XLS/XLSX电子表格,以便于数据管理。
- 自定义输出选项:配置输出格式、页面范围、工作表名称等。
- 高保真转换:在转换过程中保留布局、格式和内容的准确性。
- 批处理:一次转换多个PDF文件,以便进行大规模操作。
如何将PDF转换为XLS
要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤操作:
- 创建
PdfXls
类的实例。 - 创建
PdfToXlsOptions
的实例,以配置转换设置。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定输出Excel文件。 - 运行
Process
方法以启动转换。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加输入和输出文件路径
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 运行转换过程
9pdfXlsConverter.Process(options);
自定义PDF到Excel转换
您可以通过修改PdfToXlsOptions
类来自定义转换设置。例如,要将PDF转换为XLSX格式,插入一个空列并命名工作表,可以使用以下代码:
1var options = new PdfToXlsOptions();
2
3// 将输出格式设置为XLSX
4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
5
6// 在第一个位置插入一个空列
7options.InsertBlankColumnAtFirst = true;
8
9// 设置工作表名称
10options.WorksheetName = "MySheet";
11
12// 添加输入和输出文件
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 处理转换
17pdfXlsConverter.Process(options);
处理转换结果
处理完成后,Process方法返回一个ResultContainer
对象,该对象保存转换结果。您可以获取转换后的文件路径或其他输出详情:
1var resultContainer = pdfXlsConverter.Process(options);
2
3// 访问并打印结果文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
PDF到XLS转换的批处理
PDF到XLS转换器插件还支持批处理,允许一次转换多个PDF文件。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加多个输入PDF
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 添加输出Excel文件
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// 处理批量转换
13pdfXlsConverter.Process(options);
常见问题
此常见问题解答提供有关Documentize .NET 插件的全面信息,涵盖PDF转换、表单处理和目录(TOC)生成等方面。
Sure! Please provide the text you would like to translate to Chinese.
常见问题
1. 什么是 Documentize for .NET?
Documentize for .NET 是一个强大的库,用于以编程方式管理和处理 PDF 文档。它包含插件,用于将 PDF 转换为各种格式、编辑 PDF 表单、添加数字签名、生成目录,以及确保 PDF/A 符合长期档案保存的要求。
2. 我如何安装 .NET 的 Documentize 插件?
您可以通过从官方网站下载程序集文件或直接从 NuGet 获取包来安装 Documentize 插件。每个插件的文档中提供了详细的安装说明。
Sure! Please provide the text you would like to translate to Chinese.
PDF 转换插件
3. 如何将PDF文档转换为Word(DOC/DOCX)文件?
要使用PDF to DOC Converter将PDF文档转换为Word格式:
- 实例化
PdfDoc
类。 - 创建一个
PdfToDocOptions
对象以配置转换选项。 - 添加输入PDF和输出DOC/DOCX文件路径。
- 调用
Process
方法以执行转换。
4. 如何将 PDF 页面转换为 JPEG 图像?
使用 PDF 转 JPEG 转换器:
- 创建
Jpeg
类的实例。 - 通过
JpegOptions
设置转换选项(例如,分辨率、页面范围)。 - 添加输入/输出文件路径。
- 调用
Jpeg.Process
方法以运行转换。
5. 我该如何将 PDF 转换为 PNG?
要将 PDF 转换为 PNG 格式:
- 创建
Png
类的实例和 PngOptions
对象。 - 添加输入 PDF 并指定输出文件夹。
- 设置选项,例如分辨率(例如,300 DPI)。
- 调用
Process
方法生成 PNG 图像。
6. 如何将 PDF 转换为 Excel (XLS/XLSX)?
要将 PDF 转换为 Excel:
- 实例化
PdfXls
类。 - 使用
PdfToXlsOptions
配置输入/输出路径和转换选项。 - 调用
Process
方法开始转换。
7. 我如何将 PDF 转换为 HTML?
要将 PDF 文档转换为 HTML:
- 创建
PdfHtml
类的实例。 - 使用
PdfToHtmlOptions
或 HtmlToPdfOptions
配置转换选项。 - 添加输入/输出路径并调用
Process
方法。
Sure! Please provide the text you would like to translate to Chinese.
PDF 表单处理
8. 我如何使用表单编辑器编辑PDF表单?
PDF表单编辑器提供了以下功能:
- 添加字段(
FormEditorAddOptions
)。 - 更新字段(
FormEditorSetOptions
)。 - 删除字段(
FormRemoveSelectedFieldsOptions
)。
配置完表单字段后,运行Process
方法。
9. 如何扁平化 PDF 表单?
要扁平化表单字段:
- 实例化
FormFlattener
类。 - 使用
FormFlattenAllFieldsOptions
来扁平化所有字段,或使用 FormFlattenSelectedFieldsOptions
来针对特定字段。 - 添加输入/输出文件并调用
Process
方法。
10. 如何从 PDF 表单中导出数据?
要导出表单数据,请使用 PDF 表单导出器。创建一个 FormExporterValuesToCsvOptions
对象,指定表单字段条件,然后运行 Process
方法将数据导出为 CSV 格式。
Sure! Please provide the text you would like to translate to Chinese.
PDF/A 和 TOC 管理
11. 如何将 PDF 转换为 PDF/A 格式?
要将 PDF 转换为 PDF/A:
- 使用
PdfAConverter
类。 - 在
PdfAConvertOptions
中配置 PDF/A 版本(例如,PDF/A-3B)。 - 添加输入/输出路径并调用
Process
方法。
12. 如何在 PDF 中生成目录 (TOC)?
要创建目录:
- 创建
TocGenerator
类的实例。 - 使用
TocOptions
定义目录参数。 - 添加输入/输出文件并运行
Process
方法。
Sure! Please provide the text you would like to translate to Chinese.
签名处理
13. 我该如何对 PDF 文档进行数字签名?
要添加数字签名:
- 实例化
Signature
类。 - 使用
SignOptions
配置 PFX 文件、密码和签名详细信息(例如,原因、联系信息)。 - 添加输入/输出文件并运行
Process
方法。
Sure! Please provide the text you would like to translate to Chinese.
额外功能
14. 我可以使用 Documentize 来拆分 PDF 文件吗?
可以,使用 PDF 拆分器:
- 实例化
Splitter
类。 - 使用
SplitOptions
配置拆分选项。 - 添加输入/输出路径并调用
Process
方法。
15. 我该如何将多个PDF文件合并为一个?
要合并PDF:
- 实例化
Merger
类。 - 添加输入PDF并通过
MergeOptions
指定输出文件。 - 运行
Process
方法以合并文件。
16. Documentize 是否仅限于处理 PDF 文件?
虽然 Documentize 主要专注于 PDF 操作,但它也支持与 DOC、XLS、HTML、JPEG 和 PNG 等格式之间的转换。
Sure! Please provide the text you would like to translate to Chinese.
许可和兼容性
17. 使用 Documentize 插件的系统要求是什么?
Documentize 支持:
- 操作系统:Windows 7-11、Windows Server 2003-2022、macOS(10.12+)和 Linux。
- 框架:.NET Framework 4.0 至 8.0。
- IDE:兼容各种版本的 Visual Studio。
18. 我如何为 Documentize 设置许可证密钥?
要激活插件,请在您的项目中引用 Documentize 并在调用任何方法之前设置许可证密钥。有关详细说明,请参考特定插件的文档。
19. 我在哪里可以找到更多Documentize插件的示例和文档?
完整的API文档和示例可以在Documentize网站上找到,或通过您的开发环境中的NuGet包找到。
请提供您希望翻译的文本。