PDF Converter

PDF to HTML

使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,以获得一致、专业的结果。

PDF to DOC

使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。

HTML to PDF

使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式,以获得一致、专业的结果。

PDF to JPEG

使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。

PDF to PDF/A

使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。

PDF to PNG

使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。

PDF to TIFF

使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。

PDF to XLS

使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。

PDF Converter 的子部分

PDF to HTML

Documentize PDF Converter for .NET 提供强大的文档 PDF 转换为 HTML 格式的功能,适用于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应不同的项目要求。

转换 PDF 为 HTML

将 PDF 文件转换为 HTML,使文档可用于 Web 浏览或集成到更喜欢 HTML 格式的应用程序中。

  1. 配置选项:使用 PdfToHtmlOptions 自定义输出,选择嵌入资源或外部资源。
  2. 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
  3. 执行转换:调用 PdfConverterConvert 方法来转换文件。

示例:使用嵌入资源将 PDF 转换为 HTML

1// 创建 PdfToHtmlOptions 对象,以将输出数据类型设置为带嵌入资源的文件
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.html"));
7// 执行处理
8PdfConverter.Convert(options);

可用于 PDF 转 HTML 转换的选项

  • SaveDataType
    • FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单个 HTML 文件。
    • FileWithExternalResources: 将资源单独保存,适合大型 HTML 文件。

PDF to DOC

Documentize PDF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为 DOC 或 DOCX 格式。此插件无缝地将 PDF 页面转换为可编辑的 Microsoft Word 文档,使内容在多个平台之间的重用、编辑和共享变得简单。

如何将 PDF 转换为 DOC/DOCX

要将 PDF 文档转换为 DOC/DOCX 格式,请按照以下步骤操作:

  1. 创建一个 PdfToDocOptions 的实例以配置转换过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法添加输出文件路径。
  4. 运行 Convert 方法以执行转换。
1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 执行操作
8PdfConverter.Convert(options);

使用自定义选项转换 PDF 到 DOC

PDF to DOC Converter 插件提供了多个选项,以自定义您的转换过程。您可以选择不同的模式,以控制在转换过程中 PDF 的布局和结构如何处理。

 1// 创建 PdfToDocOptions 对象以设置指令
 2var options = new PdfToDocOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出文件路径
 6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
 7// 设置模式
 8options.Mode = DocConversionMode.Flow;
 9// 执行操作
10PdfConverter.Convert(options);

主要特点:

  • DOC/DOCX 转换:将 PDF 文档转换为可编辑的 Microsoft Word 格式(DOC 或 DOCX)。
  • 保持格式:在转换过程中保留原始布局、文本和格式。
  • 自定义转换选项:通过不同模式微调转换过程,例如增强流模式,以获得更好的布局。

HTML to PDF

Documentize PDF Converter for .NET 提供强大的功能,用于在 HTML 和 PDF 格式之间转换文档,非常适合用于 Web 应用程序、归档和报告生成。凭借多种处理资源和布局的选项,转换器能够适应各种项目需求。

将 HTML 转换为 PDF

将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。 要将 HTML 文档转换为 PDF,请按照以下步骤操作:

  1. 配置选项:使用 HtmlToPdfOptions 定义布局和媒体设置。
  2. 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
  3. 执行转换:运行 PdfConverterConvert 方法以转换文件。

示例:将 HTML 转换为 PDF

1// 创建 HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.html"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.pdf"));
7// 执行过程
8PdfConverter.Convert(options);

HTML 转 PDF 转换的其他选项

  • 媒体类型

    • HtmlMediaType.Print:适合生成适合打印的 PDF。
    • HtmlMediaType.Screen:在转换为设计用于数字观看的内容时使用。
  • 布局调整

    • PageLayoutOption:调整 HTML 内容如何适应 PDF 布局,例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
    • IsRenderToSinglePage:如果需要进行简洁的展示,可启用将整个 HTML 内容呈现在单个 PDF 页面上。

该转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到转换 PDF 文档归档以便于 Web 可访问性。有关更高级的配置,请参考完整的 Documentize 文档。

PDF to JPEG

Documentize PDF Converter for .NET 是一款强大的工具,可以简化PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各平台上更易访问。

如何将PDF页面转换为JPEG

要将PDF文档转换为JPEG图像,请按照以下步骤操作:

  1. 创建一个PdfToJpegOptions实例以配置转换过程。
  2. 使用AddInput方法添加输入PDF文件。
  3. 使用AddOutput方法设置JPEG图像的输出目录路径。
  4. 运行Convert方法将PDF页面转换为JPEG图像。
1  
2// 创建PdfToJpegOptions对象以设置指令  
3var options = new PdfToJpegOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_input.pdf"));  
6// 设置输出目录路径  
7options.AddOutput(new DirectoryDataSource("path_to_output_directory"));  
8// 执行转换  
9PdfConverter.Convert(options);  

自定义PDF到JPEG转换

您可以通过调整分辨率、选择页面范围或设置图像质量来定制转换过程。以下是如何以200 DPI转换PDF的第一页:

 1  
 2// 创建PdfToJpegOptions对象以设置指令  
 3var options = new PdfToJpegOptions();  
 4// 仅处理第一页  
 5options.PageList = [1];  
 6// 设置输出分辨率为200 DPI  
 7options.OutputResolution = 200;  
 8// 设置输出质量为50  
 9options.Quality = 50;  
10// 添加输入文件路径  
11options.AddInput(new FileDataSource("path_to_input.pdf"));  
12// 设置输出目录路径  
13options.AddOutput(new DirectoryDataSource("path_to_output_directory"));  
14// 执行转换  
15PdfConverter.Convert(options);  

如何在没有目录的情况下获取结果,或以流的形式获取

Convert 方法返回一个 ResultContainer 对象,其中包含有关转换结果的信息。您可以获取已转换JPEG文件的流,如下所示:

 1  
 2// 创建PdfToJpegOptions对象以设置指令  
 3var options = new PdfToJpegOptions();  
 4// 添加输入文件路径  
 5options.AddInput(new FileDataSource("path_to_input.pdf"));  
 6// 执行转换  
 7var results = PdfConverter.Convert(options);  
 8// 获取流结果  
 9foreach (var result in results.ResultCollection)  
10{  
11    var streamResultPage1 = result.ToStream();  
12}  

关键特性:

  • 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
  • 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
  • 页面设置:选择特定页面进行转换。
  • 快速转换:快速高效的过程,最小化努力。

PDF to PDF/A

Documentize PDF Converter for .NET 是一个强大的工具,旨在将PDF文档转换为PDF/A格式,确保您的内容符合长期归档标准。该插件还支持验证现有PDF文档的PDF/A合规性,提供转换和验证功能于单一解决方案中。

如何将PDF转换为PDF/A

要将PDF文档转换为PDF/A格式,请按照以下步骤操作:

  1. 创建一个 PdfToPdfAOptions 的实例以配置转换。
  2. 指定所需的PDF/A版本(例如,PDF/A-3B)。
  3. 使用 AddInput 方法添加输入PDF文件。
  4. 使用 AddOutput 方法添加输出PDF/A文件。
  5. 调用 Convert 方法以执行转换。
 1// 创建选项类以设置转换过程
 2var options = new PdfToPdfAOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// 添加源文件
 8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // 替换为您的实际文件路径
 9
10// 添加转换后文件保存的路径
11options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
12
13// 运行转换
14PdfConverter.Convert(options);

验证PDF/A合规性

您可以使用 PdfAValidateOptions 类验证现有PDF文件的PDF/A合规性。

 1// 创建选项类以设置验证过程
 2var options = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// 添加要验证的一或多个文件
 8options.AddInput(new FileDataSource("path_to_your_first_pdf_file.pdf")); // 替换为您的实际文件路径
 9options.AddInput(new FileDataSource("path_to_your_second_pdf_file.pdf"));
10// 根据需要添加更多文件
11
12// 运行验证并获取结果
13var resultContainer = PdfConverter.Validate(options);
14
15// 检查 resultContainer.ResultCollection 属性以获取每个文件的验证结果:
16for (var i = 0; i < resultContainer.ResultCollection.Count; i++)
17{
18    var result = resultContainer.ResultCollection[i];
19    var validationResult = (PdfAValidationResult) result.Data;
20    var isValid = validationResult.IsValid; // 第 i 个文档的验证结果
21}

主要功能:

  • 转换为PDF/A:将PDF文件无缝转换为PDF/A格式(如PDF/A-1a、PDF/A-2b、PDF/A-3b),以确保符合归档标准。
  • 验证PDF/A合规性:检查现有PDF文档是否符合PDF/A标准,并识别不合规的问题。
  • 高效工作流程:通过快速可靠的转换过程来最小化时间和精力。

PDF to PNG

Documentize PDF Converter for .NET 是一款先进的工具,可以将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并且更易于分享。

如何将 PDF 转换为 PNG

要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:

  1. 创建一个 PdfToPngOptions 实例以配置转换过程。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法设置 PNG 图像的输出目录路径。
  4. 运行 Convert 方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);

自定义 PDF 到 PNG 转换

您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页:

 1// 创建 PdfToPngOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 仅处理第一页
 4options.PageList = [1];
 5// 设置输出分辨率为 200 DPI
 6options.OutputResolution = 200;
 7// 添加输入文件路径
 8options.AddInput(new FileDataSource("path_to_input.pdf"));
 9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行过程
12PdfConverter.Convert(options);

处理转换结果

Convert 方法返回一个 ResultContainer 对象,该对象保存有关转换结果的信息。您可以如下获取转换后的 PNG 文件的流:

 1// 创建 PdfToJpegOptions 对象以设置指令
 2var options = new PdfToPngOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行过程
 6var results = PdfConverter.Convert(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点:

  • 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
  • 可自定义的分辨率:设置所需的 DPI(例如,300 DPI)以获取高质量图像输出。
  • 页面集:选择特定页面进行转换。
  • 简单的输出管理:为每个转换后的 PNG 文件指定输出目录。
  • 快速转换:快速、高效,配置所需的努力最小。

PDF to TIFF

Documentize PDF 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件可确保您的内容在各种平台上可访问,同时保持出色的保真度和灵活性。 您可以通过调整分辨率、启用多页输出或选择页面来自定义转换过程。

如何将 PDF 转换为 TIFF

要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:

  1. 创建一个 PdfToTiffOptions 实例以配置转换过程。
  2. 使用 AddInput 方法添加输入的 PDF 文件。
  3. 使用 AddOutput 方法指定 TIFF 图像的输出文件路径。
  4. 运行 Convert 方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置页面
 8options.PageList = [1, 3];
 9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行过程
12PdfConverter.Convert(options);

多页 TIFF 创建

该插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为单个 TIFF 文件,以便高效归档或打印。

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 启用多页 TIFF 输出
 8options.MultiPage = true;
 9// 执行过程
10PdfConverter.Convert(options);

自定义 PDF 到 TIFF 转换的页面和 DPI

以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 设置输出目录路径
 6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
 7// 设置压缩和色深
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行过程
11PdfConverter.Convert(options);

如何处理转换结果

Convert 方法返回一个 ResultContainer 对象,提供有关转换结果的详细信息。您可以获取转换后 TIFF 文件的流,如下所示:

 1// 创建 PdfToTiffOptions 对象以设置指令
 2var options = new PdfToTiffOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_input.pdf"));
 5// 执行过程
 6var results = PdfConverter.Convert(options);
 7// 获取流结果
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

主要特点:

  • 将 PDF 转换为 TIFF: 轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
  • 自定义分辨率: 调整分辨率(例如,300 dpi)以获得优质输出。
  • 多页 TIFF: 将多个 PDF 页面合并为单个多页 TIFF 文件。
  • 页面设置: 选择特定页面进行转换。
  • 快速转换: 过程快速高效,尽量减少工作量。

PDF to XLS

Documentize PDF Converter for .NET 是一个多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过利用这个插件,开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件(XLSX),请遵循以下步骤:

  1. 使用 PdfToXlsOptions 类配置转换设置。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定输出文件路径。
  4. 执行 Convert 方法以启动转换。
1  
2// 创建 PdfToXlsOptions 对象以设置指令  
3var options = new PdfToXlsOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
6// 设置输出文件路径  
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));  
8// 执行处理  
9PdfConverter.Convert(options);  

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:

 1  
 2// 创建 PdfToXlsOptions 对象以设置指令  
 3var options = new PdfToXlsOptions();  
 4// 添加输入文件路径  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 6// 指定 XLS 格式  
 7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  
 8options.InsertBlankColumnAtFirst = true;  
 9options.MinimizeTheNumberOfWorksheets = true;  
10// 设置输出文件路径  
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));  
12// 执行处理  
13PdfConverter.Convert(options);  

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:

  • XLSX:Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM:启用宏的 Excel 格式。
  • CSV:逗号分隔值。
  • ODS:开放文档电子表格。
  • XMLSpreadSheet2003:Excel 2003 XML (.xls) 文件格式。

主要特点:

  • 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 高级格式:插入空白列或最小化工作表数量。
 中文