PDF Converter
使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,以获得一致、专业的结果。
使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档—保留格式和结构以便于编辑。
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式,以获得一致、专业的结果。
使用Documentize的.NET工具将PDF转换为JPEG图像——轻松从文档中提取高质量图像。
使用Documentize的.NET工具将PDF转换为PDF/A格式—确保长期归档和合规轻松实现。
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取用于网页和图形的高质量图像。
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像以进行专业的文档管理。
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
PDF Converter 的子部分
PDF to HTML
Documentize PDF Converter for .NET 提供强大的文档 PDF 转换为 HTML 格式的功能,适用于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应不同的项目要求。
转换 PDF 为 HTML
将 PDF 文件转换为 HTML,使文档可用于 Web 浏览或集成到更喜欢 HTML 格式的应用程序中。
- 配置选项:使用
PdfToHtmlOptions 自定义输出,选择嵌入资源或外部资源。 - 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
PdfConverter 的 Convert 方法来转换文件。
示例:使用嵌入资源将 PDF 转换为 HTML
1// 创建 PdfToHtmlOptions 对象,以将输出数据类型设置为带嵌入资源的文件
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.html"));
7// 执行处理
8PdfConverter.Convert(options);
可用于 PDF 转 HTML 转换的选项
- SaveDataType:
FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单个 HTML 文件。FileWithExternalResources: 将资源单独保存,适合大型 HTML 文件。
PDF to DOC
Documentize PDF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为 DOC 或 DOCX 格式。此插件无缝地将 PDF 页面转换为可编辑的 Microsoft Word 文档,使内容在多个平台之间的重用、编辑和共享变得简单。
如何将 PDF 转换为 DOC/DOCX
要将 PDF 文档转换为 DOC/DOCX 格式,请按照以下步骤操作:
- 创建一个
PdfToDocOptions 的实例以配置转换过程。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法添加输出文件路径。 - 运行
Convert 方法以执行转换。
1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 执行操作
8PdfConverter.Convert(options);
使用自定义选项转换 PDF 到 DOC
PDF to DOC Converter 插件提供了多个选项,以自定义您的转换过程。您可以选择不同的模式,以控制在转换过程中 PDF 的布局和结构如何处理。
1// 创建 PdfToDocOptions 对象以设置指令
2var options = new PdfToDocOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.doc"));
7// 设置模式
8options.Mode = DocConversionMode.Flow;
9// 执行操作
10PdfConverter.Convert(options);
主要特点:
- DOC/DOCX 转换:将 PDF 文档转换为可编辑的 Microsoft Word 格式(DOC 或 DOCX)。
- 保持格式:在转换过程中保留原始布局、文本和格式。
- 自定义转换选项:通过不同模式微调转换过程,例如增强流模式,以获得更好的布局。
HTML to PDF
Documentize PDF Converter for .NET 提供强大的功能,用于在 HTML 和 PDF 格式之间转换文档,非常适合用于 Web 应用程序、归档和报告生成。凭借多种处理资源和布局的选项,转换器能够适应各种项目需求。
将 HTML 转换为 PDF
将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。
要将 HTML 文档转换为 PDF,请按照以下步骤操作:
- 配置选项:使用
HtmlToPdfOptions 定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
- 执行转换:运行
PdfConverter 的 Convert 方法以转换文件。
示例:将 HTML 转换为 PDF
1// 创建 HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.html"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_output.pdf"));
7// 执行过程
8PdfConverter.Convert(options);
HTML 转 PDF 转换的其他选项
媒体类型:
HtmlMediaType.Print:适合生成适合打印的 PDF。HtmlMediaType.Screen:在转换为设计用于数字观看的内容时使用。
布局调整:
PageLayoutOption:调整 HTML 内容如何适应 PDF 布局,例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。IsRenderToSinglePage:如果需要进行简洁的展示,可启用将整个 HTML 内容呈现在单个 PDF 页面上。
该转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到转换 PDF 文档归档以便于 Web 可访问性。有关更高级的配置,请参考完整的 Documentize 文档。
PDF to JPEG
Documentize PDF Converter for .NET 是一款强大的工具,可以简化PDF文档转换为高质量JPEG图像的过程。该插件旨在通过将PDF页面转换为广泛使用的图像格式,使您的内容在各平台上更易访问。
如何将PDF页面转换为JPEG
要将PDF文档转换为JPEG图像,请按照以下步骤操作:
- 创建一个
PdfToJpegOptions实例以配置转换过程。 - 使用
AddInput方法添加输入PDF文件。 - 使用
AddOutput方法设置JPEG图像的输出目录路径。 - 运行
Convert方法将PDF页面转换为JPEG图像。
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_input.pdf"));
6// 设置输出目录路径
7options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
8// 执行转换
9PdfConverter.Convert(options);
自定义PDF到JPEG转换
您可以通过调整分辨率、选择页面范围或设置图像质量来定制转换过程。以下是如何以200 DPI转换PDF的第一页:
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 仅处理第一页
5options.PageList = [1];
6// 设置输出分辨率为200 DPI
7options.OutputResolution = 200;
8// 设置输出质量为50
9options.Quality = 50;
10// 添加输入文件路径
11options.AddInput(new FileDataSource("path_to_input.pdf"));
12// 设置输出目录路径
13options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
14// 执行转换
15PdfConverter.Convert(options);
如何在没有目录的情况下获取结果,或以流的形式获取
Convert 方法返回一个 ResultContainer 对象,其中包含有关转换结果的信息。您可以获取已转换JPEG文件的流,如下所示:
1
2// 创建PdfToJpegOptions对象以设置指令
3var options = new PdfToJpegOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_input.pdf"));
6// 执行转换
7var results = PdfConverter.Convert(options);
8// 获取流结果
9foreach (var result in results.ResultCollection)
10{
11 var streamResultPage1 = result.ToStream();
12}
关键特性:
- 将PDF转换为JPEG:轻松将整个PDF文档或特定页面转换为JPEG图像。
- 自定义分辨率:调整分辨率(例如,300 dpi)以获得高质量输出。
- 页面设置:选择特定页面进行转换。
- 快速转换:快速高效的过程,最小化努力。
PDF to PDF/A
Documentize PDF Converter for .NET 是一个强大的工具,旨在将PDF文档转换为PDF/A格式,确保您的内容符合长期归档标准。该插件还支持验证现有PDF文档的PDF/A合规性,提供转换和验证功能于单一解决方案中。
如何将PDF转换为PDF/A
要将PDF文档转换为PDF/A格式,请按照以下步骤操作:
- 创建一个
PdfToPdfAOptions 的实例以配置转换。 - 指定所需的PDF/A版本(例如,PDF/A-3B)。
- 使用
AddInput 方法添加输入PDF文件。 - 使用
AddOutput 方法添加输出PDF/A文件。 - 调用
Convert 方法以执行转换。
1// 创建选项类以设置转换过程
2var options = new PdfToPdfAOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// 添加源文件
8options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // 替换为您的实际文件路径
9
10// 添加转换后文件保存的路径
11options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
12
13// 运行转换
14PdfConverter.Convert(options);
验证PDF/A合规性
您可以使用 PdfAValidateOptions 类验证现有PDF文件的PDF/A合规性。
1// 创建选项类以设置验证过程
2var options = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// 添加要验证的一或多个文件
8options.AddInput(new FileDataSource("path_to_your_first_pdf_file.pdf")); // 替换为您的实际文件路径
9options.AddInput(new FileDataSource("path_to_your_second_pdf_file.pdf"));
10// 根据需要添加更多文件
11
12// 运行验证并获取结果
13var resultContainer = PdfConverter.Validate(options);
14
15// 检查 resultContainer.ResultCollection 属性以获取每个文件的验证结果:
16for (var i = 0; i < resultContainer.ResultCollection.Count; i++)
17{
18 var result = resultContainer.ResultCollection[i];
19 var validationResult = (PdfAValidationResult) result.Data;
20 var isValid = validationResult.IsValid; // 第 i 个文档的验证结果
21}
主要功能:
- 转换为PDF/A:将PDF文件无缝转换为PDF/A格式(如PDF/A-1a、PDF/A-2b、PDF/A-3b),以确保符合归档标准。
- 验证PDF/A合规性:检查现有PDF文档是否符合PDF/A标准,并识别不合规的问题。
- 高效工作流程:通过快速可靠的转换过程来最小化时间和精力。
PDF to PNG
Documentize PDF Converter for .NET 是一款先进的工具,可以将 PDF 文档转换为高质量的 PNG 图像。此插件旨在通过将 PDF 页面转换为广泛支持的图像格式,使您的内容更加多样化、可访问,并且更易于分享。
如何将 PDF 转换为 PNG
要将 PDF 文档转换为 PNG 图像,请按照以下步骤操作:
- 创建一个
PdfToPngOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法设置 PNG 图像的输出目录路径。 - 运行
Convert 方法将 PDF 页面转换为 PNG 图像。
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);
自定义 PDF 到 PNG 转换
您可以通过调整分辨率和选择特定页面来自定义转换。例如,要以 200 DPI 转换 PDF 的第一页:
1// 创建 PdfToPngOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 仅处理第一页
4options.PageList = [1];
5// 设置输出分辨率为 200 DPI
6options.OutputResolution = 200;
7// 添加输入文件路径
8options.AddInput(new FileDataSource("path_to_input.pdf"));
9// 设置输出目录路径
10options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
11// 执行过程
12PdfConverter.Convert(options);
处理转换结果
Convert 方法返回一个 ResultContainer 对象,该对象保存有关转换结果的信息。您可以如下获取转换后的 PNG 文件的流:
1// 创建 PdfToJpegOptions 对象以设置指令
2var options = new PdfToPngOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行过程
6var results = PdfConverter.Convert(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特点:
- 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
- 可自定义的分辨率:设置所需的 DPI(例如,300 DPI)以获取高质量图像输出。
- 页面集:选择特定页面进行转换。
- 简单的输出管理:为每个转换后的 PNG 文件指定输出目录。
- 快速转换:快速、高效,配置所需的努力最小。
PDF to TIFF
Documentize PDF 转换器 for .NET 是一款强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。此插件可确保您的内容在各种平台上可访问,同时保持出色的保真度和灵活性。
您可以通过调整分辨率、启用多页输出或选择页面来自定义转换过程。
如何将 PDF 转换为 TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建一个
PdfToTiffOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入的 PDF 文件。 - 使用
AddOutput 方法指定 TIFF 图像的输出文件路径。 - 运行
Convert 方法将 PDF 页面转换为 TIFF 图像。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 执行过程
8PdfConverter.Convert(options);
自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置页面
8options.PageList = [1, 3];
9// 设置结果图像分辨率
10options.OutputResolution = 400;
11// 执行过程
12PdfConverter.Convert(options);
多页 TIFF 创建
该插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为单个 TIFF 文件,以便高效归档或打印。
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 启用多页 TIFF 输出
8options.MultiPage = true;
9// 执行过程
10PdfConverter.Convert(options);
自定义 PDF 到 TIFF 转换的页面和 DPI
以下是如何以 400 DPI 转换 PDF 的 2 页到 TIFF 文件:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出目录路径
6options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
7// 设置压缩和色深
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// 执行过程
11PdfConverter.Convert(options);
如何处理转换结果
Convert 方法返回一个 ResultContainer 对象,提供有关转换结果的详细信息。您可以获取转换后 TIFF 文件的流,如下所示:
1// 创建 PdfToTiffOptions 对象以设置指令
2var options = new PdfToTiffOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_input.pdf"));
5// 执行过程
6var results = PdfConverter.Convert(options);
7// 获取流结果
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特点:
- 将 PDF 转换为 TIFF: 轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
- 自定义分辨率: 调整分辨率(例如,300 dpi)以获得优质输出。
- 多页 TIFF: 将多个 PDF 页面合并为单个多页 TIFF 文件。
- 页面设置: 选择特定页面进行转换。
- 快速转换: 过程快速高效,尽量减少工作量。
PDF to XLS
Documentize PDF Converter for .NET 是一个多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过利用这个插件,开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件(XLSX),请遵循以下步骤:
- 使用
PdfToXlsOptions 类配置转换设置。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法指定输出文件路径。 - 执行
Convert 方法以启动转换。
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));
8// 执行处理
9PdfConverter.Convert(options);
自定义 PDF 到 Excel 转换
PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 指定 XLS 格式
7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
8options.InsertBlankColumnAtFirst = true;
9options.MinimizeTheNumberOfWorksheets = true;
10// 设置输出文件路径
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
12// 执行处理
13PdfConverter.Convert(options);
支持的输出格式
PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:
- XLSX:Office Open XML (.xlsx) 文件格式(默认)。
- XLSM:启用宏的 Excel 格式。
- CSV:逗号分隔值。
- ODS:开放文档电子表格。
- XMLSpreadSheet2003:Excel 2003 XML (.xls) 文件格式。
主要特点:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式:插入空白列或最小化工作表数量。