PDF Converter
使用 Documentize 的 .NET 工具将 HTML 转换为 PDF——保留布局和格式,实现一致、专业的效果。
使用 Documentize 的 .NET 工具将 PDF 转换为 Word 文档——保留格式和结构,便于编辑。
使用 Documentize 的 .NET 工具将 PDF 转换为 HTML——保留布局和格式,确保一致且专业的效果。
使用 Documentize 的 .NET 工具将 PDF 转换为 JPEG 图像——轻松从文档中提取高质量图像。
使用 Documentize 的 .NET 工具将 PDF 转换为 PDF/A 格式——轻松确保长期归档和合规性。
使用 Documentize 的 .NET 工具将 PDF 转换为 PNG 图像——提取高质量图像用于网页和图形用途。
使用 Documentize 的 .NET 工具将 PDF 转换为 TIFF 图像——提取高分辨率图像,实现专业文档管理。
使用 Documentize 的 .NET 工具将 PDF 转换为 Excel——快速提取表格和数据,实现无缝分析和处理。
PDF Converter 的子部分
HTML to PDF
Documentize PDF Converter for .NET 提供强大的 HTML 到 PDF 格式转换功能,适用于网页应用、归档和报告生成。通过多种资源和布局处理选项,转换器可以适配各种项目需求。
将 HTML 转换为 PDF
将 HTML 内容转换为高质量的 PDF,完美用于生成可打印的报告、归档网页内容或创建可共享的文档格式。
要将 HTML 文档转换为 PDF,请按照以下步骤操作:
- 配置选项:使用
HtmlToPdfOptions 定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
- 执行转换:调用
PdfConverter 的 Convert 方法进行转换。
示例:将 HTML 转换为 PDF
1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);
HTML 转 PDF 转换的其他选项
媒体类型:
HtmlMediaType.Print:适用于生成适合打印的 PDF。HtmlMediaType.Screen:用于转换面向数字显示的内容。
布局调整:
PageLayoutOption:调整 HTML 内容如何适配 PDF 布局,例如 ScaleToPageWidth 可确保内容按 PDF 宽度进行缩放。IsRenderToSinglePage:如有需要,可将整个 HTML 内容渲染到单个 PDF 页面,以实现简洁的展示。
该转换器在各种应用场景中都非常灵活,无论是基于网页内容生成 PDF 报告,还是将 PDF 文档归档转换为网页可访问形式。欲了解更高级的配置,请参阅完整的 Documentize 文档。
PDF to DOC
Documentize PDF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为 DOC 格式。该组件可以无缝地将 PDF 页面转换为可编辑的 Microsoft Word 文档,轻松实现内容的重用、编辑和跨平台共享。
如何将 PDF 转换为 DOC
将 PDF 文档转换为 DOC 格式,请按照以下步骤操作:
- 创建
PdfToDocOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入的 PDF 文件。 - 使用
AddOutput 方法添加输出文件的路径。 - 调用
Convert 方法执行转换。
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Perform the process
8PdfConverter.Convert(options);
使用自定义选项将 PDF 转换为 DOC
PDF to DOC Converter 插件提供了多种选项,以自定义转换过程。您可以在不同模式之间选择,以控制在转换期间如何处理 PDF 的布局和结构。
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Set Mode
8options.Mode = DocConversionMode.Flow;
9// Perform the process
10PdfConverter.Convert(options);
关键特性:
- DOC 转换:将 PDF 文档转换为可编辑的 Microsoft Word 格式(DOC)。
- 保持格式:在转换过程中保留原始的布局、文本和格式。
PDF 转 HTML
Documentize PDF Converter for .NET 提供了强大的 PDF 转 HTML 功能,适用于 Web 应用、归档以及报表生成。通过多种资源和布局处理选项,转换器能够满足各种项目需求。
将 PDF 转换为 HTML
将 PDF 文件转换为 HTML,使文档能够在网页上查看或集成到更偏好 HTML 格式的应用中。
- 配置选项:使用
PdfToHtmlOptions 自定义输出,可选择嵌入式资源或外部资源。 - 定义输入输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
PdfConverter 的 Convert 方法进行转换。
示例:使用嵌入式资源将 PDF 转换为 HTML
1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);
PDF 转 HTML 转换的可用选项
- SaveDataType:
FileWithEmbeddedResources:生成一个包含所有资源的单一 HTML 文件。FileWithExternalResources:资源单独保存,适用于大的 HTML 文件。
PDF 转 JPEG
The Documentize PDF Converter for .NET 是一款强大的工具,简化了将 PDF 文档转换为高质量 JPEG 图像的过程。该组件旨在通过将 PDF 页面转换为广泛使用的图像格式,使您的内容在各平台上更易访问。
如何将 PDF 页面转换为 JPEG
要将 PDF 文档转换为 JPEG 图像,请按以下步骤操作:
- 创建
PdfToJpegOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法设置 JPEG 图像的输出目录路径。 - 调用
Convert 方法将 PDF 页面转换为 JPEG 图像。
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
定制 PDF 转 JPEG 转换
您可以通过调整分辨率、选择页面范围或设置图像质量来自定义转换过程。以下示例演示如何以 200 DPI 将 PDF 的第一页转换为 JPEG:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Process only the first page
4options.PageList = [1];
5// Set output resolution to 200 DPI
6options.OutputResolution = 200;
7// Set output quality to 50
8options.Quality = 50;
9// Add input File path
10options.AddInput(new FileData("path_to_input.pdf"));
11// Set output Directory path
12options.AddOutput(new DirectoryData("path_to_output_directory"));
13// Perform the process
14PdfConverter.Convert(options);
如何在不使用目录或以流的形式获取结果
Convert 方法返回一个 ResultContainer 对象,包含转换结果的信息。您可以按以下方式获取转换后 JPEG 文件的流:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
关键特性
- Convert PDF to JPEG:轻松将整个 PDF 文档或特定页面转换为 JPEG 图像。
- Custom Resolution:可调节分辨率(例如 300 dpi),获得高质量输出。
- Page set:选择要转换的特定页面。
- Quick Conversion:快速高效,耗时少。
PDF 转 PDF/A
The Documentize PDF Converter for .NET is a powerful tool designed to convert PDF documents into the PDF/A format, ensuring that your content remains compliant with long-term archiving standards. This component also supports validating existing PDF documents for PDF/A compliance, offering both conversion and validation features in a single solution.
如何将 PDF 转换为 PDF/A
To convert a PDF document into PDF/A format, follow these steps:
- Create an instance of
PdfToPdfAOptions to configure the conversion. - Specify the desired PDF/A version (e.g., PDF/A-3B).
- Add the input PDF file using the
AddInput method. - Add the output file for the resulting PDF/A using the
AddOutput method. - Call the
Convert method to execute the conversion.
1// Create the options class to set up the conversion process
2var options = new PdfToPdfAOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Add the source file
8options.AddInput(new FileData("path_to_your_pdf_file.pdf")); // replace with your actual file path
9
10// Add the path to save the converted file
11options.AddOutput(new FileData("path_to_the_converted_file.pdf"));
12
13// Run the conversion
14PdfConverter.Convert(options);
验证 PDF/A 合规性
You can validate existing PDF files for PDF/A compliance using the PdfAValidateOptions class.
1// Create the options class to set up the validation process
2var options = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Add one or more files to be validated
8options.AddInput(new FileData("path_to_your_first_pdf_file.pdf")); // replace with your actual file path
9options.AddInput(new FileData("path_to_your_second_pdf_file.pdf"));
10// add more files as needed
11
12// Run the validation and get results
13var resultContainer = PdfConverter.Validate(options);
14
15// Check the resultContainer.ResultCollection property for validation results for each file:
16foreach (var result in resultContainer.ResultCollection)
17{
18 var validationResult = (PdfAValidationResult) result.Data;
19 var isValid = validationResult.IsValid; // Validation result for document
20}
关键特性:
- Convert to PDF/A: Seamlessly transform PDF files into the PDF/A format (such as PDF/A-1a, PDF/A-2b, PDF/A-3b) to ensure compliance with archiving standards.
- Validate PDF/A Compliance: Check existing PDF documents for conformance with PDF/A standards and identify issues if they do not comply.
- Efficient Workflow: Minimize time and effort with fast and reliable conversion processes.
PDF to PNG
Documentize PDF Converter for .NET 是一款高级工具,可将 PDF 文档转换为高质量的 PNG 图像。该组件旨在通过将 PDF 页面转化为广泛支持的图像格式,使您的内容更加多用途、可访问且易于共享。
如何将 PDF 转换为 PNG
将 PDF 文档转换为 PNG 图像,请按以下步骤操作:
- 创建
PdfToPngOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法设置 PNG 图像的输出目录路径。 - 调用
Convert 方法将 PDF 页面转换为 PNG 图像。
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
自定义 PDF 到 PNG 的转换
您可以通过调节分辨率和选择特定页面来自定义转换。例如,仅以 200 DPI 将 PDF 的第一页转换为 PNG:
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions()
3// Process only the first page
4options.PageList = [1];
5// Set output resolution to 200 DPI
6options.OutputResolution = 200;
7// Add input File path
8options.AddInput(new FileData("path_to_input.pdf"));
9// Set output Directory path
10options.AddOutput(new DirectoryData("path_to_output_directory"));
11// Perform the process
12PdfConverter.Convert(options);
处理转换结果
Convert 方法返回一个 ResultContainer 对象,包含转换结果信息。您可以按以下方式获取已转换 PNG 文件的流:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
主要特性:
- 将 PDF 转换为 PNG:快速高效地将整个 PDF 文档或特定页面转换为 PNG 图像。
- 可自定义分辨率:设置所需的 DPI(例如 300 DPI),以获得高质量图像输出。
- 页面集:选择要转换的特定页面。
- 易于输出管理:为每个转换后的 PNG 文件指定输出目录。
- 快速转换:快速、高效,配置工作量极小。
PDF 转 TIFF
The Documentize PDF Converter for .NET 是一个强大的工具,旨在将 PDF 文档转换为高质量的 TIFF 图像。该组件确保您的内容能够在各种平台上访问,同时保持出色的保真度和多功能性。您可以通过调整分辨率、启用多页输出或选择特定页面来自定义转换过程。
How to Convert PDF to TIFF
要将 PDF 文档转换为 TIFF 图像,请按照以下步骤操作:
- 创建
PdfToTiffOptions 实例以配置转换过程。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法指定 TIFF 图像的输出文件路径。 - 运行
Convert 方法将 PDF 页面转换为 TIFF 图像。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
Customizing Pages and DPI of PDF to TIFF Conversion
以下示例展示如何将 PDF 的 2 页以 400 DPI 转换为 TIFF 文件:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Pages
8options.PageList = [1, 3];
9// Set result image Resolution
10options.OutputResolution = 400;
11// Perform the process
12PdfConverter.Convert(options);
Multi-Page TIFF Creation
该插件支持多页 TIFF 生成,允许您将多个 PDF 页面合并为单个 TIFF 文件,以实现高效的归档或打印。
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Enable Multi-Page TIFF output
8options.MultiPage = true;
9// Perform the process
10PdfConverter.Convert(options);
Customizing Pages and DPI of PDF to TIFF Conversion
以下示例展示如何将 PDF 的 2 页以 400 DPI 转换为 TIFF 文件,并设置压缩和颜色深度:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Compression and ColorDepth
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// Perform the process
11PdfConverter.Convert(options);
How to Handle Conversion Results
Convert 方法返回一个 ResultContainer 对象,提供有关转换结果的详细信息。您可以像下面这样获取转换后 TIFF 文件的流:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
Key Features:
- Convert PDF to TIFF:轻松将整个 PDF 文档或特定页面转换为 TIFF 图像。
- Custom Resolution:调整分辨率(例如 300 dpi),以获得更高质量的输出。
- Multi-Page TIFF:将多个 PDF 页面合并为单个多页 TIFF 文件。
- Page set:选择特定页面进行转换。
- Quick Conversion:快速高效的处理过程,几乎无需额外操作。
PDF 转 XLS
The Documentize PDF Converter for .NET 是一个多功能且强大的工具,可将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过使用此组件,开发人员可以轻松地将静态 PDF 数据转化为可编辑的动态电子表格,从而简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
将 PDF 文档转换为 Excel 文件(XLSX),请按以下步骤操作:
- 使用
PdfToXlsOptions 类配置转换设置。 - 使用
AddInput 方法添加输入 PDF 文件。 - 使用
AddOutput 方法指定输出文件路径。 - 调用
Convert 方法执行转换。
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);
自定义 PDF 到 Excel 的转换
PdfToXlsOptions 类允许您自定义转换过程。例如,将 PDF 转换为 XLS 文件并启用高级格式化选项:
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Specify XLS format
6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
7options.InsertBlankColumnAtFirst = true;
8options.MinimizeTheNumberOfWorksheets = true;
9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);
支持的输出格式
PdfToXlsOptions.ExcelFormat 枚举提供了多种输出格式:
- XLSX:Office Open XML(.xlsx)文件格式(默认)。
- XLSM:支持宏的 Excel 格式。
- CSV:逗号分隔值。
- ODS:Open Document Spreadsheet。
- XMLSpreadSheet2003:Excel 2003 XML(.xls)文件格式。
主要特性:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式化:插入空列或最小化工作表数量。