PDF 转 XLS 转换器
Documentize PDF 转 XLS 转换器 for .NET 是一款多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格 (XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,从而简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件 (XLS/XLSX),请按照以下步骤操作:
- 创建
XlsConverter
类的实例。 - 使用
PdfToXlsOptions
类配置转换设置。 - 使用
AddInput
方法添加输入 PDF 文件。 - 使用
AddOutput
方法指定输出文件路径。 - 执行
Process
方法以启动转换。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 添加输入和输出文件路径
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 执行转换
9converter.Process(options);
自定义 PDF 到 Excel 转换
PdfToXlsOptions
类允许您自定义转换过程。例如,要将 PDF 转换为 XLSX 文件,设置工作表名称并启用高级格式化选项:
1var options = new PdfToXlsOptions
2{
3 Format = PdfToXlsOptions.ExcelFormat.XLSX, // 指定 XLSX 格式
4 WorksheetName = "MySheet", // 命名工作表
5 InsertBlankColumnAtFirst = true // 在开始处插入空白列
6};
7
8// 添加输入和输出文件
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// 处理转换
13converter.Process(options);
批量处理 PDF 到 XLS 转换
通过批量处理,您可以一次性将多个 PDF 文件转换为 Excel 电子表格。以下是一个示例:
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 添加多个输入文件
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 指定输出文件路径
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// 执行批量转换
13converter.Process(options);
处理转换结果
在转换过程之后,Process
方法返回一个 ResultContainer
对象,包含操作的详细信息。以下是如何检索转换后的文件路径:
1var resultContainer = converter.Process(options);
2
3// 访问输出文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("转换后的文件路径: " + result.Data.ToString());
支持的输出格式
PdfToXlsOptions.ExcelFormat
枚举提供了一系列输出格式:
- XLSX: Office Open XML (.xlsx) 文件格式(默认)。
- XLSM: 启用宏的 Excel 格式。
- CSV: 逗号分隔值。
- ODS: 开放文档电子表格。
- XMLSpreadSheet2003: Excel 2003 XML 格式。
主要特点:
- 灵活的转换选项: 将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留: 保持原始结构、布局和格式。
- 可自定义输出: 配置页面范围、工作表名称和输出格式。
- 批量处理: 同时处理多个 PDF 文件以提高效率。
- 高级格式化: 插入空白列或减少工作表数量。