PDF to XLS
Documentize PDF Converter for .NET 是一个多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过利用这个插件,开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,简化数据操作、分析和共享。
如何将 PDF 转换为 Excel
要将 PDF 文档转换为 Excel 文件(XLSX),请遵循以下步骤:
- 使用
PdfToXlsOptions类配置转换设置。 - 使用
AddInput方法添加输入 PDF 文件。 - 使用
AddOutput方法指定输出文件路径。 - 执行
Convert方法以启动转换。
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 设置输出文件路径
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));
8// 执行处理
9PdfConverter.Convert(options); 自定义 PDF 到 Excel 转换
PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:
1
2// 创建 PdfToXlsOptions 对象以设置指令
3var options = new PdfToXlsOptions();
4// 添加输入文件路径
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
6// 指定 XLS 格式
7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
8options.InsertBlankColumnAtFirst = true;
9options.MinimizeTheNumberOfWorksheets = true;
10// 设置输出文件路径
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
12// 执行处理
13PdfConverter.Convert(options); 支持的输出格式
PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:
- XLSX:Office Open XML (.xlsx) 文件格式(默认)。
- XLSM:启用宏的 Excel 格式。
- CSV:逗号分隔值。
- ODS:开放文档电子表格。
- XMLSpreadSheet2003:Excel 2003 XML (.xls) 文件格式。
主要特点:
- 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 高级格式:插入空白列或最小化工作表数量。