PDF to XLS

Documentize PDF Converter for .NET 是一个多功能且强大的工具,可以将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过利用这个插件,开发人员可以无缝地将静态 PDF 数据转换为动态和可编辑的电子表格,简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件(XLSX),请遵循以下步骤:

  1. 使用 PdfToXlsOptions 类配置转换设置。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定输出文件路径。
  4. 执行 Convert 方法以启动转换。
1  
2// 创建 PdfToXlsOptions 对象以设置指令  
3var options = new PdfToXlsOptions();  
4// 添加输入文件路径  
5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
6// 设置输出文件路径  
7options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xlsx"));  
8// 执行处理  
9PdfConverter.Convert(options);  

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:

 1  
 2// 创建 PdfToXlsOptions 对象以设置指令  
 3var options = new PdfToXlsOptions();  
 4// 添加输入文件路径  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));  
 6// 指定 XLS 格式  
 7options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;  
 8options.InsertBlankColumnAtFirst = true;  
 9options.MinimizeTheNumberOfWorksheets = true;  
10// 设置输出文件路径  
11options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));  
12// 执行处理  
13PdfConverter.Convert(options);  

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:

  • XLSX:Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM:启用宏的 Excel 格式。
  • CSV:逗号分隔值。
  • ODS:开放文档电子表格。
  • XMLSpreadSheet2003:Excel 2003 XML (.xls) 文件格式。

主要特点:

  • 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 高级格式:插入空白列或最小化工作表数量。
 中文