PDF 转 XLS 转换器

Documentize PDF 转 XLS 转换器 for .NET 是一个通用且强大的工具,用于将 PDF 文档转换为 Excel 电子表格 (XLSX/XLS/CSV/XLSM/ODS)。通过利用此插件,开发人员可以无缝地将静态 PDF 数据转换为动态且可编辑的电子表格,从而简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

要将 PDF 文档转换为 Excel 文件 (XLSX),请按照以下步骤操作:

  1. 使用 PdfToXlsOptions 类配置转换设置。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定输出文件路径。
  4. 执行 Process 方法以启动转换。
1// 创建 PdfToXlsOptions 对象以设置指令
2var options = new PdfToXlsOptions();
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_file.xlsx"));
7// 执行处理
8XlsConverter.Process(options);

自定义 PDF 到 Excel 转换

PdfToXlsOptions 类允许您自定义转换过程。例如,要将 PDF 转换为 XLS 文件并启用高级格式选项:

 1// 创建 PdfToXlsOptions 对象以设置指令
 2var options = new PdfToXlsOptions();
 3// 添加输入文件路径
 4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 5// 指定 XLS 格式
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// 设置输出文件路径
10options.AddOutput(new FileDataSource("path_to_result_xlsx_file.xls"));
11// 执行处理
12XlsConverter.Process(options);

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了一系列输出格式:

  • XLSX: Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM: 启用宏的 Excel 格式。
  • CSV: 逗号分隔值。
  • ODS: 开放文档电子表格。
  • XMLSpreadSheet2003: Excel 2003 XML (.xls) 文件格式。

主要特性:

  • 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 高级格式:插入空白列或最小化工作表数量。
 中文