PDF 转 XLS

The Documentize PDF Converter for .NET 是一个多功能且强大的工具,可将 PDF 文档转换为 Excel 电子表格(XLSX/XLS/CSV/XLSM/ODS)。通过使用此组件,开发人员可以轻松地将静态 PDF 数据转化为可编辑的动态电子表格,从而简化数据操作、分析和共享。

如何将 PDF 转换为 Excel

将 PDF 文档转换为 Excel 文件(XLSX),请按以下步骤操作:

  1. 使用 PdfToXlsOptions 类配置转换设置。
  2. 使用 AddInput 方法添加输入 PDF 文件。
  3. 使用 AddOutput 方法指定输出文件路径。
  4. 调用 Convert 方法执行转换。
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);

自定义 PDF 到 Excel 的转换

PdfToXlsOptions 类允许您自定义转换过程。例如,将 PDF 转换为 XLS 文件并启用高级格式化选项:

 1// Create PdfToXlsOptions object to set instructions
 2var options = new PdfToXlsOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Specify XLS format
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);

支持的输出格式

PdfToXlsOptions.ExcelFormat 枚举提供了多种输出格式:

  • XLSX:Office Open XML(.xlsx)文件格式(默认)。
  • XLSM:支持宏的 Excel 格式。
  • CSV:逗号分隔值。
  • ODS:Open Document Spreadsheet。
  • XMLSpreadSheet2003:Excel 2003 XML(.xls)文件格式。

主要特性:

  • 灵活的转换选项:将 PDF 文件转换为 XLSX、XLS、CSV 或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 高级格式化:插入空列或最小化工作表数量。
 中文