PDF转XLS转换器

Documentize PDF转XLS转换器 for .NET 是一款多功能且强大的工具,用于将PDF文档转换为Excel电子表格(XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态PDF数据转换为动态且可编辑的电子表格,从而简化数据处理、分析和共享。

主要特点:

  • 灵活的转换选项:将PDF文件转换为XLSX、XLS、CSV或其他格式。
  • 内容保留:保持原始结构、布局和格式。
  • 可定制的输出:配置页面范围、工作表名称和输出格式。
  • 批量处理:同时处理多个PDF文件,实现高效。
  • 高级格式化:插入空白列或减少工作表数量。

如何将PDF转换为Excel

要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤进行:

  1. 创建XlsConverter类的实例。
  2. 使用PdfToXlsOptions类配置转换设置。
  3. 使用AddInput方法添加输入PDF文件。
  4. 使用AddOutput方法指定输出文件路径。
  5. 执行Process方法以启动转换。
 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加输入和输出文件路径  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// 执行转换  
10converter.Process(options);  

自定义PDF转Excel转换

PdfToXlsOptions类允许您自定义转换过程。例如,要将PDF转换为XLSX文件,设置工作表名称,并启用高级格式化选项:

 1  
 2var options = new PdfToXlsOptions  
 3{  
 4    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // 指定XLSX格式  
 5    WorksheetName = "MySheet",                    // 命名工作表  
 6    InsertBlankColumnAtFirst = true               // 在开头插入一列空白  
 7};  
 8
 9// 添加输入和输出文件  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
12
13// 处理转换  
14converter.Process(options);  

批量处理PDF到XLS转换

通过批量处理,您可以一次性将多个PDF文件转换为Excel电子表格。以下是一个示例:

 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 添加多个输入文件  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 指定输出文件路径  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// 执行批量转换  
14converter.Process(options);  

处理转换结果

转换过程中,Process方法将返回一个ResultContainer对象,其中包含操作的详细信息。以下是如何检索转换后的文件路径:

1  
2var resultContainer = converter.Process(options);  
3
4// 访问输出文件路径  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine("转换后的文件路径: " + result.Data.ToString());  

支持的输出格式

PdfToXlsOptions.ExcelFormat枚举提供多种输出格式:

  • XLSX:Office Open XML (.xlsx) 文件格式(默认)。
  • XLSM:宏启用Excel格式。
  • CSV:逗号分隔值。
  • ODS:开放文档电子表格。
  • XMLSpreadSheet2003:Excel 2003 XML格式。
 中文