PDF转XLS转换器
Documentize PDF转XLS转换器 for .NET 是一款多功能且强大的工具,用于将PDF文档转换为Excel电子表格(XLS/XLSX)。通过利用这个插件,开发者可以无缝地将静态PDF数据转换为动态且可编辑的电子表格,从而简化数据处理、分析和共享。
主要特点:
- 灵活的转换选项:将PDF文件转换为XLSX、XLS、CSV或其他格式。
- 内容保留:保持原始结构、布局和格式。
- 可定制的输出:配置页面范围、工作表名称和输出格式。
- 批量处理:同时处理多个PDF文件,实现高效。
- 高级格式化:插入空白列或减少工作表数量。
如何将PDF转换为Excel
要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤进行:
- 创建
XlsConverter
类的实例。 - 使用
PdfToXlsOptions
类配置转换设置。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定输出文件路径。 - 执行
Process
方法以启动转换。
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 添加输入和输出文件路径
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// 执行转换
10converter.Process(options);
自定义PDF转Excel转换
PdfToXlsOptions
类允许您自定义转换过程。例如,要将PDF转换为XLSX文件,设置工作表名称,并启用高级格式化选项:
1
2var options = new PdfToXlsOptions
3{
4 Format = PdfToXlsOptions.ExcelFormat.XLSX, // 指定XLSX格式
5 WorksheetName = "MySheet", // 命名工作表
6 InsertBlankColumnAtFirst = true // 在开头插入一列空白
7};
8
9// 添加输入和输出文件
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
12
13// 处理转换
14converter.Process(options);
批量处理PDF到XLS转换
通过批量处理,您可以一次性将多个PDF文件转换为Excel电子表格。以下是一个示例:
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// 添加多个输入文件
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// 指定输出文件路径
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// 执行批量转换
14converter.Process(options);
处理转换结果
转换过程中,Process
方法将返回一个ResultContainer
对象,其中包含操作的详细信息。以下是如何检索转换后的文件路径:
1
2var resultContainer = converter.Process(options);
3
4// 访问输出文件路径
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine("转换后的文件路径: " + result.Data.ToString());
支持的输出格式
PdfToXlsOptions.ExcelFormat
枚举提供多种输出格式:
- XLSX:Office Open XML (.xlsx) 文件格式(默认)。
- XLSM:宏启用Excel格式。
- CSV:逗号分隔值。
- ODS:开放文档电子表格。
- XMLSpreadSheet2003:Excel 2003 XML格式。