PDF转XLS转换器
Documentize PDF转XLS转换器 for .NET 是一个强大的工具,能够无缝地将PDF文档转换为Excel电子表格(XLS/XLSX)。此插件增强了PDF内容的可访问性和可用性,使数据以电子表格格式更易于操作和分析。
主要特点:
- 将PDF转换为Excel:将PDF文件转换为XLS/XLSX电子表格,以便于数据管理。
- 自定义输出选项:配置输出格式、页面范围、工作表名称等。
- 高保真转换:在转换过程中保留布局、格式和内容的准确性。
- 批处理:一次转换多个PDF文件,以便进行大规模操作。
如何将PDF转换为XLS
要将PDF文档转换为Excel文件(XLS/XLSX),请按照以下步骤操作:
- 创建
PdfXls
类的实例。 - 创建
PdfToXlsOptions
的实例,以配置转换设置。 - 使用
AddInput
方法添加输入PDF文件。 - 使用
AddOutput
方法指定输出Excel文件。 - 运行
Process
方法以启动转换。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加输入和输出文件路径
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 运行转换过程
9pdfXlsConverter.Process(options);
自定义PDF到Excel转换
您可以通过修改PdfToXlsOptions
类来自定义转换设置。例如,要将PDF转换为XLSX格式,插入一个空列并命名工作表,可以使用以下代码:
1var options = new PdfToXlsOptions();
2
3// 将输出格式设置为XLSX
4options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
5
6// 在第一个位置插入一个空列
7options.InsertBlankColumnAtFirst = true;
8
9// 设置工作表名称
10options.WorksheetName = "MySheet";
11
12// 添加输入和输出文件
13options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
15
16// 处理转换
17pdfXlsConverter.Process(options);
处理转换结果
处理完成后,Process方法返回一个ResultContainer
对象,该对象保存转换结果。您可以获取转换后的文件路径或其他输出详情:
1var resultContainer = pdfXlsConverter.Process(options);
2
3// 访问并打印结果文件路径
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
PDF到XLS转换的批处理
PDF到XLS转换器插件还支持批处理,允许一次转换多个PDF文件。
1var pdfXlsConverter = new PdfXls();
2var options = new PdfToXlsOptions();
3
4// 添加多个输入PDF
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 添加输出Excel文件
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// 处理批量转换
13pdfXlsConverter.Process(options);