PDF to XLS Converter
Công cụ Documentize PDF to XLS Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF thành bảng tính Excel (XLS/XLSX). Bằng cách tận dụng plugin này, các nhà phát triển có thể biến đổi dữ liệu PDF tĩnh thành bảng tính động và có thể chỉnh sửa, giúp đơn giản hóa việc thao tác, phân tích và chia sẻ dữ liệu.
Cách chuyển đổi PDF sang Excel
Để chuyển đổi một tài liệu PDF thành một tệp Excel (XLS/XLSX), hãy thực hiện các bước sau:
- Tạo một thể hiện của lớp
XlsConverter
. - Cấu hình các thiết lập chuyển đổi bằng cách sử dụng lớp
PdfToXlsOptions
. - Thêm các tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định đường dẫn tệp xuất ra bằng phương thức
AddOutput
. - Thực thi phương thức
Process
để bắt đầu quá trình chuyển đổi.
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// Thực hiện chuyển đổi
9converter.Process(options);
Tùy chỉnh chuyển đổi PDF sang Excel
Lớp PdfToXlsOptions
cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển đổi PDF sang tệp XLSX, đặt tên bảng tính và bật các tùy chọn định dạng nâng cao:
1var options = new PdfToXlsOptions
2{
3 Format = PdfToXlsOptions.ExcelFormat.XLSX, // Chỉ định định dạng XLSX
4 WorksheetName = "MySheet", // Đặt tên cho bảng tính
5 InsertBlankColumnAtFirst = true // Chèn một cột trống ở đầu
6};
7
8// Thêm các tệp đầu vào và đầu ra
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// Xử lý chuyển đổi
13converter.Process(options);
Xử lý hàng loạt chuyển đổi PDF sang XLS
Với xử lý hàng loạt, bạn có thể chuyển đổi nhiều tệp PDF thành bảng tính Excel chỉ trong một lần. Dưới đây là một ví dụ:
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm nhiều tệp đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Chỉ định các đường dẫn tệp xuất ra
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// Thực hiện chuyển đổi hàng loạt
13converter.Process(options);
Xử lý kết quả chuyển đổi
Sau quá trình chuyển đổi, phương thức Process
trả về một đối tượng ResultContainer
chứa thông tin chi tiết của hoạt động. Đây là cách để lấy đường dẫn tệp đã chuyển đổi:
1var resultContainer = converter.Process(options);
2
3// Truy cập đường dẫn tệp xuất ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("Đường dẫn tệp đã chuyển đổi: " + result.Data.ToString());
Các định dạng xuất ra được hỗ trợ
Enum PdfToXlsOptions.ExcelFormat
cung cấp một loạt các định dạng xuất ra:
- XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
- XLSM: Định dạng Excel hỗ trợ macro.
- CSV: Giá trị phân tách bằng dấu phẩy.
- ODS: Bảng tính Open Document.
- XMLSpreadSheet2003: Định dạng XML Excel 2003.
Các tính năng chính:
- Tùy chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF thành XLSX, XLS, CSV hoặc các định dạng khác.
- Bảo toàn nội dung: Duy trì cấu trúc, bố cục, và định dạng ban đầu.
- Đầu ra có thể tùy chỉnh: Cấu hình khoảng trang, tên bảng tính, và định dạng xuất ra.
- Xử lý hàng loạt: Xử lý nhiều tệp PDF đồng thời để đạt hiệu suất cao.
- Định dạng nâng cao: Chèn cột trống hoặc giảm thiểu số lượng bảng tính.