Trình chuyển đổi PDF sang XLS

Trình chuyển đổi PDF sang XLS cho .NET của Documentize là một công cụ đa dụng và mạnh mẽ để chuyển đổi tài liệu PDF thành bảng tính Excel (XLS/XLSX). Bằng cách tận dụng plugin này, các nhà phát triển có thể chuyển đổi dữ liệu PDF tĩnh thành các bảng tính động và có thể chỉnh sửa, đơn giản hóa việc thao tác, phân tích và chia sẻ dữ liệu.

Tính năng chính:

  • Tùy chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF thành XLSX, XLS, CSV hoặc các định dạng khác.
  • Bảo toàn nội dung: Giữ nguyên cấu trúc, bố cục và định dạng ban đầu.
  • Đầu ra tùy chỉnh: Cấu hình phạm vi trang, tên bảng tính và định dạng đầu ra.
  • Xử lý theo lô: Xử lý nhiều tệp PDF đồng thời để đạt hiệu suất cao.
  • Định dạng nâng cao: Chèn cột trống hoặc giảm số lượng bảng tính.

Cách chuyển đổi PDF sang Excel

Để chuyển đổi tài liệu PDF thành tệp Excel (XLS/XLSX), hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp XlsConverter.
  2. Cấu hình cài đặt chuyển đổi bằng cách sử dụng lớp PdfToXlsOptions.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chỉ định đường dẫn tệp đầu ra bằng phương thức AddOutput.
  5. Thực hiện phương thức Process để bắt đầu quá trình chuyển đổi.
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// Thực hiện quá trình chuyển đổi
9converter.Process(options);

Tùy chỉnh chuyển đổi PDF sang Excel

Lớp PdfToXlsOptions cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển đổi PDF thành tệp XLSX, đặt tên bảng tính và kích hoạt các tùy chọn định dạng nâng cao:

 1var options = new PdfToXlsOptions
 2{
 3    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // Chỉ định định dạng XLSX
 4    WorksheetName = "MySheet",                    // Đặt tên bảng tính
 5    InsertBlankColumnAtFirst = true               // Chèn một cột trống ở đầu
 6};
 7
 8// Thêm tệp đầu vào và đầu ra
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// Thực hiện quá trình chuyển đổi
13converter.Process(options);

Xử lý theo lô PDF sang XLS

Với việc xử lý theo lô, bạn có thể chuyển đổi nhiều tệp PDF thành bảng tính Excel trong một lần. Dưới đây là một ví dụ:

 1var converter = new XlsConverter();
 2var options = new PdfToXlsOptions();
 3
 4// Thêm nhiều tệp đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Chỉ định đường dẫn tệp đầu ra
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// Thực hiện quá trình chuyển đổi theo lô
13converter.Process(options);

Xử lý kết quả chuyển đổi

Sau khi quá trình chuyển đổi hoàn tất, phương thức Process trả về một đối tượng ResultContainer chứa thông tin chi tiết về thao tác. Dưới đây là cách truy xuất đường dẫn tệp đã chuyển đổi:

1var resultContainer = converter.Process(options);
2
3// Truy cập đường dẫn tệp đầu ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("Đường dẫn tệp đã chuyển đổi: " + result.Data.ToString());

Các định dạng đầu ra được hỗ trợ

Enum PdfToXlsOptions.ExcelFormat cung cấp một loạt các định dạng đầu ra:

  • XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
  • XLSM: Định dạng Excel có macro.
  • CSV: Giá trị phân cách bằng dấu phẩy.
  • ODS: Bảng tính Open Document.
  • XMLSpreadSheet2003: Định dạng XML Excel 2003.
 Tiếng Việt