Export Form Data

Plugin Documentize PDF Extractor for .NET cung cấp một cách liền mạch để trích xuất và xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang các định dạng khác như CSV. Công cụ linh hoạt này đơn giản hóa quy trình lấy giá trị các trường trong biểu mẫu, cho phép quản lý, chuyển giao và phân tích dữ liệu một cách dễ dàng.

Cách xuất dữ liệu biểu mẫu từ PDF

Để xuất dữ liệu biểu mẫu từ PDF sang CSV, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Định nghĩa các tùy chọn xuất bằng cách sử dụng lớp FormExporterValuesToCsvOptions.
  3. Thêm tệp PDF đầu vào và chỉ định tệp CSV đầu ra.
  4. Chạy phương thức Process để thực hiện việc xuất.
1// Tạo đối tượng ExtractFormDataToDsvOptions để thiết lập hướng dẫn
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// Thực hiện quá trình
8PdfExtractor.ExtractFormData(options);

Các tính năng chính:

  • Xuất dữ liệu biểu mẫu: Trích xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang CSV hoặc các định dạng khác.
  • Lọc dữ liệu: Sử dụng các điều kiện để lọc các trường biểu mẫu cụ thể cho việc xuất dựa trên các tiêu chí như loại trường hoặc số trang.
  • Đầu ra linh hoạt: Lưu dữ liệu đã xuất để phân tích hoặc chuyển sang bảng tính, cơ sở dữ liệu hoặc các định dạng tài liệu khác.
 Tiếng Việt