导出表单数据

The Documentize PDF Extractor for .NET 插件提供了一种无缝的方法,将 PDF 表单(AcroForms)中的数据提取并导出为 CSV 等其他格式。此动态工具简化了检索表单字段值的过程,便于轻松进行数据管理、传输和分析。

如何从 PDF 导出表单数据

要将 PDF 表单数据导出为 CSV,请按照以下步骤操作:

  1. 创建 ExtractImagesOptions 类的实例。
  2. 使用 FormExporterValuesToCsvOptions 类定义导出选项。
  3. 添加输入 PDF 文件并指定输出 CSV 文件。
  4. 运行 Extract 方法执行导出。
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);

关键特性:

  • 导出表单数据:将 PDF 表单(AcroForms)中的数据提取为 CSV 或其他格式。
  • 数据过滤:使用谓词根据字段类型或页码等条件过滤特定表单字段进行导出。
  • 灵活的输出:保存导出的数据以供分析,或转移到电子表格、数据库或其他文档格式。
 中文