Export Form Data
Documentize PDF Extractor for .NET 插件提供了一种无缝的方式来从 PDF 表单 (AcroForms) 中提取和导出数据到其他格式,如 CSV。这个动态工具简化了检索表单字段值的过程,便于数据管理、传输和分析。
如何从 PDF 导出表单数据
要将表单数据从 PDF 导出到 CSV,请按照以下步骤操作:
- 创建
ExtractImagesOptions
类的实例。 - 使用
FormExporterValuesToCsvOptions
类定义导出选项。 - 添加输入 PDF 文件并指定输出 CSV 文件。
- 运行
Process
方法以执行导出。
1// 创建 ExtractFormDataToDsvOptions 对象以设置指令
2var options = new ExtractFormDataToDsvOptions(',', true);
3// 添加输入文件路径
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// 设置输出文件路径
6options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
7// 执行处理
8PdfExtractor.ExtractFormData(options);
主要特性:
- 导出表单数据:将 PDF 表单 (AcroForms) 中的数据提取到 CSV 或其他格式。
- 数据过滤:使用谓词根据字段类型或页面号码等标准过滤特定表单字段以便导出。
- 灵活输出:将导出的数据保存以供分析,或转移到电子表格、数据库或其他文档格式。