PDF 转 HTML

Documentize PDF Converter for .NET 提供了强大的 PDF 转 HTML 功能,适用于 Web 应用、归档以及报表生成。通过多种资源和布局处理选项,转换器能够满足各种项目需求。

将 PDF 转换为 HTML

将 PDF 文件转换为 HTML,使文档能够在网页上查看或集成到更偏好 HTML 格式的应用中。

  1. 配置选项:使用 PdfToHtmlOptions 自定义输出,可选择嵌入式资源或外部资源。
  2. 定义输入输出路径:设置输入 PDF 和输出 HTML 的路径。
  3. 执行转换:调用 PdfConverterConvert 方法进行转换。

示例:使用嵌入式资源将 PDF 转换为 HTML

1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);

PDF 转 HTML 转换的可用选项

  • SaveDataType
    • FileWithEmbeddedResources:生成一个包含所有资源的单一 HTML 文件。
    • FileWithExternalResources:资源单独保存,适用于大的 HTML 文件。
 中文