HTML Converter

Documentize HTML Converter for .NET 提供强大的文档转换功能,支持 PDF 和 HTML 格式之间的转换,非常适合 Web 应用程序、归档和报告生成。具有多种处理资源和布局的选项,该转换器可适应各种项目需求。

PDF 转 HTML 转换

将 PDF 文件转换为 HTML,以使文档可用于基于 Web 的查看或集成到 HTML 格式优先的应用程序中。

HTML 转 PDF 转换

将 HTML 内容转换为高质量的 PDF,非常适合生成可打印的报告、归档 Web 内容或创建可共享的文档格式。


将 PDF 转换为 HTML

要将 PDF 转换为 HTML:

  1. 配置选项: 使用 PdfToHtmlOptions 自定义输出,选择嵌入式或外部资源。
  2. 定义输入和输出路径: 设置输入 PDF 和输出 HTML 的路径。
  3. 执行转换: 调用 HtmlConverterProcess 方法以转换文件。

示例:将 PDF 转换为带嵌入式资源的 HTML

1// 步骤 1: 配置 PDF 转 HTML 转换的选项
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

PDF 转 HTML 转换的可用选项

  • SaveDataType:
    • FileWithEmbeddedResources: 生成一个包含所有嵌入资源的单一 HTML 文件。
    • FileWithExternalResources: 将资源单独保存,适用于大型 HTML 文件。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF,请按照以下步骤操作:

  1. 配置选项: 使用 HtmlToPdfOptions 定义布局和媒体设置。
  2. 指定路径: 设置输入 HTML 和输出 PDF 文件路径。
  3. 执行转换: 运行 HtmlConverterProcess 方法以转换文件。

示例:将 HTML 转换为 PDF

1// 步骤 1: 配置 HTML 转 PDF 转换的选项
2var options = new HtmlToPdfOptions();
3
4// 步骤 2: 设置文件路径
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// 步骤 3: 运行转换
9HtmlConverter.Process(options);

HTML 转 PDF 转换的附加选项

  • 媒体类型:

    • HtmlMediaType.Print: 适合生成适合打印的 PDF。
    • HtmlMediaType.Screen: 在转换为为数字观看而设计的内容时使用。
  • 布局调整:

    • PageLayoutOption: 调整 HTML 内容适应 PDF 布局的方式,例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
    • IsRenderToSinglePage: 启用在需要简明呈现时将整个 HTML 内容呈现到单个 PDF 页面。

该转换器在多种应用程序中非常灵活,从基于 Web 的内容生成 PDF报告,到转换 PDF 文档归档以实现 Web 可访问性。有关更多高级配置,请参阅完整的 Documentize 文档。

 中文