HTML 转换器

Documentize HTML 转换器 for .NET 提供了强大的文档转换功能,可以在 PDF 和 HTML 格式之间转换,适合于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应各种项目需求。

主要特点

PDF 到 HTML 转换

将 PDF 文件转换为 HTML,使文档可供基于 Web 的查看或集成到首选 HTML 格式的应用程序中。

HTML 到 PDF 转换

将 HTML 内容转变为高质量的 PDF,适用于生成可打印的报告、归档 Web 内容或创建可共享的文档格式。


详细指南

将 PDF 转换为 HTML

要将 PDF 转换为 HTML:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 设置转换选项:使用 PdfToHtmlOptions 自定义输出,选择内嵌资源或外部资源。
  3. 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
  4. 执行转换:调用 Process 方法以转换文件。

示例:将 PDF 转换为带内嵌资源的 HTML

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 PDF 到 HTML 转换的选项  
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.pdf"));  
options.AddOutput(new FileDataSource("output.html"));  

// 第四步:运行转换  
converter.Process(options);  

PDF 到 HTML 转换的可用选项

  • SaveDataType

    • FileWithEmbeddedResources:生成一个包含所有内嵌资源的单一 HTML 文件。
    • FileWithExternalResources:单独保存资源,适用于大型 HTML 文件。
  • 输出自定义

    • BasePath:设置 HTML 文档中资源的基础路径。
    • IsRenderToSinglePage:可选择将所有 PDF 内容呈现在单个 HTML 页面上。

将 HTML 转换为 PDF

要将 HTML 文档转换为 PDF,请按以下步骤操作:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 配置 PDF 选项:使用 HtmlToPdfOptions 定义布局和媒体设置。
  3. 指定路径:设置输入 HTML 和输出 PDF 文件路径。
  4. 执行转换:运行 Process 方法以完成转换。

示例:将 HTML 转换为 PDF

// 第一步:初始化 HTML 转换器  
var converter = new HtmlConverter();  

// 第二步:配置 HTML 到 PDF 转换的选项  
var options = new HtmlToPdfOptions();  

// 第三步:设置文件路径  
options.AddInput(new FileDataSource("input.html"));  
options.AddOutput(new FileDataSource("output.pdf"));  

// 第四步:执行转换  
converter.Process(options);  

HTML 到 PDF 转换的其他选项

  • 媒体类型

    • HtmlMediaType.Print:适合生成适合打印的 PDF。
    • HtmlMediaType.Screen:在转换为数字查看设计的内容时使用。
  • 布局调整

    • PageLayoutOption:调整 HTML 内容在 PDF 布局中的适配方式,例如 ScaleToPageWidth 可确保内容比例适应 PDF 的宽度。
    • IsRenderToSinglePage:如果需要简洁的演示,启用在单个 PDF 页面上呈现整个 HTML 内容。

这个转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到将 PDF 文档归档转换为 Web 可访问格式。有关更高级的配置,请参考完整的 Documentize 文档。

 中文