HTML 转换器
Documentize HTML 转换器 for .NET 提供了强大的文档转换功能,可以在 PDF 和 HTML 格式之间转换,适合于 Web 应用程序、归档和报告生成。通过多种处理资源和布局的选项,转换器能够适应各种项目需求。
主要特点
PDF 到 HTML 转换
将 PDF 文件转换为 HTML,使文档可供基于 Web 的查看或集成到首选 HTML 格式的应用程序中。
HTML 到 PDF 转换
将 HTML 内容转变为高质量的 PDF,适用于生成可打印的报告、归档 Web 内容或创建可共享的文档格式。
详细指南
将 PDF 转换为 HTML
要将 PDF 转换为 HTML:
- 初始化转换器:创建
HtmlConverter
的实例。 - 设置转换选项:使用
PdfToHtmlOptions
自定义输出,选择内嵌资源或外部资源。 - 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
Process
方法以转换文件。
示例:将 PDF 转换为带内嵌资源的 HTML
// 第一步:初始化 HTML 转换器
var converter = new HtmlConverter();
// 第二步:配置 PDF 到 HTML 转换的选项
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 第三步:设置文件路径
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));
// 第四步:运行转换
converter.Process(options);
PDF 到 HTML 转换的可用选项
SaveDataType:
FileWithEmbeddedResources
:生成一个包含所有内嵌资源的单一 HTML 文件。FileWithExternalResources
:单独保存资源,适用于大型 HTML 文件。
输出自定义:
BasePath
:设置 HTML 文档中资源的基础路径。IsRenderToSinglePage
:可选择将所有 PDF 内容呈现在单个 HTML 页面上。
将 HTML 转换为 PDF
要将 HTML 文档转换为 PDF,请按以下步骤操作:
- 初始化转换器:创建
HtmlConverter
的实例。 - 配置 PDF 选项:使用
HtmlToPdfOptions
定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件路径。
- 执行转换:运行
Process
方法以完成转换。
示例:将 HTML 转换为 PDF
// 第一步:初始化 HTML 转换器
var converter = new HtmlConverter();
// 第二步:配置 HTML 到 PDF 转换的选项
var options = new HtmlToPdfOptions();
// 第三步:设置文件路径
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));
// 第四步:执行转换
converter.Process(options);
HTML 到 PDF 转换的其他选项
媒体类型:
HtmlMediaType.Print
:适合生成适合打印的 PDF。HtmlMediaType.Screen
:在转换为数字查看设计的内容时使用。
布局调整:
PageLayoutOption
:调整 HTML 内容在 PDF 布局中的适配方式,例如ScaleToPageWidth
可确保内容比例适应 PDF 的宽度。IsRenderToSinglePage
:如果需要简洁的演示,启用在单个 PDF 页面上呈现整个 HTML 内容。
这个转换器适用于多种应用,从基于 Web 内容生成 PDF 报告到将 PDF 文档归档转换为 Web 可访问格式。有关更高级的配置,请参考完整的 Documentize 文档。