HTML Converter

Sheetize HTML Converter for .NET 提供强大的能力,可以在 PDF 和 HTML 格式之间转换文档,非常适合网络应用、归档和报告生成。该转换器具有多种处理资源和布局的选项,能够适应各种项目要求。

主要特性

PDF 转 HTML 转换

将 PDF 文件转换为 HTML,使文档可以在网络上查看或集成到优先使用 HTML 格式的应用程序中。

HTML 转 PDF 转换

将 HTML 内容转换为高质量的 PDF,适合生成可打印报告、归档网页内容或创建可共享的文档格式。


详细指南

将 PDF 转换为 HTML

将 PDF 转换为 HTML 的步骤:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 设置转换选项:使用 PdfToHtmlOptions 自定义输出,选择嵌入或外部资源。
  3. 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
  4. 执行转换:调用 Process 方法转换文件。

示例:将 PDF 转换为带嵌入资源的 HTML

// 步骤 1:初始化 HTML 转换器
var converter = new HtmlConverter();

// 步骤 2:配置 PDF 转 HTML 转换选项
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);

// 步骤 3:设置文件路径
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));

// 步骤 4:运行转换
converter.Process(options);

PDF 转 HTML 转换可用选项

  • SaveDataType

    • FileWithEmbeddedResources:生成一个带有所有嵌入资源的单一 HTML 文件。
    • FileWithExternalResources:单独保存资源,适合大型 HTML 文件。
  • 输出自定义

    • BasePath:设置 HTML 文档中资源的基本路径。
    • IsRenderToSinglePage:可选择将所有 PDF 内容渲染到一个 HTML 页面上。

将 HTML 转换为 PDF

将 HTML 文档转换为 PDF 的步骤:

  1. 初始化转换器:创建 HtmlConverter 的实例。
  2. 配置 PDF 选项:使用 HtmlToPdfOptions 定义布局和媒体设置。
  3. 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
  4. 执行转换:运行 Process 方法完成转换。

示例:将 HTML 转换为 PDF

// 步骤 1:初始化 HTML 转换器
var converter = new HtmlConverter();

// 步骤 2:配置 HTML 转 PDF 转换选项
var options = new HtmlToPdfOptions();

// 步骤 3:设置文件路径
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));

// 步骤 4:执行转换
converter.Process(options);

HTML 转 PDF 转换的附加选项

  • 媒体类型

    • HtmlMediaType.Print:适合生成适合打印的 PDF。
    • HtmlMediaType.Screen:当转换设计用于数字查看的内容时使用。
  • 布局调整

    • PageLayoutOption:调整 HTML 内容如何适应 PDF 布局,例如 ScaleToPageWidth 确保内容缩放到 PDF 宽度。
    • IsRenderToSinglePage:如果需要进行简明的展示,允许将整个 HTML 内容渲染到单个 PDF 页面。

此转换器对多种应用程序非常灵活,既可以生成基于网络内容的 PDF 报告,又可以将 PDF 文档的归档转换为网络可访问的格式。有关更高级的配置,请参阅完整的 Sheetize 文档。

 中文