HTML Converter
Sheetize HTML Converter for .NET 提供强大的能力,可以在 PDF 和 HTML 格式之间转换文档,非常适合网络应用、归档和报告生成。该转换器具有多种处理资源和布局的选项,能够适应各种项目要求。
主要特性
PDF 转 HTML 转换
将 PDF 文件转换为 HTML,使文档可以在网络上查看或集成到优先使用 HTML 格式的应用程序中。
HTML 转 PDF 转换
将 HTML 内容转换为高质量的 PDF,适合生成可打印报告、归档网页内容或创建可共享的文档格式。
详细指南
将 PDF 转换为 HTML
将 PDF 转换为 HTML 的步骤:
- 初始化转换器:创建
HtmlConverter
的实例。 - 设置转换选项:使用
PdfToHtmlOptions
自定义输出,选择嵌入或外部资源。 - 定义输入和输出路径:设置输入 PDF 和输出 HTML 的路径。
- 执行转换:调用
Process
方法转换文件。
示例:将 PDF 转换为带嵌入资源的 HTML
// 步骤 1:初始化 HTML 转换器
var converter = new HtmlConverter();
// 步骤 2:配置 PDF 转 HTML 转换选项
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 步骤 3:设置文件路径
options.AddInput(new FileDataSource("input.pdf"));
options.AddOutput(new FileDataSource("output.html"));
// 步骤 4:运行转换
converter.Process(options);
PDF 转 HTML 转换可用选项
SaveDataType:
FileWithEmbeddedResources
:生成一个带有所有嵌入资源的单一 HTML 文件。FileWithExternalResources
:单独保存资源,适合大型 HTML 文件。
输出自定义:
BasePath
:设置 HTML 文档中资源的基本路径。IsRenderToSinglePage
:可选择将所有 PDF 内容渲染到一个 HTML 页面上。
将 HTML 转换为 PDF
将 HTML 文档转换为 PDF 的步骤:
- 初始化转换器:创建
HtmlConverter
的实例。 - 配置 PDF 选项:使用
HtmlToPdfOptions
定义布局和媒体设置。 - 指定路径:设置输入 HTML 和输出 PDF 文件的路径。
- 执行转换:运行
Process
方法完成转换。
示例:将 HTML 转换为 PDF
// 步骤 1:初始化 HTML 转换器
var converter = new HtmlConverter();
// 步骤 2:配置 HTML 转 PDF 转换选项
var options = new HtmlToPdfOptions();
// 步骤 3:设置文件路径
options.AddInput(new FileDataSource("input.html"));
options.AddOutput(new FileDataSource("output.pdf"));
// 步骤 4:执行转换
converter.Process(options);
HTML 转 PDF 转换的附加选项
媒体类型:
HtmlMediaType.Print
:适合生成适合打印的 PDF。HtmlMediaType.Screen
:当转换设计用于数字查看的内容时使用。
布局调整:
PageLayoutOption
:调整 HTML 内容如何适应 PDF 布局,例如ScaleToPageWidth
确保内容缩放到 PDF 宽度。IsRenderToSinglePage
:如果需要进行简明的展示,允许将整个 HTML 内容渲染到单个 PDF 页面。
此转换器对多种应用程序非常灵活,既可以生成基于网络内容的 PDF 报告,又可以将 PDF 文档的归档转换为网络可访问的格式。有关更高级的配置,请参阅完整的 Sheetize 文档。