PDF to HTML Converter

Documentize PDF to HTML Converter for .NETは、PDFドキュメントをHTML形式に変換するのを簡素化するダイナミックなツールです。このプラグインは単なるファイル形式の変更だけでなく、アクセシビリティを向上させ、ドキュメントをよりユーザーフレンドリーでウェブ環境に適応可能にするために設計されています。

PDFをHTMLに変換する方法

PDFドキュメントをHTMLに変換するには、次の手順を実行します。

  1. PdfHtml クラスのインスタンスを作成します。
  2. 変換オプションを設定するために PdfToHtmlOptions クラスのインスタンスを作成します。
  3. AddInput メソッドを使用して入力PDFファイルを追加します。
  4. AddOutput メソッドを使用して出力HTMLファイルのパスを追加します。
  5. Process メソッドを呼び出してPDFをHTMLに変換します。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// PDFからHTMLへの変換を処理
9pdfHtml.Process(options);

HTMLをPDFに変換する方法

PDF to HTML Converterは、HTMLファイルをPDF形式に戻すこともサポートしており、双方向の完全な変換を可能にします。

1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// HTMLからPDFへの変換を処理
9pdfHtml.Process(options);

PDFからHTMLへの変換のカスタマイズ

エンコーディング、フォント、その他の設定を指定することで、変換プロセスをカスタマイズできます。以下は、UTF-8エンコーディングとArialフォントを設定する例です。

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// エンコーディングとフォントを設定
 5options.Encoding = Encoding.UTF8;
 6options.Font = "Arial";
 7
 8// 入力と出力ファイルを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// 変換を処理
13pdfHtml.Process(options);

PDFからHTMLへのバッチ変換

このプラグインはバッチ処理もサポートしており、複数のPDFを一度にHTMLファイルに変換することができます。

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// 複数の入力PDFファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 各変換の出力ファイルのパスを設定
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// バッチ変換を処理
13pdfHtml.Process(options);

主な機能:

  • PDFをHTMLに変換: PDFドキュメントを完全に機能するHTMLファイルにシームレスに変換します。
  • 埋め込みリソース: 画像やフォントなどのリソースをHTMLに直接埋め込むか、外部リンクとして設定するかを選択できます。
  • 双方向変換: PDFをHTMLに、またその逆に変換するための完全なサポートを提供します。
  • レイアウトを維持: 変換中に元のレイアウトや形式を保持します。
  • カスタムエンコーディング: 変換されたHTML内のテキストを正確にレンダリングするためにUTF-8などのエンコーディング形式を指定できます。
 日本語