PDF to HTML Converter
Documentize PDF to HTML Converter for .NETは、PDFドキュメントをHTML形式に変換するのを簡素化するダイナミックなツールです。このプラグインは単なるファイル形式の変更だけでなく、アクセシビリティを向上させ、ドキュメントをよりユーザーフレンドリーでウェブ環境に適応可能にするために設計されています。
PDFをHTMLに変換する方法
PDFドキュメントをHTMLに変換するには、次の手順を実行します。
PdfHtml
クラスのインスタンスを作成します。- 変換オプションを設定するために
PdfToHtmlOptions
クラスのインスタンスを作成します。 AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力HTMLファイルのパスを追加します。Process
メソッドを呼び出してPDFをHTMLに変換します。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// PDFからHTMLへの変換を処理
9pdfHtml.Process(options);
HTMLをPDFに変換する方法
PDF to HTML Converterは、HTMLファイルをPDF形式に戻すこともサポートしており、双方向の完全な変換を可能にします。
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// 入力と出力ファイルのパスを設定
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// HTMLからPDFへの変換を処理
9pdfHtml.Process(options);
PDFからHTMLへの変換のカスタマイズ
エンコーディング、フォント、その他の設定を指定することで、変換プロセスをカスタマイズできます。以下は、UTF-8エンコーディングとArialフォントを設定する例です。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// エンコーディングとフォントを設定
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// 入力と出力ファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// 変換を処理
13pdfHtml.Process(options);
PDFからHTMLへのバッチ変換
このプラグインはバッチ処理もサポートしており、複数のPDFを一度にHTMLファイルに変換することができます。
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// 複数の入力PDFファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 各変換の出力ファイルのパスを設定
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// バッチ変換を処理
13pdfHtml.Process(options);
主な機能:
- PDFをHTMLに変換: PDFドキュメントを完全に機能するHTMLファイルにシームレスに変換します。
- 埋め込みリソース: 画像やフォントなどのリソースをHTMLに直接埋め込むか、外部リンクとして設定するかを選択できます。
- 双方向変換: PDFをHTMLに、またその逆に変換するための完全なサポートを提供します。
- レイアウトを維持: 変換中に元のレイアウトや形式を保持します。
- カスタムエンコーディング: 変換されたHTML内のテキストを正確にレンダリングするためにUTF-8などのエンコーディング形式を指定できます。