PDF to HTML Converter

Documentize PDF to HTML Converter for .NET — это динамический инструмент, который упрощает конвертацию PDF-документов в формат HTML. Этот плагин предназначен не только для простых изменений формата файла, но и для повышения доступности, что делает документы более удобными для пользователей и адаптированными к веб-средам.

Как конвертировать PDF в HTML

Чтобы конвертировать PDF-документ в HTML, выполните следующие шаги:

  1. Создайте экземпляр класса PdfHtml.
  2. Создайте экземпляр класса PdfToHtmlOptions, чтобы настроить параметры конвертации.
  3. Добавьте входной PDF-файл с помощью метода AddInput.
  4. Добавьте путь к выходному HTML-файлу с помощью метода AddOutput.
  5. Вызовите метод Process, чтобы конвертировать PDF в HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Установите пути к входным и выходным файлам
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Выполните конвертацию PDF в HTML
9pdfHtml.Process(options);

Как конвертировать HTML в PDF

PDF to HTML Converter также поддерживает конвертацию HTML-файлов обратно в формат PDF, позволяя осуществлять полную двустороннюю конвертацию.

1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Установите пути к входным и выходным файлам
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Выполните конвертацию HTML в PDF
9pdfHtml.Process(options);

Настройка конвертации PDF в HTML

Вы можете настроить процесс конвертации, указав кодировку, шрифты или другие параметры. Вот пример установки кодировки UTF-8 и шрифта Arial для конвертации:

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Установите кодировку и шрифт
 5options.Encoding = Encoding.UTF8;
 6options.Font = "Arial";
 7
 8// Добавьте входные и выходные файлы
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Выполните конвертацию
13pdfHtml.Process(options);

Пакетная конвертация из PDF в HTML

Этот плагин также поддерживает пакетную обработку, позволяя вам конвертировать несколько PDF в HTML-файлы за один раз.

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Добавьте несколько входных PDF-файлов
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Установите пути к выходным файлам для каждой конвертации
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Выполните пакетную конвертацию
13pdfHtml.Process(options);

Ключевые особенности:

  • Конвертация PDF в HTML: Безупречно конвертируйте PDF-документы в полностью функциональные HTML-файлы.
  • Встроенные ресурсы: Выбирайте, встраивать ли ресурсы (такие как изображения и шрифты) непосредственно в HTML или ссылаться на них изначально.
  • Двусторонняя конвертация: Конвертируйте PDF в HTML и наоборот с полной поддержкой обоих направлений.
  • Сохранение макета: Убедитесь, что оригинальный макет и форматирование сохраняются во время конвертации.
  • Пользовательская кодировка: Укажите формат кодировки, такой как UTF-8, для точного отображения текста в сконвертированном HTML.
 Русский