PDF to HTML Converter

El Documentize PDF to HTML Converter para .NET es una herramienta dinámica que simplifica la conversión de documentos PDF a formato HTML. Este plugin está diseñado no solo para cambios simples de formato de archivo, sino también para mejorar la accesibilidad, haciendo que los documentos sean más amigables para el usuario y adaptables a entornos web.

Cómo Convertir PDF a HTML

Para convertir un documento PDF a HTML, sigue estos pasos:

  1. Crea una instancia de la clase PdfHtml.
  2. Crea una instancia de la clase PdfToHtmlOptions para configurar las opciones de conversión.
  3. Agrega el archivo PDF de entrada usando el método AddInput.
  4. Agrega la ruta del archivo HTML de salida usando el método AddOutput.
  5. Llama al método Process para convertir el PDF a HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Establecer las rutas de los archivos de entrada y salida
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Procesar la conversión de PDF a HTML
9pdfHtml.Process(options);

Cómo Convertir HTML a PDF

El PDF to HTML Converter también admite la conversión de archivos HTML de vuelta a formato PDF, permitiendo una conversión bidireccional completa.

1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Establecer las rutas de los archivos de entrada y salida
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Procesar la conversión de HTML a PDF
9pdfHtml.Process(options);

Personalizando la Conversión de PDF a HTML

Puedes personalizar el proceso de conversión especificando la codificación, fuentes u otras configuraciones. Aquí hay un ejemplo de cómo establecer la codificación UTF-8 y la fuente Arial para la conversión:

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Establecer codificación y fuente
 5options.Encoding = Encoding.UTF8;
 6options.Font = "Arial";
 7
 8// Agregar archivos de entrada y salida
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Procesar la conversión
13pdfHtml.Process(options);

Conversión por Lotes de PDF a HTML

Este plugin también admite el procesamiento por lotes, lo que te permite convertir múltiples PDFs en archivos HTML de una sola vez.

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Agregar múltiples archivos PDF de entrada
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Establecer rutas de archivos de salida para cada conversión
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Procesar la conversión por lotes
13pdfHtml.Process(options);

Características Clave:

  • Convertir PDF a HTML: Convierte documentos PDF en archivos HTML completamente funcionales sin problemas.
  • Recursos Integrados: Elige si deseas incrustar recursos (como imágenes y fuentes) directamente en el HTML o enlazarlos externamente.
  • Conversión Bidireccional: Convierte PDFs a HTML y viceversa con soporte total para ambas direcciones.
  • Mantener el Diseño: Asegúrate de que el diseño y formato originales se conserven durante la conversión.
  • Codificación Personalizada: Especifica el formato de codificación como UTF-8 para una representación precisa del texto en el HTML convertido.
 Español