PDF to HTML Converter
El Documentize PDF to HTML Converter para .NET es una herramienta dinámica que simplifica la conversión de documentos PDF a formato HTML. Este plugin está diseñado no solo para cambios simples de formato de archivo, sino también para mejorar la accesibilidad, haciendo que los documentos sean más amigables para el usuario y adaptables a entornos web.
Cómo Convertir PDF a HTML
Para convertir un documento PDF a HTML, sigue estos pasos:
- Crea una instancia de la clase
PdfHtml
. - Crea una instancia de la clase
PdfToHtmlOptions
para configurar las opciones de conversión. - Agrega el archivo PDF de entrada usando el método
AddInput
. - Agrega la ruta del archivo HTML de salida usando el método
AddOutput
. - Llama al método
Process
para convertir el PDF a HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Establecer las rutas de los archivos de entrada y salida
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Procesar la conversión de PDF a HTML
9pdfHtml.Process(options);
Cómo Convertir HTML a PDF
El PDF to HTML Converter también admite la conversión de archivos HTML de vuelta a formato PDF, permitiendo una conversión bidireccional completa.
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Establecer las rutas de los archivos de entrada y salida
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Procesar la conversión de HTML a PDF
9pdfHtml.Process(options);
Personalizando la Conversión de PDF a HTML
Puedes personalizar el proceso de conversión especificando la codificación, fuentes u otras configuraciones. Aquí hay un ejemplo de cómo establecer la codificación UTF-8 y la fuente Arial para la conversión:
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Establecer codificación y fuente
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// Agregar archivos de entrada y salida
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Procesar la conversión
13pdfHtml.Process(options);
Conversión por Lotes de PDF a HTML
Este plugin también admite el procesamiento por lotes, lo que te permite convertir múltiples PDFs en archivos HTML de una sola vez.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Agregar múltiples archivos PDF de entrada
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Establecer rutas de archivos de salida para cada conversión
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Procesar la conversión por lotes
13pdfHtml.Process(options);
Características Clave:
- Convertir PDF a HTML: Convierte documentos PDF en archivos HTML completamente funcionales sin problemas.
- Recursos Integrados: Elige si deseas incrustar recursos (como imágenes y fuentes) directamente en el HTML o enlazarlos externamente.
- Conversión Bidireccional: Convierte PDFs a HTML y viceversa con soporte total para ambas direcciones.
- Mantener el Diseño: Asegúrate de que el diseño y formato originales se conserven durante la conversión.
- Codificación Personalizada: Especifica el formato de codificación como UTF-8 para una representación precisa del texto en el HTML convertido.