PDF to HTML Converter
Le Documentize PDF to HTML Converter for .NET est un outil dynamique qui simplifie la conversion de documents PDF au format HTML. Ce plugin est conçu non seulement pour des changements simples de format de fichier, mais aussi pour améliorer l’accessibilité, rendant les documents plus conviviaux et adaptables aux environnements web.
Comment convertir un PDF en HTML
Pour convertir un document PDF en HTML, suivez ces étapes :
- Créez une instance de la classe
PdfHtml
. - Créez une instance de la classe
PdfToHtmlOptions
pour configurer les options de conversion. - Ajoutez le fichier PDF d’entrée en utilisant la méthode
AddInput
. - Ajoutez le chemin du fichier HTML de sortie en utilisant la méthode
AddOutput
. - Appelez la méthode
Process
pour convertir le PDF en HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Définir les chemins des fichiers d'entrée et de sortie
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Traiter la conversion PDF en HTML
9pdfHtml.Process(options);
Comment convertir un HTML en PDF
Le PDF to HTML Converter permet également de convertir des fichiers HTML en format PDF, permettant ainsi une conversion bidirectionnelle complète.
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Définir les chemins des fichiers d'entrée et de sortie
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Traiter la conversion HTML en PDF
9pdfHtml.Process(options);
Personnalisation de la conversion PDF en HTML
Vous pouvez personnaliser le processus de conversion en spécifiant l’encodage, les polices ou d’autres paramètres. Voici un exemple de définition de l’encodage UTF-8 et de la police Arial pour la conversion :
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Définir l'encodage et la police
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// Ajouter les fichiers d'entrée et de sortie
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Traiter la conversion
13pdfHtml.Process(options);
Conversion par lot de PDF en HTML
Ce plugin prend également en charge le traitement par lot, vous permettant de convertir plusieurs PDF en fichiers HTML en une seule fois.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Ajouter plusieurs fichiers PDF d'entrée
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Définir les chemins des fichiers de sortie pour chaque conversion
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Traiter la conversion par lot
13pdfHtml.Process(options);
Caractéristiques principales :
- Convertir PDF en HTML : Convertissez sans effort des documents PDF en fichiers HTML pleinement fonctionnels.
- Ressources intégrées : Choisissez d’intégrer des ressources (telles que des images et des polices) directement dans le HTML ou de les lier externement.
- Conversion bidirectionnelle : Convertissez des PDF en HTML et vice versa avec un soutien complet pour les deux directions.
- Maintenir la mise en page : Assurez-vous que la mise en page et le formatage d’origine sont préservés lors de la conversion.
- Encodage personnalisé : Spécifiez le format d’encodage comme UTF-8 pour un rendu de texte précis dans le HTML converti.