PDF to HTML Converter

Le Documentize PDF to HTML Converter for .NET est un outil dynamique qui simplifie la conversion de documents PDF au format HTML. Ce plugin est conçu non seulement pour des changements simples de format de fichier, mais aussi pour améliorer l’accessibilité, rendant les documents plus conviviaux et adaptables aux environnements web.

Comment convertir un PDF en HTML

Pour convertir un document PDF en HTML, suivez ces étapes :

  1. Créez une instance de la classe PdfHtml.
  2. Créez une instance de la classe PdfToHtmlOptions pour configurer les options de conversion.
  3. Ajoutez le fichier PDF d’entrée en utilisant la méthode AddInput.
  4. Ajoutez le chemin du fichier HTML de sortie en utilisant la méthode AddOutput.
  5. Appelez la méthode Process pour convertir le PDF en HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Définir les chemins des fichiers d'entrée et de sortie
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Traiter la conversion PDF en HTML
9pdfHtml.Process(options);

Comment convertir un HTML en PDF

Le PDF to HTML Converter permet également de convertir des fichiers HTML en format PDF, permettant ainsi une conversion bidirectionnelle complète.

1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Définir les chemins des fichiers d'entrée et de sortie
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Traiter la conversion HTML en PDF
9pdfHtml.Process(options);

Personnalisation de la conversion PDF en HTML

Vous pouvez personnaliser le processus de conversion en spécifiant l’encodage, les polices ou d’autres paramètres. Voici un exemple de définition de l’encodage UTF-8 et de la police Arial pour la conversion :

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Définir l'encodage et la police
 5options.Encoding = Encoding.UTF8;
 6options.Font = "Arial";
 7
 8// Ajouter les fichiers d'entrée et de sortie
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Traiter la conversion
13pdfHtml.Process(options);

Conversion par lot de PDF en HTML

Ce plugin prend également en charge le traitement par lot, vous permettant de convertir plusieurs PDF en fichiers HTML en une seule fois.

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Ajouter plusieurs fichiers PDF d'entrée
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Définir les chemins des fichiers de sortie pour chaque conversion
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Traiter la conversion par lot
13pdfHtml.Process(options);

Caractéristiques principales :

  • Convertir PDF en HTML : Convertissez sans effort des documents PDF en fichiers HTML pleinement fonctionnels.
  • Ressources intégrées : Choisissez d’intégrer des ressources (telles que des images et des polices) directement dans le HTML ou de les lier externement.
  • Conversion bidirectionnelle : Convertissez des PDF en HTML et vice versa avec un soutien complet pour les deux directions.
  • Maintenir la mise en page : Assurez-vous que la mise en page et le formatage d’origine sont préservés lors de la conversion.
  • Encodage personnalisé : Spécifiez le format d’encodage comme UTF-8 pour un rendu de texte précis dans le HTML converti.
 Français