PDF to HTML Converter
Documentize PDF to HTML Converter cho .NET là một công cụ năng động giúp đơn giản hóa việc chuyển đổi tài liệu PDF sang định dạng HTML. Plugin này được thiết kế không chỉ cho việc thay đổi định dạng tệp đơn giản mà còn để nâng cao khả năng truy cập, làm cho tài liệu thân thiện với người dùng hơn và phù hợp với các môi trường web.
Cách chuyển đổi PDF sang HTML
Để chuyển đổi tài liệu PDF sang HTML, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfHtml
. - Tạo một thể hiện của lớp
PdfToHtmlOptions
để cấu hình tùy chọn chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm đường dẫn tệp HTML đầu ra bằng phương thức
AddOutput
. - Gọi phương thức
Process
để chuyển đổi PDF sang HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Thực hiện chuyển đổi PDF sang HTML
9pdfHtml.Process(options);
Cách chuyển đổi HTML sang PDF
PDF to HTML Converter cũng hỗ trợ chuyển đổi các tệp HTML trở lại thành định dạng PDF, cho phép chuyển đổi hai chiều đầy đủ.
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Thực hiện chuyển đổi HTML sang PDF
9pdfHtml.Process(options);
Tùy chỉnh chuyển đổi PDF sang HTML
Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách chỉ định mã hóa, phông chữ hoặc các cài đặt khác. Đây là một ví dụ về việc thiết lập mã hóa UTF-8 và phông Arial cho chuyển đổi:
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Đặt mã hóa và phông chữ
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// Thêm tệp đầu vào và đầu ra
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Thực hiện chuyển đổi
13pdfHtml.Process(options);
Chuyển đổi hàng loạt từ PDF sang HTML
Plugin này cũng hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi nhiều tệp PDF thành tệp HTML chỉ trong một lần.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Thêm nhiều tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Đặt đường dẫn tệp đầu ra cho mỗi chuyển đổi
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Thực hiện chuyển đổi hàng loạt
13pdfHtml.Process(options);
Tính năng chính:
- Chuyển đổi PDF sang HTML: Chuyển đổi tài liệu PDF thành các tệp HTML hoạt động đầy đủ một cách liền mạch.
- Tài nguyên nhúng: Chọn xem có nhúng tài nguyên (chẳng hạn như hình ảnh và phông chữ) trực tiếp vào HTML hay liên kết chúng từ bên ngoài.
- Chuyển đổi hai chiều: Chuyển đổi PDF sang HTML và ngược lại với hỗ trợ đầy đủ cho cả hai chiều.
- Bảo toàn bố cục: Đảm bảo rằng bố cục và định dạng gốc được giữ nguyên trong quá trình chuyển đổi.
- Mã hóa tùy chỉnh: Chỉ định định dạng mã hóa như UTF-8 để hiển thị văn bản chính xác trong HTML đã chuyển đổi.