Tiểu mục của Hướng Dẫn Dành Cho Nhà Phát Triển
Bảo mật PDF
Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để nâng cao bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp khả năng mã hóa và giải mã. Nó đảm bảo rằng thông tin nhạy cảm của bạn vẫn giữ được tính bí mật và được bảo vệ khỏi sự truy cập trái phép.
Cách Mã Hóa một Tài Liệu PDF
Để mã hóa một tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của
EncryptionOptions
với các mật khẩu người dùng và chủ sở hữu mong muốn. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Thêm tệp PDF đầu ra bằng cách sử dụng phương thức
AddOutput
. - Thực hiện mã hóa bằng cách sử dụng phương thức
Process
của lớp Security
.
1// Tạo đối tượng EncryptionOptions để đặt hướng dẫn
2var options = new EncryptionOptions("123456", "qwerty");
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quy trình
8Security.Process(options);
Cách Giải Mã một Tài Liệu PDF
Để giải mã một tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của
DecryptionOptions
với mật khẩu cần thiết. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Thêm tệp PDF đầu ra bằng cách sử dụng phương thức
AddOutput
. - Thực hiện giải mã bằng cách sử dụng phương thức
Process
của lớp Security
.
1// Tạo đối tượng DecryptionOptions để đặt hướng dẫn
2var options = new DecryptionOptions("123456");
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quy trình
8Security.Process(options);
Tính Năng Nổi Bật:
- Mã Hóa Tài Liệu PDF: Bảo mật các tệp PDF của bạn bằng cách thêm mật khẩu người dùng và chủ sở hữu.
- Giải Mã Tài Liệu PDF: Loại bỏ mã hóa khỏi PDF khi cần thiết.
- Tự Động Hóa: Tích hợp mã hóa và giải mã vào các ứng dụng .NET của bạn để tạo quy trình tự động.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về bảo mật tài liệu.
HTML Converter
Trình chuyển đổi HTML Documentize cho .NET cung cấp khả năng mạnh mẽ để chuyển đổi tài liệu giữa định dạng PDF và HTML, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn để xử lý tài nguyên và bố cục, trình chuyển đổi thích nghi với các yêu cầu dự án khác nhau.
Chuyển đổi PDF sang HTML
Chuyển đổi các tệp PDF sang HTML để làm cho tài liệu có thể truy cập cho việc xem trên web hoặc tích hợp vào các ứng dụng mà định dạng HTML được ưu tiên.
Chuyển đổi HTML sang PDF
Biến nội dung HTML thành các tệp PDF chất lượng cao, hoàn hảo cho việc tạo báo cáo có thể in, lưu trữ nội dung web, hoặc tạo các định dạng tài liệu có thể chia sẻ.
Chuyển đổi PDF sang HTML
Để chuyển đổi một tệp PDF sang HTML:
- Cấu hình Tùy chọn: Sử dụng
PdfToHtmlOptions
để tùy chỉnh đầu ra, lựa chọn tài nguyên nhúng hoặc bên ngoài. - Xác định Đường dẫn Đầu vào và Đầu ra: Đặt đường dẫn cho PDF đầu vào và HTML đầu ra của bạn.
- Thực hiện Chuyển đổi: Gọi phương thức
Process
của HtmlConverter
để chuyển đổi tệp.
Ví dụ: Chuyển PDF sang HTML với Tài nguyên Nhúng
1// Bước 1: Cấu hình tùy chọn cho chuyển đổi PDF sang HTML
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Bước 2: Đặt đường dẫn tệp
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// Bước 3: Chạy quá trình chuyển đổi
9HtmlConverter.Process(options);
Tùy chọn Có sẵn cho Chuyển đổi PDF sang HTML
- SaveDataType:
FileWithEmbeddedResources
: Tạo một tệp HTML duy nhất với tất cả tài nguyên được nhúng.FileWithExternalResources
: Lưu tài nguyên riêng biệt, lý tưởng cho các tệp HTML lớn.
Chuyển đổi HTML sang PDF
Để chuyển đổi một tài liệu HTML sang PDF, làm theo các bước sau:
- Cấu hình Tùy chọn: Sử dụng
HtmlToPdfOptions
để xác định bố cục và các cài đặt phương tiện. - Chỉ định Đường dẫn: Đặt đường dẫn tệp HTML đầu vào và PDF đầu ra.
- Thực hiện Chuyển đổi: Chạy phương thức
Process
của HtmlConverter
để chuyển đổi tệp.
Ví dụ: Chuyển HTML sang PDF
1// Bước 1: Cấu hình tùy chọn cho chuyển đổi HTML sang PDF
2var options = new HtmlToPdfOptions();
3
4// Bước 2: Đặt đường dẫn tệp
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// Bước 3: Chạy quá trình chuyển đổi
9HtmlConverter.Process(options);
Tùy chọn Bổ sung cho Chuyển đổi HTML sang PDF
Loại Phương tiện:
HtmlMediaType.Print
: Lý tưởng để tạo PDF phù hợp cho việc in.HtmlMediaType.Screen
: Sử dụng khi chuyển đổi nội dung được thiết kế cho việc xem kỹ thuật số.
Điều chỉnh Bố cục:
PageLayoutOption
: Điều chỉnh cách nội dung HTML phù hợp với bố cục PDF, như ScaleToPageWidth
để đảm bảo nội dung được co lại theo chiều rộng của PDF.IsRenderToSinglePage
: Cho phép hiển thị toàn bộ nội dung HTML trên một trang PDF duy nhất nếu cần cho các bài trình bày ngắn gọn.
Trình chuyển đổi này đáng chú ý với nhiều ứng dụng khác nhau, từ việc tạo báo cáo PDF dựa trên nội dung web đến việc chuyển đổi kho tàng các tài liệu PDF cho khả năng truy cập trên web. Để biết thêm các cấu hình nâng cao, hãy tham khảo tài liệu đầy đủ của Documentize.
PDF Optimizer
Bộ Tối ưu hóa PDF Documentize là một plugin toàn diện giúp cải thiện tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Nó được thiết kế để giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những thao tác này cải thiện chất lượng và khả năng quản lý của các tệp PDF, giúp chúng dễ dàng lưu trữ, chia sẻ và xem hơn.
Tối ưu hóa PDF
Các bước sau đây cho thấy cách tối ưu hóa một tài liệu PDF bằng cách giảm kích thước tệp trong khi vẫn duy trì chất lượng.
- Tạo một đối tượng OptimizeOptions để cấu hình các cài đặt tối ưu hóa.
- Thêm tệp PDF đầu vào và đặt vị trí đầu ra cho tệp đã tối ưu hóa.
- Chạy phương thức
Process
của Optimizer
để thực hiện tối ưu hóa.
1// Tạo đối tượng OptimizeOptions để đặt hướng dẫn
2var options = new OptimizeOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quá trình
8Optimizer.Process(options);
Xoay PDF
Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong tệp PDF.
- Tạo một đối tượng RotateOptions và cấu hình góc xoay.
- Thêm tệp PDF đầu vào và chỉ định vị trí tệp đầu ra.
- Đặt góc xoay (ví dụ: 90 độ) bằng cách sử dụng phương thức SetRotation.
- Chạy phương thức
Process
của Optimizer
.
1// Tạo đối tượng RotateOptions để đặt hướng dẫn
2var options = new RotateOptions();
3// Đặt góc Xoay mới
4options.Rotation = Rotation.On90;
5// Thêm đường dẫn tệp đầu vào
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// Đặt đường dẫn tệp đầu ra
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// Thực hiện quá trình
10Optimizer.Process(options);
Thay đổi kích thước PDF
Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.
- Tạo một đối tượng ResizeOptions để xác định kích thước trang.
- Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
- Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
- Chạy phương thức
Process
của Optimizer
.
1// Tạo đối tượng ResizeOptions để đặt hướng dẫn
2var options = new ResizeOptions();
3// Đặt Kích thước Trang mới
4options.PageSize = PageSize.A3;
5// Thêm đường dẫn tệp đầu vào
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// Đặt đường dẫn tệp đầu ra
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// Thực hiện quá trình
10Optimizer.Process(options);
Nén PDF
Nén tài liệu PDF khi có thể bằng cách loại bỏ các tài nguyên trang không sử dụng, gộp các tài sản giống nhau và loại bỏ các đối tượng thừa.
- Tạo một đối tượng CompressOptions để cấu hình các cài đặt tối ưu hóa.
- Thêm tệp đầu vào và chỉ định vị trí tệp đầu ra.
- Sử dụng phương thức SetCropBox để định nghĩa khu vực cắt.
- Chạy phương thức
Process
của Optimizer
.
1// Tạo đối tượng CompressOptions để đặt hướng dẫn
2var options = new CompressOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quá trình
8Optimizer.Process(options);
Tính năng chính:
- Tối ưu hóa: Giảm kích thước tệp PDF mà không làm mất chất lượng.
- Xoay: Điều chỉnh hướng của các trang PDF.
- Thay đổi kích thước: Thay đổi kích thước các trang theo các kích thước cụ thể (ví dụ: A4, Letter).
- Nén: Loại bỏ các tài nguyên và đối tượng trang không sử dụng khỏi tài liệu.
PDF Merger
Documentize PDF Merger cho .NET là một công cụ linh hoạt được thiết kế để hợp nhất nhiều tài liệu PDF thành một tệp duy nhất. Nó đơn giản hóa việc hợp nhất các tệp PDF, đảm bảo rằng tài liệu của bạn được hợp nhất một cách hiệu quả và duy trì tính nhất quán trong nội dung. Plugin xử lý các tài nguyên nội bộ như phông chữ và hình ảnh để tối ưu hóa tài liệu đã hợp nhất.
Cách hợp nhất PDF
Để hợp nhất nhiều tài liệu PDF thành một tệp duy nhất, hãy làm theo các bước sau:
- Tạo một thể hiện của
MergeOptions
để cấu hình quá trình hợp nhất. - Thêm các tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Thêm tệp PDF đầu ra bằng phương thức
AddOutput
. - Thực hiện hợp nhất bằng cách sử dụng phương thức
Process
của lớp Merger
..
1
2// Tạo đối tượng MergeOptions để thiết lập hướng dẫn
3var options = new MergeOptions();
4// Thêm các đường dẫn tệp đầu vào
5options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
6options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
7// Đặt đường dẫn tệp đầu ra
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// Thực hiện quy trình
10Merger.Process(options);
Tính năng nổi bật:
- Hợp nhất nhiều PDF: Dễ dàng kết hợp nhiều tệp PDF thành một.
- Tối ưu hóa tài nguyên: Xóa phông chữ và hình ảnh trùng lặp trong quá trình hợp nhất.
- Xử lý theo lô: Hợp nhất các lô tài liệu PDF lớn trong một lần.
PDF Table Generator
Trình tạo bảng Documentize cho .NET là một plugin linh hoạt được thiết kế để đơn giản hóa việc tích hợp các bảng vào tài liệu PDF. Dù bạn đang tổ chức dữ liệu, thiết kế biểu mẫu hay cải thiện khả năng đọc của tài liệu, plugin này giúp quá trình diễn ra một cách dễ dàng mà vẫn đảm bảo độ chính xác và hiệu quả. API trực quan của nó hỗ trợ cả quy trình làm việc của tài liệu đơn lẻ và xử lý theo lô, khiến nó trở thành công cụ thiết yếu cho các nhà phát triển làm việc với dữ liệu có cấu trúc.
Tạo PDF với Các Bảng
Thực hiện theo các bước sau để tạo các bảng có cấu trúc trong một PDF bằng cách sử dụng lớp TableGenerator
:
- Khởi tạo lớp
TableGenerator
. - Cấu hình đối tượng
TableOptions
để xác định cấu trúc bảng, nội dung và tập tin đầu vào/đầu ra. - Thêm bảng, hàng và ô vào PDF của bạn.
- Hoàn tất quá trình tạo bảng bằng cách sử dụng phương thức
Process
.
Dưới đây là một ví dụ:
1var generator = new TableGenerator();
2var options = new TableOptions();
3
4// Chỉ định các tập tin PDF đầu vào và đầu ra
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// Xác định một bảng với các hàng và ô
9options
10 .InsertPageAfter(1) // Thêm bảng sau trang đầu tiên
11 .AddTable()
12 .AddRow()
13 .AddCell().AddParagraph(new TextFragment("Cell 1"))
14 .AddCell().AddParagraph(new TextFragment("Cell 2"))
15 .AddCell().AddParagraph(new TextFragment("Cell 3"));
16
17// Tạo bảng trong tài liệu
18generator.Process(options);
Thêm Nội Dung Đa Dạng vào Các Bảng
Các bảng trong tài liệu PDF có thể bao gồm nhiều loại nội dung khác nhau để nâng cao chức năng và hình thức của chúng. Dưới đây là một ví dụ về việc thêm nội dung HTML vào các ô của bảng:
1options
2 .AddTable()
3 .AddRow()
4 .AddCell().AddParagraph(new HtmlFragment("<h1>Header 1</h1>"))
5 .AddCell().AddParagraph(new HtmlFragment("<h2>Header 2</h2>"))
6 .AddCell().AddParagraph(new HtmlFragment("<h3>Header 3</h3>"));
Các Loại Nội Dung Được Hỗ Trợ trong Các Bảng
Trình tạo bảng PDF hỗ trợ nhiều loại nội dung khác nhau, cho phép các nhà phát triển tùy chỉnh bảng cho nhiều trường hợp sử dụng khác nhau:
- HtmlFragment: Thêm nội dung dựa trên HTML, chẳng hạn như tiêu đề, danh sách và văn bản định dạng.
- TeXFragment: Bao gồm nội dung dựa trên LaTeX cho các phương trình toán học và chú thích khoa học.
- TextFragment: Chèn văn bản đơn giản hoặc định dạng.
- Image: Nhúng hình ảnh trực tiếp vào các ô bảng.
Tùy Chỉnh Bố Cục và Cấu Trúc Bảng
Plugin cung cấp sự linh hoạt để điều chỉnh cấu trúc bảng, bao gồm chiều cao hàng, chiều rộng cột và căn chỉnh ô. Những tùy chọn tùy chỉnh này cho phép bạn thiết kế các bảng phù hợp với bố cục và phong cách của tài liệu của bạn.
Xử Lý Quá Trình Tạo Bảng
Sau khi thêm tất cả nội dung và tùy chỉnh cấu trúc bảng, hoàn tất quá trình bằng cách gọi phương thức Process
. Phương thức này tạo ra các bảng và cập nhật tài liệu PDF. Dưới đây là cách xử lý kết quả:
1var resultContainer = generator.Process(options);
2
3// Xuất số lượng kết quả đã tạo
4Console.WriteLine("Số lượng kết quả: " + resultContainer.ResultCollection.Count);
Các Trường Hợp Sử Dụng cho Trình Tạo Bảng PDF
- Báo cáo dữ liệu: Trình bày phân tích, báo cáo tài chính hoặc kết quả khảo sát trong định dạng rõ ràng và có tổ chức.
- Thiết kế biểu mẫu: Tạo các biểu mẫu tương tác với bố cục bảng có cấu trúc.
- Cải thiện tài liệu: Cải thiện khả năng đọc và sử dụng của hướng dẫn sử dụng, tài liệu chỉ dẫn hoặc tài liệu hướng dẫn.
- Xử lý theo lô: Tự động tạo bảng cho nhiều tài liệu PDF.
Tính Năng Chính:
- Tạo Bảng Động: Dễ dàng tạo bảng có cấu trúc trong tài liệu PDF.
- Hỗ Trợ Nội Dung Đa Dạng: Làm đầy bảng với văn bản, HTML, hình ảnh và nội dung LaTeX.
- Đặt Trang: Chèn bảng ở các vị trí cụ thể trong PDF một cách chính xác.
- Bố Cục Tùy Chỉnh: Điều chỉnh cấu trúc bảng, căn chỉnh ô và kiểu dáng.
- Xử Lý Theo Lô: Xử lý nhiều tài liệu đồng thời để tối đa hóa hiệu quả.
PDF TOC Generator
Documentize PDF TOC Generator for .NET là một plugin mạnh mẽ được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động một Mục lục (TOC). Plugin này đơn giản hóa quy trình thêm TOC vào PDF của bạn, giúp tài liệu dễ dàng điều hướng và quản lý hơn.
Cách tạo Mục lục cho một PDF
Để tạo một Mục lục trong tệp PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
TocGenerator
. - Tạo một thể hiện của
TocOptions
để cấu hình các cài đặt tạo TOC. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định tệp PDF đầu ra có TOC bằng phương thức
AddOutput
. - Gọi phương thức
Process
để tạo TOC.
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// Thêm tệp đầu vào và đầu ra
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
7
8// Tạo TOC
9tocGenerator.Process(tocOptions);
Tùy chỉnh TOC
Bạn có thể tùy chỉnh Mục lục bằng cách sửa đổi lớp TocOptions
. Ví dụ, bạn có thể kiểm soát mức độ sâu cho các mục TOC, thiết lập các tùy chọn định dạng cụ thể và nhiều hơn nữa:
1var tocOptions = new TocOptions
2{
3 Depth = 3, // Đặt mức độ sâu TOC là 3
4 FontSize = 12, // Đặt kích thước phông chữ cho các mục TOC
5 Title = "Mục lục" // Tùy chỉnh tiêu đề TOC
6};
7
8// Thêm tệp đầu vào và đầu ra
9tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
11
12// Tạo TOC với các tùy chọn tùy chỉnh
13tocGenerator.Process(tocOptions);
Cách xử lý kết quả
Sau khi xử lý, phương thức Process
trả về một đối tượng ResultContainer
chứa thông tin chi tiết về việc tạo TOC. Bạn có thể truy xuất và in chi tiết đầu ra:
1var resultContainer = tocGenerator.Process(tocOptions);
2
3// Truy cập bộ sưu tập kết quả và in đường dẫn tệp đầu ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
Xử lý hàng loạt cho nhiều PDF
Plugin PDF TOC Generator hỗ trợ xử lý hàng loạt, cho phép bạn thêm TOC vào nhiều tài liệu PDF cùng một lúc.
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// Thêm nhiều PDF đầu vào
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6tocOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Thêm các PDF đầu ra có TOC
9tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output1_with_toc.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output2_with_toc.pdf"));
11
12// Xử lý việc tạo TOC hàng loạt
13tocGenerator.Process(tocOptions);
Tính năng chính:
- Tạo TOC động: Tạo TOC cho bất kỳ tệp PDF nào với các mục được tạo tự động dựa trên tiêu đề hoặc dấu trang.
- Xử lý hàng loạt: Tạo TOC cho nhiều tài liệu PDF tại cùng một thời điểm.
- Tùy chỉnh: Kiểm soát giao diện và cấu trúc của TOC, bao gồm kiểu dáng, định dạng và mức độ sâu.
- Quy trình làm việc hiệu quả: Giảm thiểu thời gian dành cho việc tạo TOC thủ công, đặc biệt là cho các tài liệu lớn hoặc phức tạp.
PDF Signature
Plugin Documentize PDF Signature for .NET cho phép người dùng ký số các tài liệu PDF. Nó cung cấp quy trình đơn giản để thêm chữ ký, đảm bảo tính xác thực và bảo mật nội dung PDF. Plugin hỗ trợ cả chữ ký hiển thị và không hiển thị, đồng thời cung cấp tùy chọn tùy chỉnh vị trí chữ ký, lý do, thông tin liên hệ và nhiều hơn nữa.
Cách Ký Tài Liệu PDF
Để ký một tài liệu PDF bằng tệp PFX, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
Signature
. - Tạo thể hiện của lớp
SignOptions
với đường dẫn tệp PFX và mật khẩu. - Thêm PDF đầu vào và tệp đầu ra vào tùy chọn.
- Chạy phương thức
Process
để áp dụng chữ ký.
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// Thêm PDF đầu vào và chỉ định tệp đầu ra
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// Cấu hình tùy chọn chữ ký
9signOptions.Reason = "Hợp đồng";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "New York";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// Áp dụng chữ ký vào tài liệu
17signature.Process(signOptions);
Cách Sử Dụng Luồng cho Tệp PFX
Bạn cũng có thể ký một tài liệu PDF bằng một chứng chỉ PFX được cung cấp dưới dạng luồng thay vì đường dẫn tệp. Điều này cho phép xử lý linh hoạt hơn về việc lưu trữ chứng chỉ.
- Tạo một thể hiện của lớp
Signature
. - Tạo thể hiện
SignOptions
với một luồng chứa PFX và mật khẩu. - Thêm tệp đầu vào và đầu ra.
- Chạy phương thức
Process
để áp dụng chữ ký.
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// Thêm tệp đầu vào và đầu ra
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// Áp dụng chữ ký
10signature.Process(signOptions);
Cách Áp Dụng Chữ Ký Không Hiển Thị
Để thêm một chữ ký không hiển thị (chữ ký bảo vệ tài liệu mà không hiển thị trên tài liệu), chỉ cần đặt thuộc tính Visible
thành false
.
- Tạo một thể hiện của
SignOptions
. - Đặt
Visible
thành false
. - Thêm tệp đầu vào và đầu ra.
- Gọi
Process
để áp dụng chữ ký không hiển thị.
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// Cấu hình chữ ký không hiển thị
5signOptions.Visible = false;
6
7// Thêm tệp đầu vào và đầu ra
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// Xử lý chữ ký
12signature.Process(signOptions);
Tính Năng Chính:
- Ký Số Tài Liệu PDF: Bảo vệ tài liệu của bạn bằng chữ ký số hiển thị hoặc không hiển thị.
- Hỗ Trợ PFX: Ký các tệp PDF bằng một chứng chỉ PFX.
- Tùy Chọn Tùy Chỉnh: Cấu hình cài đặt chữ ký như lý do, vị trí và thông tin liên hệ.
- Chữ Ký Hiển Thị và Không Hiển Thị: Chọn xem chữ ký có hiển thị trên tài liệu hay không.
PDF Splitter
Trình Chia Tách PDF Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa quy trình chia tách các tài liệu PDF lớn thành những tệp nhỏ hơn, dễ quản lý hơn. Cho dù bạn cần trích xuất các trang đơn lẻ hay chia tách một tài liệu thành các phần cụ thể, plugin này cho phép bạn thực hiện điều đó một cách hiệu quả và với ít nỗ lực tối thiểu.
Cách Chia Tách PDF
Để chia tách một tài liệu PDF thành các trang đơn lẻ, hãy làm theo các bước sau:
- Tạo một instance của
SplitOptions
để cấu hình các tùy chọn chia tách. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm các tệp đầu ra cho mỗi trang đã chia tách bằng phương thức
AddOutput
. - Chạy phương thức
Process
trong lớp Splitter
để chia tách tài liệu.
1var splitOptions = new SplitOptions();
2
3// Thêm tệp PDF đầu vào
4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
5
6// Xác định các tệp đầu ra cho mỗi trang
7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// Xử lý thao tác chia tách
12Splitter.Process(splitOptions);
Các Tính Năng Chính:
- Chia Tách PDF Theo Trang: Phân tách tài liệu PDF thành các trang đơn lẻ.
- Xử Lý Hàng Loạt: Chia tách các lô PDF lớn trong một lần.
- Tùy Chọn Chia Tách Tùy Chỉnh: Cấu hình quy trình chia tách theo yêu cầu của bạn.
- Đầu Ra Có Tổ Chức: Dễ dàng quản lý các tệp đầu ra cho mỗi trang hoặc phần đã chia tách.
PDF ChatGPT
Plugin Documentize ChatGPT cho .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT với các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo phản hồi trò chuyện dựa trên thông điệp đầu vào và lưu đầu ra ở định dạng PDF, làm cho nó phù hợp cho việc tạo giao diện trò chuyện hoặc báo cáo phân tích trực tiếp trong các tài liệu PDF.
Tạo Phản Hồi Trò Chuyện
Để tạo phản hồi trò chuyện và lưu chúng vào tệp PDF bằng cách sử dụng plugin ChatGPT, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfChatGptRequestOptions
để cấu hình các tùy chọn yêu cầu. - Thêm tệp PDF đầu vào và đầu ra.
- Đặt khóa API và xác định các tham số như số lượng token tối đa và truy vấn cho mô hình ChatGPT.
- Chạy phương thức
ProcessAsync
để tạo ra hoàn thành trò chuyện.
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // Đặt khóa API của bạn
3options.MaxTokens = 1000; // Đặt số lượng token tối đa
4options.Query = "Phân tích văn bản này cho các chủ đề chính.";
5
6// Thêm tệp PDF đầu vào
7options.AddInput(new FileDataSource("input.pdf"));
8
9// Chỉ định nơi lưu tệp PDF đầu ra với các phản hồi trò chuyện
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// Tạo một thể hiện của plugin PdfChatGpt
13var plugin = new PdfChatGpt();
14
15// Chạy quy trình một cách không đồng bộ
16var result = await plugin.ProcessAsync(options);
Tính Năng Chính:
- Hoàn Thành Trò Chuyện: Tạo phản hồi bằng cách sử dụng API ChatGPT dựa trên đầu vào tùy chỉnh.
- Tin Nhắn Hệ Thống & Người Dùng: Cung cấp cả ngữ cảnh hệ thống và đầu vào của người dùng để tạo ra các cuộc trò chuyện linh hoạt.
- Đầu Ra PDF: Lưu các hoàn thành trò chuyện được tạo ra vào một tệp PDF có cấu trúc để sử dụng sau này.
- Xử Lý Không Đồng Bộ: Đảm bảo ứng dụng phản hồi bằng cách xử lý các hoàn thành trò chuyện một cách không đồng bộ.
Thêm Tin Nhắn Hệ Thống và Người Dùng
Để tạo ra một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn người dùng. Những tin nhắn này giúp hình thành ngữ cảnh của cuộc trò chuyện.
- Thêm một tin nhắn hệ thống để thiết lập ngữ cảnh cho ChatGPT.
- Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng cho cuộc trò chuyện.
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // Đặt khóa API của bạn
3
4// Thêm tin nhắn hệ thống cho ngữ cảnh
5options.AddSystemMessage("Bạn là một AI được đào tạo để tóm tắt văn bản.");
6
7// Thêm tin nhắn người dùng để truy vấn mô hình ChatGPT
8options.AddUserMessage("Vui lòng tóm tắt tài liệu đính kèm.");
9
10// Thêm tệp PDF đầu vào và đầu ra
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// Xử lý yêu cầu một cách không đồng bộ
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);
Plugin Documentize PDF Image Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ tài liệu PDF. Nó quét các tệp PDF của bạn, xác định các hình ảnh nhúng và trích xuất chúng trong khi vẫn giữ nguyên chất lượng và định dạng ban đầu. Công cụ này cải thiện khả năng tiếp cận nội dung hình ảnh và đơn giản hóa quá trình lấy hình ảnh từ PDF.
Cách Trích Xuất Hình Ảnh Từ Một Tệp PDF
Để trích xuất hình ảnh từ một tệp PDF, hãy thực hiện các bước sau:
- Tạo một thể hiện của lớp
ImageExtractor
. - Tạo một thể hiện của lớp
ImageExtractorOptions
. - Thêm đường dẫn tệp đầu vào vào tùy chọn.
- Xử lý việc trích xuất hình ảnh bằng cách sử dụng plugin.
- Lấy các hình ảnh đã trích xuất từ bộ chứa kết quả.
1using var plugin = new ImageExtractor();
2
3// Tạo một thể hiện của lớp ImageExtractorOptions
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// Thêm đường dẫn tệp đầu vào
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Lấy hình ảnh đã trích xuất và lưu vào tệp
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
Trích Xuất Hình Ảnh Từ Nhiều Tệp PDF
Plugin ImageExtractor hỗ trợ xử lý hàng loạt, cho phép bạn trích xuất hình ảnh từ nhiều PDF cùng một lúc. Tính năng này đặc biệt hữu ích khi bạn có một bộ sưu tập các tệp PDF và cần lấy tất cả hình ảnh trong một lần.
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// Thêm nhiều tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(options);
11
12// Lưu các hình ảnh đã trích xuất từ tất cả các tệp
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
Tính Năng Chính:
- Trích Xuất Hình Ảnh Nhúng: Xác định và trích xuất hình ảnh từ các tài liệu PDF.
- Giữ Nguyên Chất Lượng Hình Ảnh: Đảm bảo hình ảnh đã trích xuất giữ nguyên chất lượng ban đầu.
- Xử Lý Hàng Loạt: Trích xuất hình ảnh từ nhiều tài liệu PDF trong một thao tác duy nhất.
- Đầu Ra Linh Hoạt: Lưu hình ảnh đã trích xuất theo định dạng hoặc vị trí bạn mong muốn.
Trình Documentize PDF Text Extractor cho .NET đơn giản hóa việc trích xuất văn bản từ tài liệu PDF. Dù bạn cần văn bản nguyên chất, thô hay đơn giản, plugin này cho phép bạn trích xuất văn bản một cách hiệu quả trong khi vẫn giữ nguyên định dạng hoặc bỏ qua tùy theo nhu cầu của bạn.
Cách trích xuất văn bản từ PDF
Để trích xuất văn bản từ tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
TextExtractor
. - Tạo một thể hiện của
TextExtractorOptions
để cấu hình các tùy chọn trích xuất. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chạy phương thức
Process
để trích xuất văn bản. - Truy cập văn bản đã được trích xuất bằng
ResultContainer.ResultCollection
.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Xử lý việc trích xuất văn bản
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// In ra văn bản đã được trích xuất
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
Trích xuất văn bản từ nhiều PDF
Plugin cho phép bạn trích xuất văn bản từ nhiều PDF đồng thời, đảm bảo quy trình nhanh chóng và hiệu quả.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// Xử lý việc trích xuất
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xuất ra văn bản đã được trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Các chế độ trích xuất văn bản
Plugin TextExtractor cung cấp ba chế độ trích xuất, mang lại linh hoạt dựa trên nhu cầu của bạn.
- Chế độ nguyên chất: Giữ nguyên định dạng gốc, bao gồm cả khoảng cách và sự canh chỉnh.
- Chế độ thô: Trích xuất văn bản mà không có định dạng, hữu ích cho việc xử lý dữ liệu thô.
- Chế độ đơn giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng bổ sung.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Đặt thành chế độ Nguyên chất
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Xử lý và xuất ra
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
Cách xử lý xử lý theo lô
Đối với những tập tài liệu lớn, bạn có thể tận dụng xử lý theo lô, cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// Định nghĩa đầu ra cho mỗi tệp
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xử lý văn bản đã được trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Các tính năng nổi bật:
- Chế độ Nguyên chất: Trích xuất văn bản trong khi giữ nguyên định dạng gốc của nó.
- Chế độ Thô: Trích xuất văn bản mà không có bất kỳ định dạng nào.
- Chế độ Đơn giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng.
- Xử lý theo lô: Trích xuất văn bản từ nhiều PDF cùng một lúc.
PDF Timestamp Adder
Documentize PDF Timestamp Adder cho .NET là một công cụ mạnh mẽ được thiết kế để thêm dấu thời gian an toàn vào các tài liệu PDF của bạn. Nó nâng cao tính toàn vẹn và xác thực của tài liệu bằng cách cung cấp một tham chiếu thời gian tin cậy, đảm bảo tuân thủ các tiêu chuẩn chữ ký số.
Cách Thêm Dấu Thời Gian vào PDF
Để thêm một dấu thời gian an toàn vào tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
để cấu hình quá trình ghi dấu thời gian. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình ghi dấu thời gian bằng cách sử dụng phương thức
Process
.
1// Khởi tạo plugin Timestamp
2var plugin = new Timestamp();
3
4// Cấu hình các tùy chọn ghi dấu thời gian
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
6
7// Thêm tệp PDF đầu vào
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// Chỉ định tệp PDF đầu ra
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Thực hiện quá trình ghi dấu thời gian
14plugin.Process(opt);
Cách Sử Dụng Xác Thực Tùy Chỉnh với Máy Chủ Dấu Thời Gian
Bạn có thể cung cấp thông tin xác thực xác thực cơ bản khi kết nối với máy chủ dấu thời gian. Điều này cho phép bạn xác thực với các máy chủ yêu cầu tên người dùng và mật khẩu.
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
, bao gồm serverBasicAuthCredentials
. - Thêm đường dẫn tệp đầu vào và đầu ra.
- Gọi phương thức
Process
.
1// Khởi tạo plugin Timestamp
2var plugin = new Timestamp();
3
4// Cấu hình các tùy chọn ghi dấu thời gian với xác thực
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
6
7// Thêm tệp PDF đầu vào
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// Chỉ định tệp PDF đầu ra
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Thực hiện quá trình ghi dấu thời gian
14plugin.Process(opt);
Xử Lý Tệp PFX và Mật Khẩu
Lớp AddTimestampOptions
cho phép bạn sử dụng tệp PFX để ký số cùng với mật khẩu.
- Luồng hoặc Đường Dẫn Tệp PFX: Bạn có thể cung cấp một luồng hoặc đường dẫn đến tệp PFX.
- Bảo Vệ Mật Khẩu: Đảm bảo bạn quản lý bảo mật mật khẩu cho tệp PFX.
Tính Năng Chính:
- Thêm Dấu Thời Gian An Toàn: Dễ dàng thêm dấu thời gian an toàn vào tài liệu PDF của bạn.
- Máy Chủ Dấu Thời Gian Tùy Chỉnh: Sử dụng URL máy chủ dấu thời gian và thông tin xác thực tùy chỉnh.
- Tự Động Hóa: Tích hợp ghi dấu thời gian vào các ứng dụng .NET của bạn cho các workflow tự động.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành đối với chữ ký số và dấu thời gian.
PDF/A Converter
Bộ chuyển đổi PDF/A Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành định dạng PDF/A, đảm bảo rằng nội dung của bạn luôn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Plugin này cũng hỗ trợ kiểm tra các tài liệu PDF hiện có để đảm bảo tuân thủ PDF/A, cung cấp cả tính năng chuyển đổi và xác thực trong một giải pháp duy nhất.
Cách chuyển đổi PDF thành PDF/A
Để chuyển đổi một tài liệu PDF thành định dạng PDF/A, làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfAConverter
. - Tạo một thể hiện của
PdfAConvertOptions
để cấu hình quá trình chuyển đổi. - Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
- Thêm file PDF đầu vào bằng phương thức
AddInput
. - Thêm file đầu ra cho PDF/A kết quả bằng phương thức
AddOutput
. - Gọi phương thức
Process
để thực hiện quá trình chuyển đổi.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm file PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chỉ định file PDF/A đầu ra
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// Thực hiện quá trình chuyển đổi
14pdfAConverter.Process(pdfAOptions);
Kiểm tra tuân thủ PDF/A
Bạn có thể xác thực các file PDF hiện có để kiểm tra tuân thủ PDF/A bằng cách sử dụng lớp PdfAValidateOptions
.
1var pdfAConverter = new PdfAConverter();
2var validationOptions = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Thêm file PDF cần xác thực
8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chạy quy trình xác thực
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// Kiểm tra kết quả xác thực
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("Xác thực PDF/A đã vượt qua: " + validationResult.IsValid);
Xử lý theo lô cho chuyển đổi PDF/A
Plugin này hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi hoặc xác thực nhiều file PDF cho tuân thủ PDF/A cùng một lúc.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm nhiều file PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Chỉ định file đầu ra cho các PDF/A đã chuyển đổi
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// Thực hiện chuyển đổi theo lô
16pdfAConverter.Process(pdfAOptions);
Tính năng chính:
- Chuyển đổi sang PDF/A: Chuyển đổi liền mạch các file PDF thành định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) để đảm bảo tuân thủ các tiêu chuẩn lưu trữ.
- Xác thực tuân thủ PDF/A: Kiểm tra các tài liệu PDF hiện có để đảm bảo tuân thủ các tiêu chuẩn PDF/A và xác định các vấn đề nếu chúng không tuân thủ.
- Xử lý theo lô: Xử lý nhiều file cùng một lúc cho việc chuyển đổi hoặc xác thực.
- Quy trình làm việc hiệu quả: Giảm thiểu thời gian và công sức với các quy trình chuyển đổi nhanh chóng và đáng tin cậy.
PDF to XLS Converter
Công cụ Documentize PDF to XLS Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF thành bảng tính Excel (XLS/XLSX). Bằng cách tận dụng plugin này, các nhà phát triển có thể biến đổi dữ liệu PDF tĩnh thành bảng tính động và có thể chỉnh sửa, giúp đơn giản hóa việc thao tác, phân tích và chia sẻ dữ liệu.
Cách chuyển đổi PDF sang Excel
Để chuyển đổi một tài liệu PDF thành một tệp Excel (XLS/XLSX), hãy thực hiện các bước sau:
- Tạo một thể hiện của lớp
XlsConverter
. - Cấu hình các thiết lập chuyển đổi bằng cách sử dụng lớp
PdfToXlsOptions
. - Thêm các tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định đường dẫn tệp xuất ra bằng phương thức
AddOutput
. - Thực thi phương thức
Process
để bắt đầu quá trình chuyển đổi.
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// Thực hiện chuyển đổi
9converter.Process(options);
Tùy chỉnh chuyển đổi PDF sang Excel
Lớp PdfToXlsOptions
cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển đổi PDF sang tệp XLSX, đặt tên bảng tính và bật các tùy chọn định dạng nâng cao:
1var options = new PdfToXlsOptions
2{
3 Format = PdfToXlsOptions.ExcelFormat.XLSX, // Chỉ định định dạng XLSX
4 WorksheetName = "MySheet", // Đặt tên cho bảng tính
5 InsertBlankColumnAtFirst = true // Chèn một cột trống ở đầu
6};
7
8// Thêm các tệp đầu vào và đầu ra
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// Xử lý chuyển đổi
13converter.Process(options);
Xử lý hàng loạt chuyển đổi PDF sang XLS
Với xử lý hàng loạt, bạn có thể chuyển đổi nhiều tệp PDF thành bảng tính Excel chỉ trong một lần. Dưới đây là một ví dụ:
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm nhiều tệp đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Chỉ định các đường dẫn tệp xuất ra
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// Thực hiện chuyển đổi hàng loạt
13converter.Process(options);
Xử lý kết quả chuyển đổi
Sau quá trình chuyển đổi, phương thức Process
trả về một đối tượng ResultContainer
chứa thông tin chi tiết của hoạt động. Đây là cách để lấy đường dẫn tệp đã chuyển đổi:
1var resultContainer = converter.Process(options);
2
3// Truy cập đường dẫn tệp xuất ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("Đường dẫn tệp đã chuyển đổi: " + result.Data.ToString());
Các định dạng xuất ra được hỗ trợ
Enum PdfToXlsOptions.ExcelFormat
cung cấp một loạt các định dạng xuất ra:
- XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
- XLSM: Định dạng Excel hỗ trợ macro.
- CSV: Giá trị phân tách bằng dấu phẩy.
- ODS: Bảng tính Open Document.
- XMLSpreadSheet2003: Định dạng XML Excel 2003.
Các tính năng chính:
- Tùy chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF thành XLSX, XLS, CSV hoặc các định dạng khác.
- Bảo toàn nội dung: Duy trì cấu trúc, bố cục, và định dạng ban đầu.
- Đầu ra có thể tùy chỉnh: Cấu hình khoảng trang, tên bảng tính, và định dạng xuất ra.
- Xử lý hàng loạt: Xử lý nhiều tệp PDF đồng thời để đạt hiệu suất cao.
- Định dạng nâng cao: Chèn cột trống hoặc giảm thiểu số lượng bảng tính.
PDF to DOC Converter
Trình chuyển đổi PDF sang DOC của Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành định dạng DOC hoặc DOCX. Plugin này chuyển đổi các trang PDF thành các tài liệu Microsoft Word có thể chỉnh sửa, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng.
Cách Chuyển Đổi PDF Sang DOC/DOCX
Để chuyển đổi một tài liệu PDF sang định dạng DOC/DOCX, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
DocConverter
. - Tạo một thể hiện của
DocConversionOptions
để cấu hình quy trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm đường dẫn tệp đầu ra cho tệp DOC/DOCX kết quả bằng phương thức
AddOutput
. - Chạy phương thức
Process
để thực hiện chuyển đổi.
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX, // Định dạng đầu ra là DOCX
5 ConversionMode = ConversionMode.EnhancedFlow // Tối ưu hóa bố cục và định dạng
6};
7
8// Thêm tệp PDF đầu vào
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Thêm đường dẫn tài liệu Word đầu ra
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// Xử lý chuyển đổi
15docConverter.Process(options);
Chuyển Đổi PDF Sang DOC Với Tùy Chọn Tùy Chỉnh
Plugin Trình chuyển đổi PDF sang DOC cung cấp một số tùy chọn để tùy chỉnh quy trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách xử lý bố cục và cấu trúc của PDF trong quá trình chuyển đổi.
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.Doc, // Định dạng đầu ra là DOC
5 ConversionMode = ConversionMode.Precise // Duy trì bố cục PDF gốc một cách gần nhất có thể
6};
7
8// Thêm tệp PDF đầu vào
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Thêm đường dẫn tài liệu Word đầu ra
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// Xử lý chuyển đổi
15docConverter.Process(options);
Xử Lý Lô Chuyển Đổi PDF Sang DOC/DOCX
Trình chuyển đổi PDF sang DOC hỗ trợ xử lý lô, cho phép bạn chuyển đổi nhiều tệp PDF cùng một lúc. Dưới đây là một ví dụ về chuyển đổi lô:
1var docConverter = new DocConverter();
2var options = new DocConversionOptions()
3{
4 SaveFormat = SaveFormat.DocX
5};
6
7// Thêm nhiều tệp PDF đầu vào
8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Thêm đường dẫn tệp đầu ra cho các tệp DOCX kết quả
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// Xử lý chuyển đổi lô
16docConverter.Process(options);
Tính Năng Chính:
- Chuyển Đổi DOC/DOCX: Chuyển đổi tài liệu PDF thành các định dạng Microsoft Word có thể chỉnh sửa (DOC hoặc DOCX).
- Duy Trì Định Dạng: Giữ nguyên bố cục, văn bản và định dạng gốc trong quá trình chuyển đổi.
- Xử Lý Lô: Chuyển đổi nhiều tệp PDF cùng một lúc.
- Tùy Chọn Chuyển Đổi Tùy Chỉnh: Điều chỉnh quy trình chuyển đổi với các chế độ khác nhau, như Enhanced Flow, để có bố cục tốt hơn.
PDF to HTML Converter
Documentize PDF to HTML Converter cho .NET là một công cụ năng động giúp đơn giản hóa việc chuyển đổi tài liệu PDF sang định dạng HTML. Plugin này được thiết kế không chỉ cho việc thay đổi định dạng tệp đơn giản mà còn để nâng cao khả năng truy cập, làm cho tài liệu thân thiện với người dùng hơn và phù hợp với các môi trường web.
Cách chuyển đổi PDF sang HTML
Để chuyển đổi tài liệu PDF sang HTML, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfHtml
. - Tạo một thể hiện của lớp
PdfToHtmlOptions
để cấu hình tùy chọn chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm đường dẫn tệp HTML đầu ra bằng phương thức
AddOutput
. - Gọi phương thức
Process
để chuyển đổi PDF sang HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Thực hiện chuyển đổi PDF sang HTML
9pdfHtml.Process(options);
Cách chuyển đổi HTML sang PDF
PDF to HTML Converter cũng hỗ trợ chuyển đổi các tệp HTML trở lại thành định dạng PDF, cho phép chuyển đổi hai chiều đầy đủ.
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Thực hiện chuyển đổi HTML sang PDF
9pdfHtml.Process(options);
Tùy chỉnh chuyển đổi PDF sang HTML
Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách chỉ định mã hóa, phông chữ hoặc các cài đặt khác. Đây là một ví dụ về việc thiết lập mã hóa UTF-8 và phông Arial cho chuyển đổi:
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Đặt mã hóa và phông chữ
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// Thêm tệp đầu vào và đầu ra
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Thực hiện chuyển đổi
13pdfHtml.Process(options);
Chuyển đổi hàng loạt từ PDF sang HTML
Plugin này cũng hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi nhiều tệp PDF thành tệp HTML chỉ trong một lần.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Thêm nhiều tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Đặt đường dẫn tệp đầu ra cho mỗi chuyển đổi
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Thực hiện chuyển đổi hàng loạt
13pdfHtml.Process(options);
Tính năng chính:
- Chuyển đổi PDF sang HTML: Chuyển đổi tài liệu PDF thành các tệp HTML hoạt động đầy đủ một cách liền mạch.
- Tài nguyên nhúng: Chọn xem có nhúng tài nguyên (chẳng hạn như hình ảnh và phông chữ) trực tiếp vào HTML hay liên kết chúng từ bên ngoài.
- Chuyển đổi hai chiều: Chuyển đổi PDF sang HTML và ngược lại với hỗ trợ đầy đủ cho cả hai chiều.
- Bảo toàn bố cục: Đảm bảo rằng bố cục và định dạng gốc được giữ nguyên trong quá trình chuyển đổi.
- Mã hóa tùy chỉnh: Chỉ định định dạng mã hóa như UTF-8 để hiển thị văn bản chính xác trong HTML đã chuyển đổi.
PDF to JPEG Converter
Trình chuyển đổi PDF sang JPEG của Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa việc chuyển đổi tài liệu PDF thành hình ảnh JPEG chất lượng cao. Plugin này được thiết kế để làm cho nội dung của bạn dễ tiếp cận hơn trên nhiều nền tảng bằng cách biến các trang PDF thành các định dạng hình ảnh được sử dụng rộng rãi.
Cách chuyển đổi trang PDF thành JPEG
Để chuyển đổi tài liệu PDF thành hình ảnh JPEG, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
Jpeg
. - Tạo một thể hiện của
JpegOptions
để cấu hình quy trình chuyển đổi. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Chỉ định đường dẫn tệp đầu ra cho hình ảnh JPEG bằng cách sử dụng phương thức
AddOutput
. - Chạy phương thức
Process
để chuyển đổi các trang PDF thành hình ảnh JPEG.
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// Thêm tệp PDF đầu vào
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Chỉ định thư mục đầu ra cho hình ảnh JPEG
9options.AddOutput(new FileDataSource(@"C:\Samples\images"));
10
11// Xử lý chuyển đổi PDF sang JPEG
12converter.Process(options);
Tùy chỉnh chuyển đổi PDF sang JPEG
Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách điều chỉnh độ phân giải, chọn phạm vi trang hoặc đặt chất lượng hình ảnh. Dưới đây là cách chuyển đổi trang đầu tiên của một PDF ở 300 dpi:
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// Đặt độ phân giải đầu ra là 300 dpi và chỉ chuyển đổi trang đầu tiên
6options.OutputResolution = 300;
7options.PageRange = new PageRange(1);
8
9// Thêm đường dẫn đầu vào và đầu ra
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
12
13// Xử lý chuyển đổi
14converter.Process(options);
Xử lý hàng loạt cho chuyển đổi PDF sang JPEG
Plugin Trình chuyển đổi PDF sang JPEG hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi nhiều trang từ một PDF thành các tệp JPEG riêng lẻ.
1
2var converter = new Jpeg();
3var options = new JpegOptions();
4
5// Thêm tệp PDF đầu vào
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Đặt đường dẫn đầu ra cho mỗi trang
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));
11
12// Xử lý chuyển đổi hàng loạt
13converter.Process(options);
Cách xử lý kết quả chuyển đổi
Phương thức Process trả về một đối tượng ResultContainer
chứa thông tin về kết quả chuyển đổi. Bạn có thể in các đường dẫn của các tệp JPEG đã được chuyển đổi như sau:
1
2ResultContainer resultContainer = converter.Process(options);
3
4// In các đường dẫn đầu ra của hình ảnh JPEG
5foreach (FileResult result in resultContainer.ResultCollection)
6{
7 Console.WriteLine(result.Data.ToString());
8}
Các tính năng chính:
- Chuyển đổi PDF sang JPEG: Dễ dàng chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh JPEG.
- Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) cho các đầu ra chất lượng cao.
- Phạm vi trang: Chọn các trang hoặc phạm vi cụ thể để chuyển đổi.
- Xử lý hàng loạt: Chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu cùng một lúc.
- Chuyển đổi nhanh chóng: Quy trình nhanh và hiệu quả với nỗ lực tối thiểu.
PDF to PNG Converter
Trình chuyển đổi PDF sang PNG Documentize cho .NET là một công cụ tiên tiến cho phép bạn chuyển đổi các tài liệu PDF thành hình ảnh PNG chất lượng cao. Plugin này được thiết kế để làm cho nội dung của bạn linh hoạt hơn, dễ tiếp cận hơn và dễ chia sẻ hơn bằng cách chuyển đổi các trang PDF thành các định dạng hình ảnh được hỗ trợ rộng rãi.
Cách Chuyển Đổi PDF Sang PNG
Để chuyển đổi một tài liệu PDF thành hình ảnh PNG, làm theo các bước sau:
- Tạo một thể hiện của lớp
Png
. - Tạo một thể hiện của
PngOptions
để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Chỉ định thư mục đầu ra cho các hình ảnh PNG bằng cách sử dụng phương thức
AddOutput
. - Chạy phương thức
Process
để chuyển đổi các trang PDF thành hình ảnh PNG.
1var converter = new Png();
2var options = new PngOptions();
3
4// Thêm tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6
7// Chỉ định thư mục đầu ra cho các hình ảnh PNG
8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
9
10// Thực hiện chuyển đổi PDF sang PNG
11converter.Process(options);
Tùy Chỉnh Quá Trình Chuyển Đổi PDF Sang PNG
Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách điều chỉnh độ phân giải và chọn các trang cụ thể. Ví dụ, để chỉ chuyển đổi trang đầu tiên của một PDF ở độ phân giải 300 DPI:
1var converter = new Png();
2var options = new PngOptions();
3
4// Đặt độ phân giải đầu ra là 300 DPI
5options.OutputResolution = 300;
6
7// Chuyển đổi chỉ trang đầu tiên
8options.PageRange = new PageRange(1);
9
10// Thêm đường dẫn đầu vào và đầu ra
11options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
13
14// Thực hiện quy trình chuyển đổi
15converter.Process(options);
Xử Lý Lô Đối Với Chuyển Đổi PDF Sang PNG
Plugin PDF to PNG Converter cũng hỗ trợ xử lý lô, cho phép bạn chuyển đổi nhiều trang hoặc thậm chí toàn bộ tài liệu PDF thành các tệp PNG riêng lẻ.
1var converter = new Png();
2var options = new PngOptions();
3
4// Thêm tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Đặt đường dẫn đầu ra cho từng trang
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
10
11// Thực hiện quy trình chuyển đổi lô
12converter.Process(options);
Xử Lý Kết Quả Chuyển Đổi
Sau khi xử lý chuyển đổi, phương thức Process trả về một đối tượng ResultContainer
chứa kết quả chuyển đổi. Bạn có thể in các đường dẫn đầu ra của các hình ảnh PNG như sau:
1ResultContainer resultContainer = converter.Process(options);
2
3// In các đường dẫn đầu ra của các hình ảnh PNG
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
Tính Năng Chính:
- Chuyển đổi PDF thành PNG: Nhanh chóng và hiệu quả chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh PNG.
- Độ Phân Giải Tùy Chỉnh: Đặt DPI mong muốn (ví dụ: 300 DPI) cho đầu ra hình ảnh chất lượng cao.
- Xử Lý Lô: Chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu chỉ trong một lần.
- Quản Lý Đầu Ra Dễ Dàng: Chỉ định các thư mục đầu ra cho từng tệp PNG đã chuyển đổi.
- Chuyển Đổi Nhanh Chóng: Nhanh, hiệu quả và yêu cầu nỗ lực tối thiểu để cấu hình.
PDF to TIFF Converter
Documentize PDF to TIFF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành hình ảnh TIFF chất lượng cao. Plugin này đảm bảo rằng nội dung của bạn có thể truy cập được qua nhiều nền tảng khác nhau trong khi vẫn giữ được độ trung thực và tính linh hoạt tuyệt vời.
Cách Chuyển Đổi PDF Sang TIFF
Để chuyển đổi tài liệu PDF thành hình ảnh TIFF, hãy làm theo các bước sau:
- Tạo một đối tượng của lớp
TiffConverter
. - Tạo một đối tượng của
PdfToTiffOptions
để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định đường dẫn tệp đầu ra cho các hình ảnh TIFF bằng phương thức
AddOutput
. - Chạy phương thức
Process
để chuyển đổi các trang PDF thành hình ảnh TIFF.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Thêm tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Chỉ định tệp đầu ra cho hình ảnh TIFF
8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
9
10// Xử lý chuyển đổi PDF sang TIFF
11converter.Process(options);
Tùy Chỉnh Chuyển Đổi PDF Sang TIFF
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, bật đầu ra nhiều trang, hoặc chọn các phạm vi trang. Dưới đây là cách chuyển đổi trang đầu tiên của một PDF ở độ phân giải 300 dpi thành tệp TIFF:
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Đặt độ phân giải đầu ra là 300 dpi và chỉ chuyển đổi trang đầu tiên
5options.OutputResolution = 300;
6options.PageList = new List<int> { 1 };
7
8// Thêm đường dẫn đầu vào và đầu ra
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// Xử lý chuyển đổi
13converter.Process(options);
Tạo TIFF Nhiều Trang
Plugin PDF to TIFF Converter hỗ trợ tạo TIFF nhiều trang, cho phép bạn kết hợp nhiều trang PDF thành một tệp TIFF duy nhất để lưu trữ hoặc in ấn hiệu quả.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions
3{
4 MultiPage = true // Bật đầu ra TIFF nhiều trang
5};
6
7// Thêm tệp PDF đầu vào
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chỉ định tệp đầu ra cho TIFF nhiều trang
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// Xử lý chuyển đổi
14converter.Process(options);
Xử Lý Theo Lô cho Chuyển Đổi PDF Sang TIFF
Plugin PDF to TIFF Converter cũng hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu đồng thời thành các tệp TIFF riêng biệt.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Thêm tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Đặt đường dẫn đầu ra cho các trang riêng lẻ
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// Xử lý chuyển đổi theo lô
12converter.Process(options);
Cách Xử Lý Kết Quả Chuyển Đổi
Phương thức Process trả về một đối tượng ResultContainer
cung cấp thông tin chi tiết về kết quả chuyển đổi. Bạn có thể in các đường dẫn của các tệp TIFF đã chuyển đổi như sau:
1ResultContainer resultContainer = converter.Process(options);
2
3// In các đường dẫn đầu ra của hình ảnh TIFF
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
Tính Năng Chính:
- Chuyển Đổi PDF Sang TIFF: Chuyển đổi dễ dàng toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh TIFF.
- Độ Phân Giải Tùy Chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao hơn.
- TIFF Nhiều Trang: Kết hợp nhiều trang PDF thành một tệp TIFF nhiều trang duy nhất.
- Phạm Vi Trang: Chuyển đổi các trang hoặc phạm vi cụ thể để có kết quả chính xác.
- Xử Lý Theo Lô: Chuyển đổi nhiều tài liệu PDF hoặc trang cùng một lúc.
- Chuyển Đổi Nhanh: Quy trình nhanh chóng và hiệu quả với ít nỗ lực.
Plugin Documentize PDF Form Flattener for .NET được thiết kế để chuyển đổi các mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn khỏi các sửa đổi trái phép. Công cụ này chuyển đổi các trường mẫu thành nội dung tĩnh, nâng cao bảo mật cho các tài liệu PDF của bạn. Nó đặc biệt hữu ích khi bạn cần bảo vệ các hợp đồng, thỏa thuận hoặc bất kỳ tài liệu nào mà các trường mẫu phải giữ nguyên.
Cách làm phẳng các trường mẫu trong PDF
Để làm phẳng các trường mẫu trong tài liệu PDF, vui lòng làm theo các bước sau:
- Tạo một thể hiện của lớp
FormFlattener
. - Tạo một thể hiện của lớp
FormFlattenAllFieldsOptions
hoặc FormFlattenSelectedFieldsOptions
. - Thêm các tệp đầu vào và đầu ra vào các tùy chọn.
- Gọi phương thức
Process
để thực hiện thao tác làm phẳng.
1var formFlattener = new FormFlattener();
2
3// Tạo tùy chọn để làm phẳng tất cả các trường
4var flattenOptions = new FormFlattenAllFieldsOptions();
5
6// Thêm tệp đầu vào và đầu ra
7flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
8flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
9
10// Xử lý thao tác làm phẳng mẫu
11var resultContainer = formFlattener.Process(flattenOptions);
Làm phẳng các trường được chọn
Bạn có thể làm phẳng một cách chọn lọc chỉ các trường mẫu cụ thể dựa trên các tiêu chí như vị trí hoặc loại trường.
- Tạo một thể hiện của lớp
FormFlattener
. - Định nghĩa các tiêu chí để làm phẳng các trường cụ thể bằng cách sử dụng
FormFlattenSelectedFieldsOptions
. - Thêm các tệp đầu vào và đầu ra vào các tùy chọn.
- Gọi phương thức
Process
để áp dụng các thay đổi.
1var formFlattener = new FormFlattener();
2
3// Tạo tùy chọn để làm phẳng các trường được chọn (ví dụ: các trường có tọa độ x góc dưới bên trái > 300)
4var flattenOptions = new FormFlattenSelectedFieldsOptions(
5 (field) => field.Rect.LLX > 300
6);
7
8// Thêm các tệp đầu vào và đầu ra
9flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
10flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
11
12// Xử lý thao tác làm phẳng mẫu
13var resultContainer = formFlattener.Process(flattenOptions);
Tính năng chính:
- Làm phẳng tất cả các trường mẫu: Chuyển đổi các trường mẫu tương tác thành nội dung tĩnh không thể chỉnh sửa.
- Làm phẳng các trường đã chọn: Tùy chọn làm phẳng các trường cụ thể trong PDF trong khi giữ các trường khác có thể chỉnh sửa.
- Bảo mật tài liệu: Đảm bảo rằng các trường đã làm phẳng được bảo vệ khỏi các sửa đổi tiếp theo.
- Xử lý theo lô: Có khả năng làm phẳng nhiều mẫu PDF trong một quy trình duy nhất.
FAQs
Câu hỏi thường gặp này cung cấp thông tin toàn diện về các tính năng và chức năng của Documentize .NET Plugins, bao gồm các khía cạnh như chuyển đổi PDF, xử lý biểu mẫu và tạo mục lục (TOC).
Câu hỏi chung
1. Documentize cho .NET là gì?
Documentize cho .NET là một thư viện mạnh mẽ để quản lý và xử lý tài liệu PDF bằng lập trình. Nó bao gồm các plugin để chuyển đổi PDF sang các định dạng khác nhau, chỉnh sửa biểu mẫu PDF, thêm chữ ký điện tử, tạo TOC và đảm bảo tuân thủ PDF/A cho lưu trữ dài hạn.
2. Làm thế nào để cài đặt các plugin Documentize cho .NET?
Bạn có thể cài đặt các plugin Documentize bằng cách tải xuống các tệp assembly từ trang web chính thức hoặc lấy các gói trực tiếp từ NuGet. Hướng dẫn cài đặt chi tiết có sẵn trong tài liệu của từng plugin.
Các plugin chuyển đổi PDF
3. Làm thế nào để chuyển đổi tài liệu PDF sang tệp Word (DOC/DOCX)?
Để chuyển đổi tài liệu PDF sang định dạng Word bằng Trình chuyển đổi PDF sang DOC:
- Khởi tạo lớp
PdfDoc
. - Tạo một đối tượng
PdfToDocOptions
để cấu hình các tùy chọn chuyển đổi. - Thêm đường dẫn tệp PDF đầu vào và tệp DOC/DOCX đầu ra.
- Gọi phương thức
Process
để thực hiện chuyển đổi.
4. Làm thế nào để chuyển đổi các trang PDF thành hình ảnh JPEG?
Sử dụng Trình chuyển đổi PDF sang JPEG:
- Tạo một thể hiện của lớp
Jpeg
. - Đặt các tùy chọn chuyển đổi (ví dụ: độ phân giải, phạm vi trang) thông qua
JpegOptions
. - Thêm đường dẫn tệp đầu vào/đầu ra.
- Gọi phương thức
Jpeg.Process
để thực hiện chuyển đổi.
5. Làm thế nào để chuyển đổi PDF sang PNG?
Để chuyển đổi PDF sang định dạng PNG:
- Tạo một thể hiện của lớp
Png
và một đối tượng PngOptions
. - Thêm PDF đầu vào và chỉ định thư mục đầu ra.
- Đặt các tùy chọn như độ phân giải (ví dụ: 300 DPI).
- Gọi phương thức
Process
để tạo hình ảnh PNG.
6. Làm thế nào để chuyển đổi PDF sang Excel (XLS/XLSX)?
Để chuyển đổi PDF sang Excel:
- Khởi tạo lớp
PdfXls
. - Sử dụng
PdfToXlsOptions
để cấu hình đường dẫn đầu vào/đầu ra và các tùy chọn chuyển đổi. - Gọi phương thức
Process
để bắt đầu chuyển đổi.
7. Làm thế nào để chuyển đổi PDF sang HTML?
Để chuyển đổi tài liệu PDF sang HTML:
- Tạo một thể hiện của lớp
PdfHtml
. - Cấu hình các tùy chọn chuyển đổi với
PdfToHtmlOptions
hoặc HtmlToPdfOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
Xử lý biểu mẫu PDF
8. Làm thế nào tôi có thể chỉnh sửa biểu mẫu PDF bằng Trình chỉnh sửa Biểu mẫu?
Trình chỉnh sửa Biểu mẫu PDF cung cấp khả năng để:
- Thêm trường (
FormEditorAddOptions
). - Cập nhật trường (
FormEditorSetOptions
). - Xóa trường (
FormRemoveSelectedFieldsOptions
).
Sau khi cấu hình các trường biểu mẫu, hãy chạy phương thức Process
.
9. Làm thế nào để gộp biểu mẫu PDF?
Để gộp các trường biểu mẫu:
- Khởi tạo lớp
FormFlattener
. - Sử dụng
FormFlattenAllFieldsOptions
để gộp tất cả các trường hoặc FormFlattenSelectedFieldsOptions
để nhắm đến các trường cụ thể. - Thêm tệp đầu vào/đầu ra và gọi phương thức
Process
.
10. Làm thế nào tôi có thể xuất dữ liệu từ các biểu mẫu PDF?
Để xuất dữ liệu biểu mẫu, sử dụng Trình xuất Biểu mẫu PDF. Tạo một đối tượng FormExporterValuesToCsvOptions
, chỉ định các điều kiện trường biểu mẫu, và chạy phương thức Process
để xuất dữ liệu sang định dạng CSV.
Quản lý PDF/A và TOC
11. Làm thế nào để chuyển đổi PDF sang định dạng PDF/A?
Để chuyển đổi PDF sang PDF/A:
- Sử dụng lớp
PdfAConverter
. - Cấu hình phiên bản PDF/A (ví dụ: PDF/A-3B) trong
PdfAConvertOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
12. Làm thế nào để tạo một Mục lục (TOC) trong PDF?
Để tạo một TOC:
- Tạo một thể hiện của lớp
TocGenerator
. - Sử dụng
TocOptions
để định nghĩa các tham số TOC. - Thêm tệp đầu vào/đầu ra và chạy phương thức
Process
.
Xử lý chữ ký
13. Làm thế nào để tôi ký kỹ thuật số một tài liệu PDF?
Để thêm một chữ ký kỹ thuật số:
- Khởi tạo lớp
Signature
. - Sử dụng
SignOptions
để cấu hình tệp PFX, mật khẩu và chi tiết chữ ký (ví dụ: lý do, thông tin liên hệ). - Thêm tệp đầu vào/đầu ra và chạy phương thức
Process
.
Tính năng bổ sung
14. Tôi có thể tách các tệp PDF bằng Documentize không?
Có, bằng cách sử dụng Trình tách PDF:
- Khởi tạo lớp
Splitter
. - Cấu hình các tùy chọn tách bằng
SplitOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
15. Làm thế nào để kết hợp nhiều tệp PDF thành một?
Để kết hợp các PDF:
- Khởi tạo lớp
Merger
. - Thêm các PDF đầu vào và chỉ định một tệp đầu ra thông qua
MergeOptions
. - Chạy phương thức
Process
để kết hợp các tệp.
16. Documentize có bị giới hạn chỉ làm việc với các tệp PDF không?
Trong khi Documentize chủ yếu tập trung vào thao tác PDF, nó cũng hỗ trợ chuyển đổi tới và từ các định dạng như DOC, XLS, HTML, JPEG và PNG.
Giấy phép và Tương thích
17. Các yêu cầu hệ thống để sử dụng các plugin Documentize là gì?
Documentize hỗ trợ:
- Hệ điều hành: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), và Linux.
- Khung làm việc: .NET Framework 4.0 đến 8.0.
- IDE: Tương thích với nhiều phiên bản của Visual Studio.
18. Làm thế nào để tôi thiết lập các khóa giấy phép cho Documentize?
Để kích hoạt một plugin, tham chiếu Documentize trong dự án của bạn và thiết lập các khóa giấy phép trước khi gọi bất kỳ phương thức nào. Tham khảo tài liệu của từng plugin để biết hướng dẫn chi tiết.
19. Tôi có thể tìm thấy thêm ví dụ và tài liệu cho các plugin Documentize ở đâu?
Tài liệu API hoàn chỉnh và ví dụ có thể được tìm thấy trên trang web Documentize hoặc thông qua các gói NuGet trong môi trường phát triển của bạn.