Tiểu mục của Hướng dẫn cho nhà phát triển
Bảo Mật PDF
Documentize Bảo Mật PDF cho .NET là một công cụ mạnh mẽ được thiết kế để cải thiện bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp khả năng mã hóa và giải mã. Nó đảm bảo rằng thông tin nhạy cảm của bạn vẫn được giữ bí mật và bảo vệ khỏi truy cập trái phép.
Tính Năng Chính:
- Mã Hóa Tài Liệu PDF: Bảo vệ tệp PDF của bạn bằng cách thêm mật khẩu cho người dùng và chủ sở hữu.
- Giải Mã Tài Liệu PDF: Xóa bỏ mã hóa khỏi PDF khi cần.
- Đặt Quyền: Kiểm soát các quyền như in ấn, sao chép và sửa đổi nội dung.
- Tự Động Hóa: Tích hợp mã hóa và giải mã vào các ứng dụng .NET của bạn để tạo quy trình tự động.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về bảo mật tài liệu.
Cách Mã Hóa Tài Liệu PDF
Để mã hóa một tài liệu PDF, làm theo các bước sau:
- Tạo một phiên bản của lớp
Security
. - Tạo một phiên bản của
EncryptionOptions
với các mật khẩu người dùng và chủ sở hữu mong muốn. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình mã hóa bằng phương thức
Process
.
1
2// Khởi tạo plugin Bảo mật
3var plugin = new Security();
4
5// Cấu hình các tùy chọn mã hóa
6var opt = new EncryptionOptions("user_password", "owner_password");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Đặt tệp PDF được mã hóa đầu ra
12opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
13
14// Thực hiện quá trình mã hóa
15plugin.Process(opt);
Cách Giải Mã Tài Liệu PDF
Để giải mã một tài liệu PDF, làm theo các bước sau:
- Tạo một phiên bản của lớp
Security
. - Tạo một phiên bản của
DecryptionOptions
với mật khẩu cần thiết. - Thêm tệp PDF đã được mã hóa bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình giải mã bằng phương thức
Process
.
1
2// Khởi tạo plugin Bảo mật
3var plugin = new Security();
4
5// Cấu hình các tùy chọn giải mã
6var opt = new DecryptionOptions("user_password");
7
8// Thêm tệp PDF đã được mã hóa đầu vào
9opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
10
11// Đặt tệp PDF đã được giải mã đầu ra
12opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
13
14// Thực hiện quá trình giải mã
15plugin.Process(opt);
Đặt Quyền Trên Tài Liệu PDF
Khi mã hóa một tệp PDF, bạn có thể đặt nhiều quyền khác nhau để kiểm soát cách tài liệu có thể được sử dụng.
- In Ấn: Cho phép hoặc không cho phép in tài liệu.
- Sao Chép: Cho phép hoặc không cho phép sao chép nội dung.
- Sửa Đổi: Cho phép hoặc không cho phép sửa đổi tài liệu.
Để đặt quyền, bạn có thể cấu hình EncryptionOptions
cho phù hợp.
Chuyển Đổi PDF Sang XLS
Chuyển Đổi PDF Sang XLS cho .NET là một công cụ mạnh mẽ cho phép việc chuyển đổi tài liệu PDF sang bảng tính Excel (XLS/XLSX) một cách liền mạch. Plugin này nâng cao khả năng truy cập và tính tiện dụng của nội dung PDF của bạn, giúp dễ dàng thao tác và phân tích dữ liệu ở định dạng bảng tính.
Tính Năng Chính:
- Chuyển Đổi PDF Sang Excel: Biến các tệp PDF thành bảng tính XLS/XLSX để quản lý dữ liệu dễ dàng.
- Tùy Chọn Đầu Ra Tùy Chỉnh: Cấu hình định dạng đầu ra, dải trang, tên bảng tính, và nhiều hơn nữa.
- Chuyển Đổi Độ Trung Thực Cao: Giữ nguyên bố cục, định dạng, và độ chính xác nội dung trong quá trình chuyển đổi.
- Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc cho các hoạt động quy mô lớn.
Cách Chuyển Đổi PDF Sang XLS
Để chuyển đổi tài liệu PDF thành tệp Excel (XLS/XLSX), làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfXls
. - Tạo một thể hiện của
PdfToXlsOptions
để cấu hình các cài đặt chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định tệp Excel đầu ra bằng phương thức
AddOutput
. - Chạy phương thức
Process
để bắt đầu chuyển đổi.
1
2var pdfXlsConverter = new PdfXls();
3var options = new PdfToXlsOptions();
4
5// Thêm đường dẫn tệp đầu vào và đầu ra
6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// Chạy quy trình chuyển đổi
10pdfXlsConverter.Process(options);
Tùy Chỉnh Việc Chuyển Đổi PDF Sang Excel
Bạn có thể tùy chỉnh các cài đặt chuyển đổi bằng cách sửa đổi lớp PdfToXlsOptions
. Chẳng hạn, để chuyển đổi PDF sang định dạng XLSX, chèn một cột trống và đặt tên cho bảng tính, bạn có thể sử dụng mã sau:
1
2var options = new PdfToXlsOptions();
3
4// Đặt định dạng đầu ra là XLSX
5options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
6
7// Chèn một cột trống ở vị trí đầu tiên
8options.InsertBlankColumnAtFirst = true;
9
10// Đặt tên cho bảng tính
11options.WorksheetName = "MySheet";
12
13// Thêm tệp đầu vào và đầu ra
14options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
15options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
16
17// Xử lý chuyển đổi
18pdfXlsConverter.Process(options);
Xử Lý Kết Quả Chuyển Đổi
Sau khi xử lý, phương thức Process trả về một đối tượng ResultContainer
chứa kết quả của quá trình chuyển đổi. Bạn có thể lấy đường dẫn tệp đã chuyển đổi hoặc các chi tiết đầu ra khác:
1
2var resultContainer = pdfXlsConverter.Process(options);
3
4// Truy cập và in ra đường dẫn tệp kết quả
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine(result);
Xử Lý Theo Lô Cho Việc Chuyển Đổi PDF Sang XLS
Plugin Chuyển Đổi PDF Sang XLS cũng hỗ trợ xử lý theo lô, cho phép chuyển đổi nhiều tệp PDF cùng một lúc.
1
2var pdfXlsConverter = new PdfXls();
3var options = new PdfToXlsOptions();
4
5// Thêm nhiều tệp PDF đầu vào
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Thêm các tệp Excel đầu ra
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// Xử lý chuyển đổi theo lô
14pdfXlsConverter.Process(options);
Chữ Ký PDF
Plugin Documentize PDF Signature for .NET cho phép người dùng ký số tài liệu PDF. Nó cung cấp quy trình bổ sung chữ ký dễ dàng, đảm bảo tính xác thực và bảo vệ nội dung PDF. Plugin hỗ trợ cả chữ ký có thể nhìn thấy và chữ ký không hiển thị và cung cấp các tùy chọn để tùy chỉnh vị trí, lý do, thông tin liên hệ và nhiều thứ khác của chữ ký.
Tính Năng Chính:
- Ký Số Tài Liệu PDF: Bảo mật tài liệu của bạn bằng chữ ký số có thể nhìn thấy hoặc không nhìn thấy.
- Hỗ Trợ PFX: Ký các tệp PDF bằng chứng chỉ PFX.
- Tùy Chọn Tùy Chỉnh: Cấu hình các cài đặt chữ ký như lý do, địa điểm và thông tin liên lạc.
- Chữ Ký Có Thể Nhìn Thấy và Không Nhìn Thấy: Chọn xem chữ ký có hiển thị trên tài liệu hay không.
Cách Ký Tài Liệu PDF
Để ký một tài liệu PDF bằng tệp PFX, thực hiện theo các bước sau:
- Tạo một thể hiện của lớp
Signature
. - Khởi tạo lớp
SignOptions
với đường dẫn tệp PFX và mật khẩu. - Thêm tài liệu PDF đầu vào và tệp đầu ra vào tùy chọn.
- Chạy phương thức
Process
để áp dụng chữ ký.
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// Thêm tài liệu PDF đầu vào và chỉ định tệp đầu ra
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// Cấu hình các tùy chọn chữ ký
10signOptions.Reason = "Hợp Đồng Thỏa Thuận";
11signOptions.Contact = "johndoe@example.com";
12signOptions.Location = "New York";
13signOptions.PageNumber = 1;
14signOptions.Visible = true;
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
16
17// Áp dụng chữ ký cho tài liệu
18signature.Process(signOptions);
Cách Sử Dụng Luồng Để Tệp PFX
Bạn cũng có thể ký một PDF bằng chứng chỉ PFX được cung cấp dưới dạng luồng thay vì đường dẫn tệp. Điều này cho phép xử lý linh hoạt hơn về việc lưu trữ chứng chỉ.
- Tạo một thể hiện của lớp
Signature
. - Khởi tạo
SignOptions
với một luồng chứa PFX và mật khẩu. - Thêm các tệp đầu vào và đầu ra.
- Chạy phương thức
Process
để áp dụng chữ ký.
1
2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
3var signature = new Signature();
4var signOptions = new SignOptions(pfxStream, "pfxPassword");
5
6// Thêm các tệp đầu vào và đầu ra
7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
9
10// Áp dụng chữ ký
11signature.Process(signOptions);
Cách Áp Dụng Chữ Ký Không Nhìn Thấy
Để thêm một chữ ký không nhìn thấy (một chữ ký bảo mật tài liệu mà không hiển thị chữ ký trên tài liệu), chỉ cần đặt thuộc tính Visible
thành false
.
- Tạo một thể hiện của
SignOptions
. - Đặt
Visible
thành false
. - Thêm các tệp đầu vào và đầu ra.
- Gọi
Process
để áp dụng chữ ký không nhìn thấy.
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// Cấu hình chữ ký không nhìn thấy
6signOptions.Visible = false;
7
8// Thêm các tệp đầu vào và đầu ra
9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
11
12// Xử lý chữ ký
13signature.Process(signOptions);
Converter PDF/A
Documentize PDF/A Converter cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo rằng nội dung của bạn vẫn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Plugin này cũng hỗ trợ xác minh các tài liệu PDF hiện có về sự phù hợp với PDF/A, cung cấp cả tính năng chuyển đổi và xác minh trong một giải pháp duy nhất.
Tính năng chính:
- Chuyển đổi sang PDF/A: Dễ dàng chuyển đổi tệp PDF sang định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) để đảm bảo tuân thủ các tiêu chuẩn lưu trữ.
- Xác minh sự phù hợp với PDF/A: Kiểm tra các tài liệu PDF hiện có để xác định sự tuân thủ với các tiêu chuẩn PDF/A và phát hiện các vấn đề nếu không tuân thủ.
- Xử lý hàng loạt: Xử lý nhiều tệp cùng một lúc để chuyển đổi hoặc xác minh.
- Luồng công việc hiệu quả: Giảm thiểu thời gian và công sức với quy trình chuyển đổi nhanh và đáng tin cậy.
Cách chuyển đổi PDF sang PDF/A
Để chuyển đổi một tài liệu PDF thành định dạng PDF/A, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfAConverter
. - Tạo một thể hiện của
PdfAConvertOptions
để cấu hình chuyển đổi. - Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
- Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm tệp đầu ra cho PDF/A kết quả bằng phương thức
AddOutput
. - Gọi phương thức
Process
để thực hiện chuyển đổi.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm tệp PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chỉ định tệp PDF/A đầu ra
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// Tiến hành chuyển đổi
14pdfAConverter.Process(pdfAOptions);
Xác minh sự phù hợp với PDF/A
Bạn có thể xác minh các tệp PDF hiện có về sự phù hợp với PDF/A bằng cách sử dụng lớp PdfAValidateOptions
.
1var pdfAConverter = new PdfAConverter();
2var validationOptions = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Thêm tệp PDF cần xác minh
8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chạy quá trình xác minh
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// Kiểm tra kết quả xác minh
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("Xác minh PDF/A đã thành công: " + validationResult.IsValid);
Xử lý hàng loạt cho chuyển đổi PDF/A
Plugin này hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi hoặc xác minh nhiều tệp PDF về sự phù hợp với PDF/A tại một thời điểm.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm nhiều tệp PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Chỉ định tệp đầu ra cho các PDF/A đã chuyển đổi
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// Tiến hành chuyển đổi hàng loạt
16pdfAConverter.Process(pdfAOptions);
Công cụ chia PDF
Công cụ chia PDF Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình chia tách tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất các trang riêng lẻ hay chia một tài liệu thành các phần cụ thể, plugin này cho phép bạn thực hiện điều đó một cách hiệu quả và với nỗ lực tối thiểu.
Tính năng chính:
- Chia PDF theo trang: Chia tách một tài liệu PDF thành các trang riêng lẻ.
- Xử lý hàng loạt: Chia tách nhiều tệp PDF lớn trong một lần.
- Tùy chọn chia tách tùy chỉnh: Cấu hình quá trình chia tách dựa trên yêu cầu của bạn.
- Đầu ra được tổ chức: Dễ dàng quản lý các tệp đầu ra cho mỗi trang hoặc phần được chia tách.
Cách chia tách tài liệu PDF
Để chia tách một tài liệu PDF thành các trang riêng lẻ, hãy làm theo các bước sau:
- Tạo một phiên bản của lớp
Splitter
. - Tạo một phiên bản của
SplitOptions
để cấu hình các tùy chọn chia tách. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Thêm các tệp đầu ra cho mỗi trang chia tách bằng cách sử dụng phương thức
AddOutput
. - Chạy phương thức
Process
để chia tách tài liệu.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm tệp PDF đầu vào
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Chỉ định các tệp đầu ra cho mỗi trang
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
12
13// Xử lý thao tác chia tách
14splitter.Process(splitOptions);
Chia tách PDF theo dải trang
Bạn cũng có thể chia tách một PDF bằng cách chỉ định các dải trang. Điều này cho phép bạn trích xuất các phần cụ thể hoặc nhiều trang từ một PDF vào các tài liệu riêng biệt.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm PDF đầu vào
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Định nghĩa đầu ra cho dải trang (ví dụ, trang 1-3)
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
10
11// Xử lý việc chia tách
12splitter.Process(splitOptions);
Cách xử lý chia tách hàng loạt
Plugin Công cụ chia PDF được tối ưu hóa để xử lý hàng loạt các tài liệu PDF lớn. Bạn có thể chia tách hàng trăm PDF thành các trang hoặc phần riêng lẻ bằng cách tận dụng xử lý hàng loạt.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm các tệp PDF đầu vào theo lô
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Định nghĩa đầu ra cho mỗi tệp
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
12
13// Xử lý chia tách hàng loạt
14splitter.Process(splitOptions);
PDF ChatGPT
Plugin Documentize ChatGPT for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT với các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo ra các phản hồi chat dựa trên tin nhắn đầu vào và lưu đầu ra ở định dạng PDF, giúp phù hợp cho việc tạo ra giao diện đối thoại hoặc báo cáo phân tích trực tiếp trong các tài liệu PDF.
Tính năng chính:
- Hoàn thành Chat: Tạo phản hồi bằng cách sử dụng API ChatGPT dựa trên đầu vào tùy chỉnh.
- Tin nhắn Hệ thống & Người dùng: Cung cấp cả bối cảnh hệ thống và đầu vào của người dùng để tạo ra các cuộc hội thoại linh hoạt.
- Đầu ra PDF: Lưu các hoàn thành chat đã tạo trong một tệp PDF có cấu trúc để sử dụng sau này.
- Xử lý Không đồng bộ: Đảm bảo ứng dụng phản hồi nhanh chóng bằng cách xử lý các hoàn thành chat không đồng bộ.
Tạo Phản hồi Chat
Để tạo ra các phản hồi chat và lưu chúng vào một tệp PDF bằng cách sử dụng plugin ChatGPT, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfChatGptRequestOptions
để cấu hình các tùy chọn yêu cầu. - Thêm các tệp PDF đầu vào và đầu ra.
- Đặt khóa API và chỉ định các tham số như số lượng token tối đa và truy vấn cho mô hình ChatGPT.
- Chạy phương thức
ProcessAsync
để tạo hoàn thành chat.
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // Đặt khóa API của bạn
4options.MaxTokens = 1000; // Đặt số lượng token tối đa
5options.Query = "Phân tích văn bản này để tìm các chủ đề chính.";
6
7// Thêm tệp PDF đầu vào
8options.AddInput(new FileDataSource("input.pdf"));
9
10// Chỉ định nơi lưu tệp PDF đầu ra với các phản hồi chat
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// Tạo một thể instance của plugin PdfChatGpt
14var plugin = new PdfChatGpt();
15
16// Chạy quá trình không đồng bộ
17var result = await plugin.ProcessAsync(options);
Thêm Tin nhắn Hệ thống và Người dùng
Để tạo ra một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn của người dùng. Những tin nhắn này giúp hình thành bối cảnh của cuộc trò chuyện.
- Thêm một tin nhắn hệ thống thiết lập bối cảnh cho ChatGPT.
- Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng cho cuộc trò chuyện.
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // Đặt khóa API của bạn
4
5// Thêm tin nhắn hệ thống cho bối cảnh
6options.AddSystemMessage("Bạn là một trí tuệ nhân tạo được đào tạo để tóm tắt văn bản.");
7
8// Thêm tin nhắn người dùng để truy vấn mô hình ChatGPT
9options.AddUserMessage("Xin vui lòng tóm tắt tài liệu đính kèm.");
10
11// Thêm các tệp PDF đầu vào và đầu ra
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// Xử lý yêu cầu không đồng bộ
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
Tối ưu hóa PDF
Bộ tối ưu hóa PDF Documentize là một plugin toàn diện giúp nâng cao tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Nó được thiết kế để giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những hoạt động này cải thiện chất lượng và khả năng quản lý của các tệp PDF, giúp dễ dàng lưu trữ, chia sẻ và xem.
Tính năng chính:
- Tối ưu hóa: Giảm kích thước tệp PDF mà không mất chất lượng.
- Xoay: Điều chỉnh hướng của các trang PDF.
- Cắt: Loại bỏ các lề hoặc nội dung không cần thiết khỏi tài liệu.
- Thay đổi kích thước: Thay đổi kích thước các trang theo kích thước cụ thể (ví dụ: A4, Letter).
Tối ưu hóa tài liệu PDF
Các bước sau đây minh họa cách tối ưu hóa một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn giữ được chất lượng.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng OptimizeOptions để cấu hình cài đặt tối ưu hóa.
- Thêm tệp PDF đầu vào và đặt vị trí đầu ra cho tệp được tối ưu hóa.
- Chạy phương thức Process để thực hiện tối ưu hóa.
1
2var optimizer = new Optimizer();
3var optimizeOptions = new OptimizeOptions();
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(optimizeOptions);
Thay đổi kích thước tài liệu PDF
Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng ResizeOptions để xác định kích thước trang.
- Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
- Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
- Gọi phương thức Process để áp dụng các thay đổi.
1
2var optimizer = new Optimizer();
3var resizeOptions = new ResizeOptions();
4resizeOptions.AddInput(new FileDataSource("input.pdf"));
5resizeOptions.SetPageSize(PageSize.A4);
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(resizeOptions);
Xoay các trang PDF
Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong một tệp PDF.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng RotateOptions và cấu hình góc xoay.
- Thêm tệp PDF đầu vào và xác định vị trí tệp đầu ra.
- Đặt góc xoay (ví dụ: 90 độ) bằng cách sử dụng phương thức SetRotation.
- Thực hiện việc xoay bằng phương thức Process.
1
2var optimizer = new Optimizer();
3var rotateOptions = new RotateOptions();
4rotateOptions.AddInput(new FileDataSource("input.pdf"));
5rotateOptions.SetRotation(90);
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(rotateOptions);
Cắt tài liệu PDF
Cắt bỏ nội dung hoặc các lề không mong muốn khỏi tài liệu PDF. Lớp CropOptions có thể được sử dụng để xác định khu vực cắt.
- Tạo một thể hiện của lớp Optimizer.
- Định nghĩa khu vực cắt bằng đối tượng CropOptions.
- Thêm tệp đầu vào và xác định vị trí tệp đầu ra.
- Sử dụng phương thức SetCropBox để xác định khu vực cắt.
- Thực hiện việc cắt bằng phương thức Process.
1
2var optimizer = new Optimizer();
3var cropOptions = new CropOptions();
4cropOptions.AddInput(new FileDataSource("input.pdf"));
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // Định nghĩa khu vực cắt
6cropOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(cropOptions);
Trích Xuất Văn Bản PDF
Documentize PDF Text Extractor for .NET đơn giản hóa quá trình trích xuất văn bản từ tài liệu PDF. Cho dù bạn cần văn bản thuần túy, thô, hay văn bản đơn giản, plugin này cho phép bạn trích xuất văn bản một cách hiệu quả trong khi giữ nguyên định dạng hoặc bỏ qua nó theo nhu cầu của bạn.
Các Tính Năng Chính:
- Chế Độ Thuần Túy: Trích xuất văn bản trong khi giữ nguyên định dạng ban đầu của nó.
- Chế Độ Thô: Trích xuất văn bản mà không có bất kỳ định dạng nào.
- Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng.
- Xử Lý Theo Lô: Trích xuất văn bản từ nhiều PDF cùng một lúc.
Cách Trích Xuất Văn Bản từ Tài Liệu PDF
Để trích xuất văn bản từ tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
TextExtractor
. - Tạo một thể hiện của
TextExtractorOptions
để cấu hình các tùy chọn trích xuất. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chạy phương thức
Process
để trích xuất văn bản. - Truy cập văn bản đã trích xuất bằng
ResultContainer.ResultCollection
.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Xử lý trích xuất văn bản
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// In văn bản đã trích xuất
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
Trích Xuất Văn Bản từ Nhiều PDF
Plugin cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc, đảm bảo xử lý nhanh chóng và hiệu quả.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// Xử lý trích xuất
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xuất văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Các Chế Độ Trích Xuất Văn Bản
Plugin TextExtractor cung cấp ba chế độ trích xuất, mang lại tính linh hoạt dựa trên nhu cầu của bạn.
- Chế Độ Thuần Túy: Giữ nguyên định dạng ban đầu, bao gồm khoảng trắng và căn chỉnh.
- Chế Độ Thô: Trích xuất văn bản mà không có định dạng, hữu ích cho việc xử lý dữ liệu thô.
- Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng bổ sung.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Đặt chế độ thành Chế độ Thuần Túy
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"))
6
7// Xử lý và xuất
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
Cách Xử Lý Xử Lý Theo Lô
Đối với các bộ tài liệu lớn, bạn có thể tận dụng xử lý theo lô, cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// Định nghĩa đầu ra cho mỗi tệp
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xử lý văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Trình Chuyển Đổi PDF sang DOC
Trình Chuyển Đổi PDF sang DOC cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC hoặc DOCX. Plugin này chuyển đổi các trang PDF thành tài liệu Word Microsoft có thể chỉnh sửa một cách liền mạch, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng khác nhau.
Tính Năng Chính:
- Chuyển Đổi DOC/DOCX: Chuyển đổi tài liệu PDF thành định dạng Word Microsoft có thể chỉnh sửa (DOC hoặc DOCX).
- Giữ Nguyên Định Dạng: Giữ nguyên bố cục, văn bản và định dạng ban đầu trong quá trình chuyển đổi.
- Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc.
- Tùy Chọn Chuyển Đổi Tùy Chỉnh: Tinh chỉnh quá trình chuyển đổi với các chế độ khác nhau, như Enhanced Flow, để có bố cục tốt hơn.
Cách Chuyển Đổi PDF sang DOC/DOCX
Để chuyển đổi một tài liệu PDF sang định dạng DOC/DOCX, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfDoc
. - Tạo một thể hiện của
PdfToDocOptions
để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm đường dẫn tệp đầu ra cho tệp DOC/DOCX kết quả bằng phương thức
AddOutput
. - Chạy phương thức
Process
để thực hiện chuyển đổi.
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX, // Định dạng đầu ra là DOCX
6 ConversionMode = ConversionMode.EnhancedFlow // Tối ưu hóa bố cục và định dạng
7};
8
9// Thêm tệp PDF đầu vào
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Thêm đường dẫn tài liệu Word đầu ra
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
14
15// Thực hiện quá trình chuyển đổi
16pdfToWord.Process(options);
Chuyển Đổi PDF sang DOC với Tùy Chọn Tùy Chỉnh
Plugin Trình Chuyển Đổi PDF sang DOC cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.Doc, // Định dạng đầu ra là DOC
6 ConversionMode = ConversionMode.Precise // Giữ nguyên bố cục PDF gốc càng gần càng tốt
7};
8
9// Thêm tệp PDF đầu vào
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Thêm đường dẫn tài liệu Word đầu ra
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
14
15// Thực hiện quá trình chuyển đổi
16pdfToWord.Process(options);
Xử Lý Theo Lô Chuyển Đổi PDF sang DOC/DOCX
Plugin Trình Chuyển Đổi PDF sang DOC hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi nhiều tệp PDF cùng một lúc. Dưới đây là một ví dụ về chuyển đổi theo lô:
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX
6};
7
8// Thêm nhiều tệp PDF đầu vào
9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// Thêm đường dẫn tệp đầu ra cho các tệp DOCX kết quả
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
15
16// Thực hiện quá trình chuyển đổi theo lô
17pdfToWord.Process(options);
Trình Ghép PDF
Trình Ghép PDF Documentize cho .NET là một công cụ đa năng được thiết kế để ghép nhiều tài liệu PDF thành một tập tin duy nhất. Nó đơn giản hóa quá trình hợp nhất các tệp PDF, đảm bảo tài liệu của bạn được ghép một cách hiệu quả và duy trì tính đồng nhất trong nội dung. Plugin này xử lý các nguồn tài nguyên nội bộ như phông chữ và hình ảnh để tối ưu hóa tài liệu đã ghép.
Tính Năng Chính:
- Ghép Nhiều PDF: Dễ dàng kết hợp nhiều tệp PDF thành một.
- Tối Ưu Hóa Tài Nguyên: Xóa bỏ phông chữ và hình ảnh trùng lặp trong quá trình ghép.
- Xử Lý Lô: Ghép các lô tài liệu PDF lớn trong một lần.
- Ghép An Toàn: Đảm bảo tính toàn vẹn của tài liệu mà không mất dữ liệu hoặc gây hư hỏng nội dung.
Cách Ghép Tài Liệu PDF
Để ghép nhiều tài liệu PDF thành một tập tin duy nhất, làm theo các bước sau:
- Tạo một thể hiện của lớp
Merger
. - Tạo một thể hiện của
MergeOptions
để cấu hình quá trình ghép. - Thêm các tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình ghép bằng phương thức
Process
.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Thêm các tệp PDF đầu vào để ghép
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
9
10// Đặt đường dẫn tệp đầu ra
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
12
13// Ghép các PDF
14merger.Process(mergeOptions);
Cách Ghép PDF với Phạm Vi Trang
Bạn cũng có thể ghép các phạm vi trang cụ thể từ các tệp PDF đầu vào bằng cách sử dụng lớp MergeOptions
. Điều này cho phép bạn kết hợp các trang được chọn vào tài liệu đầu ra cuối cùng.
- Tạo một thể hiện của lớp
Merger
. - Cấu hình các phạm vi trang bằng
MergeOptions
. - Thêm các tệp đầu vào với các phạm vi trang đã chỉ định.
- Đặt đường dẫn đầu ra.
- Gọi phương thức
Process
.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Ghép các trang cụ thể từ các PDF đầu vào
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
8
9// Đặt đường dẫn tệp đầu ra
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
11
12// Ghép các PDF
13merger.Process(mergeOptions);
Cách Xử Lý Ghép Lô
Plugin Trình Ghép PDF được tối ưu hóa để xử lý các lô lớn tài liệu PDF. Bằng cách tận dụng tính năng xử lý lô, bạn có thể ghép hàng trăm PDF trong một thao tác duy nhất, đảm bảo quản lý tài liệu hiệu quả và nhanh chóng.
- Tạo một thể hiện của lớp
Merger
. - Thêm tất cả các tệp PDF đầu vào vào lớp
MergeOptions
. - Đặt đường dẫn đầu ra.
- Gọi phương thức
Process
để ghép tất cả các tệp trong lô.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Thêm một lô lớn các PDF để ghép
6for (int i = 1; i <= 100; i++)
7{
8 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
9}
10
11// Đặt đường dẫn tệp đầu ra
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
13
14// Xử lý việc ghép lô
15merger.Process(mergeOptions);
Trình Thêm Dấu Thời Gian PDF
Trình Thêm Dấu Thời Gian PDF Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để thêm dấu thời gian bảo mật vào tài liệu PDF của bạn. Nó nâng cao tính toàn vẹn và xác thực của tài liệu bằng cách cung cấp một tham chiếu thời gian đáng tin cậy, đảm bảo tuân thủ các tiêu chuẩn chữ ký kỹ thuật số.
Tính Năng Nổi Bật:
- Thêm Dấu Thời Gian Bảo Mật: Dễ dàng thêm dấu thời gian bảo mật vào tài liệu PDF của bạn.
- Máy Chủ Dấu Thời Gian Tùy Chỉnh: Sử dụng các URL máy chủ dấu thời gian tùy chỉnh và thông tin xác thực.
- Tự Động Hóa: Tích hợp quy trình thêm dấu thời gian vào các ứng dụng .NET của bạn để tự động hóa công việc.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về chữ ký kỹ thuật số và dấu thời gian.
Cách Thêm Dấu Thời Gian vào Tài Liệu PDF
Để thêm dấu thời gian bảo mật vào một tài liệu PDF, hãy thực hiện theo các bước sau:
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
để cấu hình quy trình thêm dấu thời gian. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quy trình thêm dấu thời gian bằng cách sử dụng phương thức
Process
.
1
2// Khởi tạo plugin Dấu Thời Gian
3var plugin = new Timestamp();
4
5// Cấu hình các tùy chọn thêm dấu thời gian
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Chỉ định tệp PDF đầu ra
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// Thực hiện quy trình thêm dấu thời gian
15plugin.Process(opt);
Cách Sử Dụng Xác Thực Tùy Chỉnh với Máy Chủ Dấu Thời Gian
Bạn có thể cung cấp thông tin xác thực xác thực cơ bản khi kết nối với máy chủ dấu thời gian. Điều này cho phép bạn xác thực với các máy chủ yêu cầu tên người dùng và mật khẩu.
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
, bao gồm serverBasicAuthCredentials
. - Thêm tệp đầu vào và đường dẫn tệp đầu ra.
- Gọi phương thức
Process
.
1
2// Khởi tạo plugin Dấu Thời Gian
3var plugin = new Timestamp();
4
5// Cấu hình các tùy chọn thêm dấu thời gian với xác thực
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Chỉ định tệp PDF đầu ra
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// Thực hiện quy trình thêm dấu thời gian
15plugin.Process(opt);
Xử Lý Các Tệp PFX và Mật Khẩu
Lớp AddTimestampOptions
cho phép bạn sử dụng tệp PFX cho việc ký kỹ thuật số cùng với mật khẩu.
- Luồng hoặc Đường Dẫn Tệp PFX: Bạn có thể cung cấp một luồng hoặc đường dẫn tệp đến tệp PFX.
- Bảo Mật Mật Khẩu: Đảm bảo bạn quản lý mật khẩu cho tệp PFX một cách an toàn.