Làm sạch
Thành phần Documentize PDF Security for .NET cho phép người dùng làm sạch (sanitize) tài liệu PDF. Nó cung cấp một quy trình đơn giản để bỏ các thông tin nhạy cảm hoặc không cần thiết như siêu dữ liệu, tệp đính kèm, chú thích, JavaScripts, biểu mẫu, lớp, chỉ mục tìm kiếm hoặc nội dung riêng tư. Thành phần này cung cấp các tùy chọn để tùy chỉnh những thông tin sẽ bị xóa.
Xóa thông tin
- Siêu dữ liệu
- Tệp đính kèm
- Chú thích
- Java Scripts
- Biểu mẫu
- Lớp
- Chỉ mục tìm kiếm
Cách làm sạch tài liệu PDF
Để làm sạch một tệp PDF, làm theo các bước sau:
- Tạo một đối tượng
SanitizeOptionsvới đường dẫn tệp đầu vào và đường dẫn tệp đầu ra. - Gọi phương thức
Sanitizeđể thực hiện quá trình làm sạch.
1// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và đầu ra
2var options = new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf");
3// Thực hiện quy trình
4PdfSecurity.Sanitize(options);Cách sử dụng Stream cho dữ liệu đầu vào và đầu ra
Bạn cũng có thể thực hiện việc làm sạch bằng cách cung cấp tài liệu PDF dưới dạng stream thay vì chỉ định đường dẫn tệp.
1// Chuẩn bị các stream đầu vào và đầu ra
2using var inputStream = File.OpenRead("path_to_your_pdf_file.pdf");
3using var outputStream = new MemoryStream();
4// Tạo đối tượng SanitizeOptions để thiết lập stream đầu vào và đầu ra
5var options = new SanitizeOptions(inputStream, outputStream);
6// Thực hiện quy trình
7PdfSecurity.Sanitize(options);Cách làm sạch từ tệp tới stream
Bạn có thể đặt các kiểu dữ liệu đầu vào và đầu ra khác nhau.
1// Chuẩn bị stream đầu ra
2using var outputStream = new MemoryStream();
3// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và stream đầu ra
4var options = new SanitizeOptions("path_to_your_pdf_file.pdf", outputStream);
5// Thực hiện quy trình
6PdfSecurity.Sanitize(options);Cách làm sạch từ tệp tới stream bằng thuộc tính
Bạn có thể đặt các kiểu dữ liệu đầu vào và đầu ra bằng cách sử dụng các thuộc tính.
1// Chuẩn bị stream đầu ra
2using var outputStream = new MemoryStream();
3// Tạo đối tượng SanitizeOptions
4var options = new SanitizeOptions();
5// Đặt tệp đầu vào
6options.Input = new FileData("path_to_your_pdf_file.pdf");
7// Đặt stream đầu ra
8options.Output = new StreamData(outputStream);
9// Thực hiện quy trình
10PdfSecurity.Sanitize(options);Làm sạch mà không xóa Siêu dữ liệu
Chỉ cần đặt thuộc tính RemoveMetadata thành false.
1// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và đầu ra
2var options = new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf");
3options.RemoveMetadata = false;
4// Thực hiện quy trình
5PdfSecurity.Sanitize(options);Làm sạch mà không xóa Tệp đính kèm
Chỉ cần đặt thuộc tính RemoveAttachments thành false.
1// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và đầu ra
2var options = new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf");
3options.RemoveAttachments = false;
4// Thực hiện quy trình
5PdfSecurity.Sanitize(options);Làm sạch với việc chuyển đổi tất cả các trang thành hình ảnh và thiết lập DPI kết quả
Ví dụ dưới đây minh họa cách làm sạch PDF bằng cách chuyển đổi tất cả các trang thành hình ảnh và đặt DPI cho kết quả.
Đặt thuộc tính ConvertPagesToImages thành true. Thay đổi ImageDpi nếu cần.
1// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và đầu ra
2var options = new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf");
3// Bật chuyển đổi và đặt DPI
4options.ConvertPagesToImages = true;
5options.ImageDpi = 200;
6// Thực hiện quy trình
7PdfSecurity.Sanitize(options);Làm sạch mà không xóa JavaScripts và Actions
Chỉ cần đặt thuộc tính RemoveJavaScriptsAndActions thành false.
1// Tạo đối tượng SanitizeOptions để thiết lập tệp đầu vào và đầu ra
2var options = new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf");
3options.RemoveJavaScriptsAndActions = false;
4// Thực hiện quy trình
5PdfSecurity.Sanitize(options);Làm sạch tệp PDF theo cách ngắn gọn nhất có thể
1PdfSecurity.Sanitize(new SanitizeOptions("path_to_your_pdf_file.pdf", "path_to_result_pdf_file.pdf"));Các tính năng chính:
- Làm sạch tài liệu PDF: Loại bỏ dữ liệu có thể gây nguy hiểm khỏi tài liệu.
- Tùy chọn có thể cấu hình: Chọn những gì sẽ bị xóa và những gì sẽ được giữ lại.
- Chuyển đổi thành hình ảnh: Chuyển các trang thành hình ảnh, nhưng vẫn giữ ở dạng PDF.