PDF Converter
Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.
Chuyển đổi PDF sang tài liệu Word với công cụ .NET của Documentize — giữ nguyên định dạng và cấu trúc để dễ dàng chỉnh sửa.
Chuyển PDF sang HTML bằng các công cụ .NET của Documentize—giữ nguyên bố cục và định dạng để đạt kết quả nhất quán, chuyên nghiệp.
Chuyển đổi PDF sang ảnh JPEG với các công cụ .NET của Documentize — trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.
Chuyển đổi PDF sang định dạng PDF/A với công cụ .NET của Documentize — đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.
Chuyển đổi PDF sang hình ảnh PNG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho web và đồ họa.
Chuyển đổi PDF sang ảnh TIFF với công cụ .NET của Documentize — trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.
Chuyển đổi PDF sang Excel với công cụ .NET của Documentize — khai thác bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.
Tiểu mục của PDF Converter
HTML to PDF
The Documentize PDF Converter for .NET cung cấp khả năng mạnh mẽ để chuyển đổi tài liệu giữa định dạng HTML sang PDF, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, trình chuyển đổi thích ứng với các yêu cầu dự án đa dạng.
Chuyển đổi HTML sang PDF
Biến nội dung HTML thành các file PDF chất lượng cao, phù hợp cho việc tạo báo cáo có thể in, lưu trữ nội dung web hoặc tạo định dạng tài liệu có thể chia sẻ.
Để chuyển đổi một tài liệu HTML sang PDF, thực hiện các bước sau:
- Cấu hình tùy chọn: Sử dụng
HtmlToPdfOptions để định nghĩa cài đặt bố cục và phương tiện. - Chỉ định đường dẫn: Đặt đường dẫn file HTML đầu vào và đường dẫn file PDF đầu ra.
- Thực hiện chuyển đổi: Gọi phương thức
Convert của PdfConverter để thực hiện chuyển đổi.
Ví dụ: Chuyển đổi HTML sang PDF
1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);
Các tùy chọn bổ sung cho chuyển đổi HTML sang PDF
Loại phương tiện:
HtmlMediaType.Print: Thích hợp để tạo PDF phù hợp cho việc in ấn.HtmlMediaType.Screen: Dùng khi chuyển đổi nội dung được thiết kế cho hiển thị trên thiết bị kỹ thuật số.
Điều chỉnh bố cục:
PageLayoutOption: Điều chỉnh cách nội dung HTML khớp với bố cục PDF, như ScaleToPageWidth để đảm bảo nội dung mở rộng theo chiều rộng của PDF.IsRenderToSinglePage: Cho phép render toàn bộ nội dung HTML trên một trang PDF duy nhất nếu cần trình bày ngắn gọn.
Trình chuyển đổi này linh hoạt cho nhiều ứng dụng, từ việc tạo báo cáo PDF dựa trên nội dung web đến chuyển đổi các kho lưu trữ tài liệu PDF để truy cập qua web. Để biết cấu hình nâng cao hơn, hãy tham khảo tài liệu đầy đủ của Documentize.
PDF sang DOC
The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC. Thành phần này chuyển đổi các trang PDF một cách mượt mà thành tài liệu Microsoft Word có thể chỉnh sửa, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng.
Cách chuyển PDF sang DOC
Để chuyển đổi tài liệu PDF sang định dạng DOC, thực hiện các bước sau:
- Tạo một thực thể của
PdfToDocOptions để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Thêm đường dẫn tệp đầu ra cho tệp kết quả bằng phương thức
AddOutput. - Chạy phương thức
Convert để thực hiện chuyển đổi.
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Perform the process
8PdfConverter.Convert(options);
Chuyển PDF sang DOC với tùy chọn tùy chỉnh
Plugin PDF to DOC Converter cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Set Mode
8options.Mode = DocConversionMode.Flow;
9// Perform the process
10PdfConverter.Convert(options);
Tính năng chính:
- Chuyển đổi DOC: Chuyển đổi tài liệu PDF sang định dạng Microsoft Word có thể chỉnh sửa (DOC).
- Giữ nguyên định dạng: Duy trì bố cục, văn bản và định dạng gốc trong quá trình chuyển đổi.
PDF sang HTML
The Documentize PDF Converter for .NET cung cấp các khả năng mạnh mẽ để chuyển đổi tài liệu PDF sang định dạng HTML, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, bộ chuyển đổi có thể thích nghi với các yêu cầu dự án khác nhau.
Chuyển đổi PDF sang HTML
Chuyển các tập tin PDF sang HTML để làm cho tài liệu có thể truy cập qua web hoặc tích hợp vào các ứng dụng nơi định dạng HTML được ưa thích.
- Cấu hình tùy chọn: Sử dụng
PdfToHtmlOptions để tùy chỉnh đầu ra, chọn tài nguyên được nhúng hoặc tách ra. - Xác định đường dẫn đầu vào và đầu ra: Đặt đường dẫn cho PDF đầu vào và HTML đầu ra.
- Thực thi quá trình chuyển đổi: Gọi phương thức
Convert của PdfConverter để thực hiện chuyển đổi.
Example: Convert PDF to HTML with Embedded Resources
1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);
Các tùy chọn có sẵn cho việc chuyển đổi PDF sang HTML
- SaveDataType:
FileWithEmbeddedResources: Tạo một tệp HTML duy nhất với tất cả tài nguyên được nhúng.FileWithExternalResources: Lưu tài nguyên riêng biệt, thích hợp cho các tệp HTML lớn.
PDF sang JPEG
The Documentize PDF Converter for .NET là một công cụ mạnh mẽ giúp đơn giản hoá việc chuyển đổi tài liệu PDF sang ảnh JPEG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn dễ tiếp cận hơn trên các nền tảng bằng cách biến các trang PDF thành các định dạng ảnh được sử dụng rộng rãi.
Cách chuyển đổi các trang PDF sang JPEG
Để chuyển đổi một tài liệu PDF thành các ảnh JPEG, thực hiện các bước sau:
- Tạo một thể hiện của
PdfToJpegOptions để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Đặt đường dẫn thư mục đầu ra cho các ảnh JPEG bằng phương thức
AddOutput. - Gọi phương thức
Convert để chuyển đổi các trang PDF thành ảnh JPEG.
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
Tùy chỉnh chuyển đổi PDF sang JPEG
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, chọn phạm vi trang, hoặc thiết lập chất lượng ảnh. Dưới đây là cách chuyển trang đầu tiên của PDF với độ phân giải 200 DPI:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Process only the first page
4options.PageList = [1];
5// Set output resolution to 200 DPI
6options.OutputResolution = 200;
7// Set output quality to 50
8options.Quality = 50;
9// Add input File path
10options.AddInput(new FileData("path_to_input.pdf"));
11// Set output Directory path
12options.AddOutput(new DirectoryData("path_to_output_directory"));
13// Perform the process
14PdfConverter.Convert(options);
Cách lấy kết quả mà không cần thư mục, hoặc dưới dạng luồng
Phương thức Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng của các tệp JPEG đã chuyển đổi như sau:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
Các tính năng chính:
- Chuyển đổi PDF sang JPEG: Dễ dàng chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh JPEG.
- Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
- Chọn trang: Lựa chọn các trang cụ thể để chuyển đổi.
- Chuyển đổi nhanh: Quá trình nhanh chóng và hiệu quả với ít công sức.
PDF sang PDF/A
The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo nội dung của bạn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Thành phần này cũng hỗ trợ kiểm tra tính tuân thủ PDF/A của các tài liệu PDF hiện có, cung cấp cả tính năng chuyển đổi và xác thực trong một giải pháp duy nhất.
Cách chuyển đổi PDF sang PDF/A
Để chuyển đổi một tài liệu PDF sang định dạng PDF/A, thực hiện các bước sau:
- Tạo một thể hiện của
PdfToPdfAOptions để cấu hình việc chuyển đổi. - Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
- Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Thêm tệp đầu ra cho PDF/A được tạo bằng phương thức
AddOutput. - Gọi phương thức
Convert để thực hiện chuyển đổi.
1// Create the options class to set up the conversion process
2var options = new PdfToPdfAOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Add the source file
8options.AddInput(new FileData("path_to_your_pdf_file.pdf")); // replace with your actual file path
9
10// Add the path to save the converted file
11options.AddOutput(new FileData("path_to_the_converted_file.pdf"));
12
13// Run the conversion
14PdfConverter.Convert(options);
Xác thực tính tuân thủ PDF/A
Bạn có thể xác thực các tệp PDF hiện có để kiểm tra tính tuân thủ PDF/A bằng lớp PdfAValidateOptions.
1// Create the options class to set up the validation process
2var options = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Add one or more files to be validated
8options.AddInput(new FileData("path_to_your_first_pdf_file.pdf")); // replace with your actual file path
9options.AddInput(new FileData("path_to_your_second_pdf_file.pdf"));
10// add more files as needed
11
12// Run the validation and get results
13var resultContainer = PdfConverter.Validate(options);
14
15// Check the resultContainer.ResultCollection property for validation results for each file:
16foreach (var result in resultContainer.ResultCollection)
17{
18 var validationResult = (PdfAValidationResult) result.Data;
19 var isValid = validationResult.IsValid; // Validation result for document
20}
Các tính năng chính:
- Chuyển đổi sang PDF/A: Biến đổi các tệp PDF thành định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) một cách liền mạch để đáp ứng các tiêu chuẩn lưu trữ.
- Kiểm tra tính tuân thủ PDF/A: Kiểm tra các tài liệu PDF hiện có xem chúng có phù hợp với tiêu chuẩn PDF/A hay không và xác định các vấn đề nếu không tuân thủ.
- Quy trình làm việc hiệu quả: Tiết kiệm thời gian và công sức với các quá trình chuyển đổi nhanh chóng và đáng tin cậy.
PDF to PNG
The Documentize PDF Converter for .NET là một công cụ tiên tiến cho phép bạn chuyển đổi tài liệu PDF thành hình ảnh PNG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn trở nên đa dạng hơn, dễ tiếp cận hơn và dễ chia sẻ hơn bằng cách biến các trang PDF thành định dạng hình ảnh được hỗ trợ rộng rãi.
Cách chuyển đổi PDF sang PNG
Để chuyển đổi một tài liệu PDF thành các hình ảnh PNG, thực hiện các bước sau:
- Tạo một thể hiện của
PdfToPngOptions để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương pháp
AddInput. - Đặt đường dẫn thư mục đầu ra cho các hình ảnh PNG bằng phương pháp
AddOutput. - Chạy phương pháp
Convert để chuyển các trang PDF thành hình ảnh PNG.
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
Tùy chỉnh chuyển đổi PDF sang PNG
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải và chọn các trang cụ thể. Ví dụ, để chỉ chuyển đổi trang đầu tiên của một PDF ở độ phân giải 200 DPI:
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions()
3// Process only the first page
4options.PageList = [1];
5// Set output resolution to 200 DPI
6options.OutputResolution = 200;
7// Add input File path
8options.AddInput(new FileData("path_to_input.pdf"));
9// Set output Directory path
10options.AddOutput(new DirectoryData("path_to_output_directory"));
11// Perform the process
12PdfConverter.Convert(options);
Xử lý kết quả chuyển đổi
Phương pháp Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng dữ liệu của các tệp PNG đã chuyển đổi như sau:
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
Các tính năng chính:
- Convert PDF to PNG: Nhanh chóng và hiệu quả chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh PNG.
- Customizable Resolution: Đặt DPI mong muốn (ví dụ: 300 DPI) để có đầu ra hình ảnh chất lượng cao.
- Page set: Chọn các trang cụ thể để chuyển đổi.
- Easy Output Management: Chỉ định thư mục đầu ra cho từng tệp PNG đã chuyển đổi.
- Quick Conversion: Nhanh, hiệu quả và cần ít công sức cấu hình.
PDF sang TIFF
Documentize PDF Converter for .NET là công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành ảnh TIFF chất lượng cao. Thành phần này đảm bảo nội dung của bạn có thể truy cập trên nhiều nền tảng khác nhau đồng thời duy trì độ trung thực và tính linh hoạt tuyệt vời.
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, bật xuất đa trang, hoặc chọn các trang cụ thể.
Cách chuyển PDF sang TIFF
Để chuyển đổi tài liệu PDF thành ảnh TIFF, thực hiện các bước sau:
- Tạo một thể hiện của
PdfToTiffOptions để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Chỉ định đường dẫn tệp đầu ra cho các ảnh TIFF bằng phương thức
AddOutput. - Gọi phương thức
Convert để chuyển các trang PDF thành ảnh TIFF.
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);
Tùy chỉnh các trang và DPI khi chuyển PDF sang TIFF
Dưới đây là cách chuyển 2 trang của một PDF ở độ phân giải 400 DPI thành tệp TIFF:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Pages
8options.PageList = [1, 3];
9// Set result image Resolution
10options.OutputResolution = 400;
11// Perform the process
12PdfConverter.Convert(options);
Tạo TIFF đa trang
Plugin hỗ trợ tạo TIFF đa trang, cho phép bạn gộp nhiều trang PDF lại thành một tệp TIFF duy nhất để lưu trữ hoặc in ấn hiệu quả.
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5 // Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Enable Multi-Page TIFF output
8options.MultiPage = true;
9// Perform the process
10PdfConverter.Convert(options);
Tùy chỉnh nén và độ sâu màu khi chuyển PDF sang TIFF
Dưới đây là cách thiết lập nén và độ sâu màu cho tệp TIFF:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Set Compression and ColorDepth
8options.Compression = TiffCompression.RLE;
9options.ColorDepth = TiffColorDepth.Format24bpp;
10// Perform the process
11PdfConverter.Convert(options);
Cách xử lý kết quả chuyển đổi
Phương thức Convert trả về một đối tượng ResultContainer cung cấp chi tiết về kết quả chuyển đổi. Bạn có thể lấy luồng (stream) của các tệp TIFF đã chuyển đổi như sau:
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Perform the process
6var results = PdfConverter.Convert(options);
7// Get stream results
8foreach (var result in results.ResultCollection)
9{
10 var streamResultPage1 = result.ToStream();
11}
Các tính năng chính:
- Chuyển PDF sang TIFF: Dễ dàng chuyển toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh TIFF.
- Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
- TIFF đa trang: Kết hợp nhiều trang PDF thành một tệp TIFF đa trang.
- Chọn trang: Lựa chọn các trang cần chuyển đổi.
- Chuyển đổi nhanh chóng: Quá trình nhanh và hiệu quả với ít công sức.
PDF to XLS
The Documentize PDF Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF sang bảng tính Excel (XLSX/XLS/CSV/XLSM/ODS). Bằng cách tận dụng thành phần này, các nhà phát triển có thể dễ dàng biến dữ liệu PDF tĩnh thành các bảng tính động và có thể chỉnh sửa, đơn giản hoá việc thao tác, phân tích và chia sẻ dữ liệu.
Cách chuyển PDF sang Excel
Để chuyển đổi một tài liệu PDF thành tệp Excel (XLSX), thực hiện các bước sau:
- Cấu hình các cài đặt chuyển đổi bằng lớp
PdfToXlsOptions. - Thêm các tệp PDF đầu vào bằng phương thức
AddInput. - Chỉ định đường dẫn tệp đầu ra bằng phương thức
AddOutput. - Thực thi phương thức
Convert để bắt đầu quá trình chuyển đổi.
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);
Tùy chỉnh quá trình chuyển PDF sang Excel
Lớp PdfToXlsOptions cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển PDF sang tệp XLS và kích hoạt các tùy chọn định dạng nâng cao:
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Specify XLS format
6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
7options.InsertBlankColumnAtFirst = true;
8options.MinimizeTheNumberOfWorksheets = true;
9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);
Các định dạng đầu ra được hỗ trợ
Enum PdfToXlsOptions.ExcelFormat cung cấp một loạt các định dạng đầu ra:
- XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
- XLSM: Định dạng Excel có hỗ trợ macro.
- CSV: Giá trị phân tách bằng dấu phẩy.
- ODS: Bảng tính Open Document.
- XMLSpreadSheet2003: Định dạng tệp Excel 2003 XML (.xls).
Các tính năng chính:
- Tuỳ chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF sang XLSX, XLS, CSV hoặc các định dạng khác.
- Bảo tồn nội dung: Giữ nguyên cấu trúc, bố cục và định dạng gốc.
- Định dạng nâng cao: Chèn cột trống hoặc giảm số lượng bảng tính.
Tiểu mục của PDF Extractor
The Documentize PDF Extractor for .NET simplifies extracting text from PDF documents. Whether you need pure, raw, or plain text, this plugin allows you to extract text efficiently while preserving formatting or omitting it based on your needs.
To extract text from a PDF file, follow these steps:
- Create an instance of
ExtractTextOptions to configure input file path. - Run the
Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input file path
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf");
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```
To extract text from a PDF stream, follow these steps:
- Create an instance of
ExtractTextOptions to configure input stream. - Run the
Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input stream
3var stream = File.OpenRead("path_to_your_pdf_file.pdf");
4var options = new ExtractTextOptions(stream);
5// Perform the process and get the extracted text
6var textExtracted = PdfExtractor.Extract(options);
7```
The ExtractTextOptions offers three extraction modes, providing flexibility based on your needs.
- Pure Mode: Preserves the original formatting, including spaces and alignment.
- Raw Mode: Extracts the text without formatting, useful for raw data processing.
- Flatten Mode: Represent PDF content with positioning text fragments by their coordinates.
1```csharp
2// Create ExtractTextOptions object to set input file path and TextFormattingMode
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure);
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```
1```csharp
2// Perform the process and get the extracted text
3var textExtracted = PdfExtractor.Extract(new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure));
4```
Key Features:
- Pure Mode: Extract text while preserving its original formatting.
- Raw Mode: Extract text without any formatting.
- Flatten Mode: Extract text without special characters or formatting.
Trích xuất hình ảnh
Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ các tài liệu PDF. Nó quét các tệp PDF, xác định các hình ảnh được nhúng và trích xuất chúng đồng thời giữ nguyên chất lượng và định dạng gốc. Công cụ này nâng cao khả năng tiếp cận nội dung hình ảnh và tối ưu hoá quá trình lấy hình ảnh từ PDF.
Cách trích xuất hình ảnh từ PDF
Để trích xuất hình ảnh từ một tệp PDF, thực hiện các bước sau:
- Tạo một thể hiện của lớp
ExtractImagesOptions. - Thêm đường dẫn tệp đầu vào vào tùy chọn bằng phương thức
AddInput. - Đặt đường dẫn thư mục đầu ra cho các hình ảnh bằng phương thức
AddOutput. - Thực hiện quá trình trích xuất hình ảnh bằng plugin.
- Lấy các hình ảnh đã được trích xuất từ bộ chứa kết quả.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();
Trích xuất hình ảnh từ tệp PDF vào Streams mà không cần thư mục
Plugin PdfExtractor hỗ trợ lưu vào streams, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào streams mà không cần tạo thư mục tạm.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Các tính năng chính:
- Trích xuất hình ảnh được nhúng: Nhận diện và trích xuất hình ảnh từ tài liệu PDF.
- Bảo toàn chất lượng hình ảnh: Đảm bảo các hình ảnh đã trích xuất giữ nguyên chất lượng gốc.
- Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất ở định dạng hoặc vị trí mà bạn ưu tiên.
Trích xuất thuộc tính / Siêu dữ liệu
The Documentize PDF Extractor for .NET simplifies extracting Metadata from PDF documents.
Available properties that may interest you: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.
Cách trích xuất siêu dữ liệu từ tệp PDF
The example demonstrates how to Extract Properties (Title, Author, Subject, Keywords, Number of Pages) from PDF file.
To extract metadata from a PDF document, follow these steps:
- Create an instance of
ExtractPropertiesOptions to configure the extraction options and input PDF file. - Run the
Extract method of PdfExtractor to extract the metadata. - Access the extracted properties using the
PdfProperties.
1// Create ExtractPropertiesOptions object to set input file
2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
3// Perform the process and get Properties
4var pdfProperties = PdfExtractor.Extract(options);
5var filename = pdfProperties.FileName;
6var title = pdfProperties.Title;
7var author = pdfProperties.Author;
8var subject = pdfProperties.Subject;
9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;
Cách trích xuất siêu dữ liệu từ luồng PDF
You can open the stream at your own discretion.
1// Create ExtractPropertiesOptions object to set input stream
2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
3var options = new ExtractPropertiesOptions(stream);
4// Perform the process and get Properties
5var pdfProperties = PdfExtractor.Extract(options);
6var title = pdfProperties.Title;
7var author = pdfProperties.Author;
8var subject = pdfProperties.Subject;
9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;
Cách trích xuất siêu dữ liệu từ tệp PDF theo phong cách ngắn gọn nhất
1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));
Tính năng chính:
- Siêu dữ liệu khả dụng: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.
Xuất Dữ Liệu Biểu Mẫu
The Documentize PDF Extractor for .NET plugin provides a seamless way to extract and export data from PDF forms (AcroForms) into other formats like CSV. This dynamic tool simplifies the process of retrieving form field values, allowing for easy data management, transfer, and analysis.
Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang CSV
Để xuất dữ liệu biểu mẫu từ PDF sang CSV, làm theo các bước sau:
- Tạo một thể hiện của lớp
ExtractImagesOptions. - Định nghĩa các tùy chọn xuất bằng lớp
FormExporterValuesToCsvOptions. - Thêm các tệp PDF đầu vào và chỉ định tệp CSV đầu ra.
- Chạy phương thức
Extract để thực hiện việc xuất.
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);
Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang TSV
Sử dụng Tab làm ký tự phân tách.
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions();
3//Set Delimiter
4options.Delimiter = '\t';
5//Add Field Names to result
6options.AddFieldName = true;
7// Add input file path
8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
9// Set output file path
10options.AddOutput(new FileData("path_to_result_csv_file.tsv"));
11// Perform the process
12PdfExtractor.Extract(options);
Các tính năng chính:
- Export Form Data: Extract data from PDF forms (AcroForms) into CSV or other formats.
- Data Filtering: Use predicates to filter specific form fields for export based on criteria like field type or page number.
- Flexible Output: Save exported data for analysis or transfer to spreadsheets, databases, or other document formats.
PDF Manager
Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.
Tách PDF một cách dễ dàng với các công cụ .NET của Documentize — trích xuất các trang, tạo tệp mới và quản lý tài liệu một cách chính xác
Nén các tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager
Thay đổi kích thước trang của tài liệu PDF một cách dễ dàng với Documentize PDF Manager
Tối ưu PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, nâng cao hiệu năng và duy trì chất lượng
Xoay các trang tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager
Tạo các bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.
Cải thiện việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC)
Nâng cao tài liệu PDF của bạn với AI bằng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.
Tiểu mục của PDF Manager
Kết hợp PDF
The Documentize PDF Manager for .NET is a versatile tool designed to merge multiple PDF documents into a single file. It simplifies the consolidation of PDF files, ensuring your documents are merged efficiently and maintaining consistency across content. The component handles internal resources such as fonts and images to optimize the merged document.
How to Merge PDF
To merge multiple PDF documents into a single file, follow these steps:
- Create an instance of
MergeOptions to configure the merging process. - Add input PDF files using the
AddInput method. - Add output PDF file using
AddOutput method. - Execute the merge using the
Merge method of PdfManager class.
1// Create MergeOptions object to set instructions
2var options = new MergeOptions();
3// Add input file paths
4options.AddInput(new FileData("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileData("path_to_your_pdf_file_2.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfManager.Merge(options);
Key Features:
- Merge Multiple PDFs: Easily combine multiple PDF files into one.
- Resource Optimization: Removes duplicate fonts and images during merging.
- Batch Processing: Merge large batches of PDF documents in one go.
Tách PDF
The Documentize PDF Manager for .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình tách các tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất từng trang riêng lẻ hay chia tài liệu thành các phần cụ thể, thành phần này cho phép bạn thực hiện nhanh chóng và với ít nỗ lực.
Cách Tách PDF
Để tách một tài liệu PDF thành các trang riêng lẻ, làm theo các bước sau:
- Tạo một thể hiện của
SplitOptions để cấu hình các tùy chọn tách. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Thêm các tệp đầu ra cho mỗi trang đã tách bằng phương thức
AddOutput. - Chạy phương thức
Split trong lớp PdfManager để thực hiện việc tách tài liệu.
1// Create SplitOptions object to set instructions
2var options = new SplitOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file paths
6options.AddOutput(new FileData("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileData("path_to_result_pdf_file_2.pdf"));
8// Perform the process
9PdfManager.Split(options);
Các tính năng chính:
- Split PDF by Page: Break down a PDF document into individual pages.
- Custom Split Options: Configure the splitting process based on your requirements.
- Organized Output: Easily manage the output files for each split page or section.
Nén PDF
Trình Quản lý PDF là một công cụ toàn diện giúp cải thiện các tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Các thao tác này nén các tài liệu PDF, khiến chúng dễ lưu trữ, chia sẻ và xem hơn.
Nén PDF
Nén tài liệu PDF khi có thể bằng cách loại bỏ các tài nguyên trang không sử dụng, hợp nhất các tài nguyên giống nhau và loại bỏ các đối tượng thừa.
- Tạo một đối tượng
CompressOptions để cấu hình các thiết lập tối ưu hóa. - Thêm tệp đầu vào và chỉ định vị trí tệp đầu ra.
- Sử dụng phương thức
SetCropBox để định nghĩa khu vực cắt. - Chạy phương thức
Compress của PdfManager.
1// Create CompressOptions object to set instructions
2var options = new CompressOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Compress(options);
Các tính năng chính:
- Nén: Loại bỏ các tài nguyên và đối tượng trang không sử dụng khỏi tài liệu.
Thay đổi kích thước trang của PDF
Bạn có thể Resize Pages của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một ResizeOptions, bạn có thể đặt kích thước trang mong muốn và thực hiện quá trình thay đổi kích thước. PDF kết quả sẽ phản ánh các kích thước mới, đảm bảo phù hợp với yêu cầu cụ thể.
Resize PDF
Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.
- Tạo một đối tượng ResizeOptions để định nghĩa kích thước trang.
- Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
- Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
- Gọi phương thức
Resize của PdfManager.
1// Create ResizeOptions object to set instructions
2var options = new ResizeOptions();
3// Set new PageSize
4options.PageSize = PageSize.A3;
5// Add input file path
6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
7// Set output file path
8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
9// Perform the process
10PdfManager.Resize(options);
Các tính năng chính:
- Resizing: Thay đổi kích thước trang thành các kích thước cụ thể
- Available sizes: A0, A1, A2, A3, A4, A4, A5, A6, B5, Letter, Legal, Ledger, 11x17 inches.
Tối ưu PDF
PDF Manager là một công cụ toàn diện giúp cải thiện tài liệu PDF thông qua các kỹ thuật tối ưu hoá tiên tiến. Nó được thiết kế để giúp giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những thao tác này cải thiện chất lượng và khả năng quản lý của các tệp PDF, làm cho chúng dễ lưu trữ, chia sẻ và xem hơn. Tối ưu hoá, hoặc linearization cho Web, đề cập đến quá trình làm cho tệp PDF phù hợp với việc duyệt trực tuyến bằng trình duyệt web.
Tối ưu PDF
Các bước sau minh họa cách tối ưu hoá một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn duy trì chất lượng.
- Tạo một đối tượng
OptimizeOptions để cấu hình các thiết lập tối ưu hoá. - Thêm tệp PDF đầu vào và chỉ định vị trí xuất cho tệp đã được tối ưu hoá.
- Gọi phương thức
Optimize của PdfManager để thực hiện quá trình tối ưu hoá.
1
2// Create OptimizeOptions object to set instructions
3var options = new OptimizeOptions();
4// Add input file path
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfManager.Optimize(options);
Key Features:
- Optimization: Giảm kích thước tệp PDF mà không làm mất chất lượng.
Xoay Trang PDF
Bạn có thể xoay các trang của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một RotateOptions, bạn có thể đặt góc xoay mong muốn và thực thi quá trình. PDF kết quả sẽ phản ánh kích thước mới, đảm bảo phù hợp với các yêu cầu cụ thể.
Xoay PDF
Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong tệp PDF.
- Tạo một đối tượng RotateOptions và cấu hình góc xoay.
- Thêm tệp PDF đầu vào và chỉ định vị trí tệp đầu ra.
- Đặt góc xoay (ví dụ: 90 độ) bằng phương thức SetRotation.
- Gọi phương thức
Rotate của PdfManager.
1// Create RotateOptions object to set instructions
2var options = new RotateOptions();
3// Set new Rotation
4options.Rotation = Rotation.On90;
5// Add input file path
6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
7// Set output file path
8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
9// Perform the process
10PdfManager.Rotate(options);
Các tính năng chính:
- Rotation: Điều chỉnh hướng của các trang PDF.
Thêm Bảng
The Documentize PDF Manager for .NET là một thành phần đa năng được thiết kế để đơn giản hoá việc tích hợp các bảng vào tài liệu PDF. Cho dù bạn đang sắp xếp dữ liệu, thiết kế biểu mẫu, hay cải thiện khả năng đọc tài liệu, thành phần này làm cho quy trình trở nên dễ dàng hơn đồng thời giữ độ chính xác và hiệu suất.
Tạo PDF với Bảng
Thực hiện các bước sau để tạo các bảng có cấu trúc trong PDF bằng cách sử dụng lớp TableOptions:
- Cấu hình đối tượng
TableOptions để định nghĩa cấu trúc bảng, nội dung và các tệp đầu vào/đầu ra. - Thêm bảng, hàng và ô vào PDF của bạn.
- Hoàn thiện quá trình tạo bảng bằng phương thức
AddTable.
Ví dụ:
1// Configure table options
2var options = new TableOptions();
3options.InsertPageBefore(1)
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("Name")
7 .AddCell().AddParagraph("Age")
8 .AddRow()
9 .AddCell().AddParagraph("Bob")
10 .AddCell().AddParagraph("12")
11 .AddRow()
12 .AddCell().AddParagraph("Sam")
13 .AddCell().AddParagraph("20")
14 .AddRow()
15 .AddCell().AddParagraph("Sandy")
16 .AddCell().AddParagraph("26")
17 .AddRow()
18 .AddCell().AddParagraph("Tom")
19 .AddCell().AddParagraph("12")
20 .AddRow()
21 .AddCell().AddParagraph("Jim")
22 .AddCell().AddParagraph("27");
23// Add input file path
24options.AddInput(new FileData("path_to_input.pdf"));
25// Set output file path
26options.AddOutput(new FileData("path_to_output.pdf"));
27// Perform the process
28PdfManager.AddTable(options);
Đặt trang cho bảng
Thực hiện các bước sau để tạo bảng trong PDF trước trang 2:
Ví dụ:
1// Configure table options
2var options = new TableOptions();
3options.InsertPageBefore(2) // Add table before page 2
4 .AddTable()
5 .AddRow()
6 .AddCell().AddParagraph("Name")
7 .AddCell().AddParagraph("Age");
8// Add input file path
9options.AddInput(new FileData("path_to_input.pdf"));
10// Set output file path
11options.AddOutput(new FileData("path_to_output.pdf"));
12// Perform the process
13PdfManager.AddTable(options);
Tính Năng Chính:
- Tạo Bảng Động: Tạo các bảng có cấu trúc trong tài liệu PDF một cách dễ dàng.
- Đặt Trang: Chèn bảng vào các vị trí cụ thể trong PDF một cách chính xác.
- Bố Cục Tùy Chỉnh: Điều chỉnh cấu trúc bảng, căn chỉnh ô và kiểu dáng.
Thêm TOC
The Documentize PDF Manager for .NET là một thành phần mạnh mẽ được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC). Thành phần này đơn giản hoá quá trình thêm TOC vào PDF của bạn, giúp tài liệu dễ dàng điều hướng và quản lý hơn.
Cách tạo TOC cho PDF
Để tạo Mục Lục trong một tệp PDF, thực hiện các bước sau:
- Tạo một thể hiện của
TocOptions để cấu hình các thiết lập tạo TOC. - Đặt Tiêu đề bằng thuộc tính
Title. - Thiết kế Các tiêu đề của TOC bằng phương thức
Headings.Add. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Chỉ định tệp PDF đầu ra có TOC bằng phương thức
AddOutput. - Gọi phương thức
AddTableOfContents để tạo TOC.
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Design Headings
6options.Headings.Add(new TocHeading("Introduction", 2));
7options.Headings.Add(new TocHeading("Chapter I", 3));
8options.Headings.Add(new TocHeading("Chapter II", 4));
9options.Headings.Add(new TocHeading("Chapter III", 5));
10// Add input file path
11options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
12// Set output file path
13options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
14// Perform the process
15PdfManager.AddTableOfContents(options);
Tạo bookmark trong TOC cho PDF
Bạn có thể sử dụng thuộc tính GenerateBookmarks để tạo bookmark.
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Generate links in bookmarks
6options.GenerateBookmarks = true;
7// Design Headings
8options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
9options.Headings.Add(new TocHeading("Chapter I", 3, true, 1));
10options.Headings.Add(new TocHeading("Chapter II", 4, true, 1));
11options.Headings.Add(new TocHeading("Example A", 4, true, 2));
12options.Headings.Add(new TocHeading("Example B", 4, true, 2));
13options.Headings.Add(new TocHeading("Example C", 4, true, 2));
14options.Headings.Add(new TocHeading("Example D", 4, true, 2));
15options.Headings.Add(new TocHeading("Chapter III", 5, true, 1));
16// Add input file path
17options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
18// Set output file path
19options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
20// Perform the process
21PdfManager.AddTableOfContents(options);
Cách lấy kết quả dưới dạng Stream
1// Create TocOptions object to set instructions
2var options = new TocOptions();
3// Set the Title
4options.Title = "My Table of Contents";
5// Design Headings
6options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
7// Add input file path
8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
9// Set output stream
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamData(outputStream));
12options.CloseOutputStreams = false;
13// Perform the process
14PdfManager.AddTableOfContents(options);
Tùy chỉnh tiêu đề TOC
Bạn có thể tùy chỉnh tiêu đề Mục Lục bằng cách sửa đổi lớp TocHeading. Ví dụ, bạn có thể sử dụng GenerateNumbering hoặc tự thực hiện. Thuộc tính PageNumber được dùng cho các liên kết trên trang. Ngoài ra bạn cũng có thể sử dụng thuộc tính Level.
1// Create TocOptions object to set instructions
2var heading = new TocHeading();
3heading.Text = "Intro";
4heading.PageNumber = 5;
5heading.GenerateNumbering = true;
6heading.Level = 2;
7var tocOptions = new TocOptions();
8options.Headings.Add(heading);
9// Add input and output files
10tocOptions.AddInput(new FileData("path_to_your_pdf_file.pdf"));
11tocOptions.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
12// Generate the TOC with customized options
13PdfManager.AddTableOfContents(tocOptions);
Các tính năng chính:
- Tạo TOC động: Tạo TOC cho bất kỳ tệp PDF nào với các mục được tạo tự động dựa trên tiêu đề hoặc bookmark.
- Tùy chỉnh: Kiểm soát giao diện và cấu trúc của TOC, bao gồm kiểu, định dạng và mức độ sâu.
- Quy trình làm việc hiệu quả: Giảm thiểu thời gian tạo TOC thủ công, đặc biệt với các tài liệu lớn hoặc phức tạp.
Use ChatGPT
Plugin Documentize PDF Manager for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT vào các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo phản hồi trò chuyện dựa trên tin nhắn đầu vào và lưu kết quả dưới dạng PDF, thích hợp cho việc xây dựng giao diện hội thoại hoặc báo cáo phân tích trực tiếp trong tài liệu PDF.
Tạo phản hồi trò chuyện
Để tạo phản hồi trò chuyện và lưu chúng vào tệp PDF bằng plugin ChatGPT, làm theo các bước sau:
- Tạo một thể hiện của lớp
ChatGptRequestOptions để cấu hình các tùy chọn yêu cầu. - Thêm các tệp PDF đầu vào và đầu ra.
- Đặt khóa API và chỉ định các tham số như số token tối đa và truy vấn cho mô hình ChatGPT.
- Gọi phương thức
CreatePdfByChatGptRequestAsync để tạo phần hoàn chỉnh của cuộc trò chuyện.
1var options = new ChatGptRequestOptions();
2// Set output file path
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4options.ApiKey = "Your API key."; // You need to provide the key to access the API.
5options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
6
7// Add the request messages.
8options.Messages.Add(new Message
9{
10 Content = "You are a helpful assistant.",
11 Role = Role.System
12});
13options.Messages.Add(new Message
14{
15 Content = "What is the biggest pizza diameter ever made?",
16 Role = Role.User
17});
18
19// Process the request.
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.
Thêm tin nhắn Hệ thống và Người dùng
Để tạo một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn người dùng. Những tin nhắn này giúp định hình ngữ cảnh của cuộc trò chuyện.
- Thêm một tin nhắn hệ thống để thiết lập ngữ cảnh cho ChatGPT.
- Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng trong cuộc hội thoại.
1var options = new ChatGptRequestOptions();
2// Set output file path
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4
5// Add the PDF text source.
6// In case of multiple sources, the text from each document will be added to the request message collection
7// as a separate message with the role "user".
8options.AddInput(new FileData("TextSource.pdf"));
9
10options.ApiKey = "Your API key."; // You need to provide the key to access the API.
11options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
12
13// Add the request message.
14// In this case, the system message with Content = "You are a helpful assistant." is added by default.
15// The role of the query message is "user" by default.
16options.Query = "How many letters in the provided text?";
17
18// Process the request.
19var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
20
21var fileResultPath = result.ResultCollection[0].Data;
22var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.
Các tính năng chính:
- Chat Completions: Tạo phản hồi bằng API ChatGPT dựa trên đầu vào tùy chỉnh.
- System & User Messages: Cung cấp cả ngữ cảnh hệ thống và đầu vào người dùng để tạo các cuộc hội thoại động.
- PDF Output: Lưu các phần hoàn chỉnh của trò chuyện vào tệp PDF có cấu trúc để sử dụng tiếp theo.
- Asynchronous Processing: Đảm bảo ứng dụng phản hồi nhanh bằng cách xử lý các phần hoàn chỉnh trò chuyện một cách bất đồng bộ.
Tiểu mục của PDF Security
Mã hoá
The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để nâng cao bảo mật cho tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký số. Nó đảm bảo rằng thông tin nhạy cảm của bạn luôn được giữ bí mật và được bảo vệ khỏi việc truy cập trái phép.
Cách mã hoá một tệp PDF
Để mã hoá một tài liệu PDF, làm theo các bước sau:
- Tạo một thể hiện của
EncryptOptions với mật khẩu người dùng và chủ sở hữu mong muốn. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Thêm tệp PDF đầu ra bằng phương thức
AddOutput. - Thực thi việc mã hoá bằng phương thức
Encrypt của lớp PdfSecurity.
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);
Các tính năng chính:
- Mã hoá tài liệu PDF: Bảo mật các tệp PDF của bạn bằng cách thêm mật khẩu người dùng và chủ sở hữu.
- Tự động hoá: Tích hợp việc mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
- Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.
Giải mã
The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để tăng cường bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký điện tử. Nó đảm bảo thông tin nhạy cảm của bạn luôn được giữ bí mật và bảo vệ khỏi truy cập trái phép.
Cách giải mã PDF
Để giải mã một tài liệu PDF, làm theo các bước sau:
- Tạo một thể hiện của
DecryptionOptions với mật khẩu cần thiết. - Thêm tệp PDF đầu vào bằng phương thức
AddInput. - Thêm tệp PDF đầu ra bằng phương thức
AddOutput. - Thực hiện việc giải mã bằng phương thức
Decrypt của lớp PdfSecurity.
1// Create DecryptOptions object to set instructions
2var options = new DecryptOptions("123456");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Decrypt(options);
Các tính năng chính:
- Giải mã tài liệu PDF: Loại bỏ mã hoá khỏi các file PDF khi cần.
- Tự động hoá: Tích hợp mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
- Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.
Ký
The Documentize PDF Security for .NET component allows users to digitally sign PDF documents. It offers a streamlined process for adding signatures, ensuring authenticity, and securing PDF content. The component supports both visible and invisible signatures and provides options to customize the signature’s position, reason, contact information, and more.
How to Sign PDF Documents
To sign a PDF document using a PFX file, follow these steps:
- Instantiate the
SignOptions class with the PFX file path and password. - Add the input PDF and the output file to the options.
- Run the
Sign method to apply the signature.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Sign(options);
How to Use Stream for PFX File
You can also sign a PDF using a PFX certificate provided as a stream instead of a file path. This allows more flexible handling of certificate storage.
1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
5// Perform the process
6PdfSecurity.Sign(options);
How to Apply Invisible Signatures
To add an invisible signature (one that secures the document without displaying the signature on the document), simply set the Visible property to false.
- Create an instance of
SignOptions. - Set
Visible to false. - Add input and output files.
- Call
Sign to apply the invisible signature.
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4// Configure invisible signature
5signOptions.Visible = false;
6// Perform the process
7PdfSecurity.Sign(options);
You can use extra options during adding signature to a PFX file like Reason, Contact, Location, PageNumber.
- Instantiate the
SignOptions class with the PFX file path and password. - Add the input PDF and the output file to the options.
- Set values for your options.
- Run the
Sign method to apply the signature.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Optional parameters
8options.Reason = "my Reason";
9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// Perform the process
13PdfSecurity.Sign(options);
How to Add a Timestamp to PDF
To add a secure timestamp to a PDF document, follow these steps:
- Create an instance of
AddTimestampOptions to configure the timestamping process. - Add the input PDF file using the
AddInput method. - Set the output file path using
AddOutput. - Execute the timestamping using the
Sign method.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// Add input file path
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfSecurity.Sign(options);
How to Use Custom Authentication with Timestamp Server
You can provide basic authentication credentials when connecting to the timestamp server. This allows you to authenticate with servers that require a username and password.
1// Configure the timestamping options with authentication
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");
Key Features:
- Digitally Sign PDF Documents: Secure your documents with visible or invisible digital signatures.
- PFX Support: Sign PDF files using a PFX certificate.
- Customizable Options: Configure signature settings like reason, location, and contact details.
- Visible and Invisible Signatures: Choose whether the signature is visible on the document.
- Customizable Timestamp Servers: Use custom timestamp server URLs and authentication credentials.