Hướng Dẫn Dành Cho Nhà Phát Triển

PDF Converter

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF sang DOC

Chuyển đổi PDF sang tài liệu Word với công cụ .NET của Documentize — giữ nguyên định dạng và cấu trúc để dễ dàng chỉnh sửa.

PDF sang HTML

Chuyển PDF sang HTML bằng các công cụ .NET của Documentize—giữ nguyên bố cục và định dạng để đạt kết quả nhất quán, chuyên nghiệp.

PDF sang JPEG

Chuyển đổi PDF sang ảnh JPEG với các công cụ .NET của Documentize — trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.

PDF sang PDF/A

Chuyển đổi PDF sang định dạng PDF/A với công cụ .NET của Documentize — đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.

PDF to PNG

Chuyển đổi PDF sang hình ảnh PNG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho web và đồ họa.

PDF sang TIFF

Chuyển đổi PDF sang ảnh TIFF với công cụ .NET của Documentize — trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.

PDF to XLS

Chuyển đổi PDF sang Excel với công cụ .NET của Documentize — khai thác bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.

PDF Extractor

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Trích xuất hình ảnh

Trích xuất hình ảnh một cách dễ dàng từ tài liệu PDF trong các ứng dụng .NET

Trích xuất thuộc tính / Siêu dữ liệu

Trích xuất siêu dữ liệu từ các tệp PDF một cách chính xác với Documentize bằng C#/.NET

Xuất Dữ Liệu Biểu Mẫu

Trích xuất và xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang các định dạng khác như CSV bằng C#/.NET

PDF Manager

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Tách PDF

Tách PDF một cách dễ dàng với các công cụ .NET của Documentize — trích xuất các trang, tạo tệp mới và quản lý tài liệu một cách chính xác

Nén PDF

Nén các tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thay đổi kích thước trang của PDF

Thay đổi kích thước trang của tài liệu PDF một cách dễ dàng với Documentize PDF Manager

Tối ưu PDF

Tối ưu PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, nâng cao hiệu năng và duy trì chất lượng

Xoay Trang PDF

Xoay các trang tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thêm Bảng

Tạo các bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.

Thêm TOC

Cải thiện việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC)

Use ChatGPT

Nâng cao tài liệu PDF của bạn với AI bằng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.

PDF Security

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Giải mã

Giải mã các tệp PDF của bạn bằng công cụ .NET của Documentize để mở tài liệu.

Ký điện tử các tệp PDF bằng các công cụ .NET của Documentize — đảm bảo an ninh, tính xác thực và tuân thủ một cách dễ dàng.

Mẫu PDF

Làm phẳng các trường biểu mẫu

Chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép

Làm phẳng các trường biểu mẫu

Chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép

25 thg 7, 2025

Tiểu mục của Hướng Dẫn Dành Cho Nhà Phát Triển

PDF Converter

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF sang DOC

Chuyển đổi PDF sang tài liệu Word với công cụ .NET của Documentize — giữ nguyên định dạng và cấu trúc để dễ dàng chỉnh sửa.

PDF sang HTML

Chuyển PDF sang HTML bằng các công cụ .NET của Documentize—giữ nguyên bố cục và định dạng để đạt kết quả nhất quán, chuyên nghiệp.

PDF sang JPEG

Chuyển đổi PDF sang ảnh JPEG với các công cụ .NET của Documentize — trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.

PDF sang PDF/A

Chuyển đổi PDF sang định dạng PDF/A với công cụ .NET của Documentize — đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.

PDF to PNG

Chuyển đổi PDF sang hình ảnh PNG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho web và đồ họa.

PDF sang TIFF

Chuyển đổi PDF sang ảnh TIFF với công cụ .NET của Documentize — trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.

PDF to XLS

Chuyển đổi PDF sang Excel với công cụ .NET của Documentize — khai thác bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.

Tiểu mục của PDF Converter

HTML to PDF

The Documentize PDF Converter for .NET cung cấp khả năng mạnh mẽ để chuyển đổi tài liệu giữa định dạng HTML sang PDF, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, trình chuyển đổi thích ứng với các yêu cầu dự án đa dạng.

Chuyển đổi HTML sang PDF

Biến nội dung HTML thành các file PDF chất lượng cao, phù hợp cho việc tạo báo cáo có thể in, lưu trữ nội dung web hoặc tạo định dạng tài liệu có thể chia sẻ. Để chuyển đổi một tài liệu HTML sang PDF, thực hiện các bước sau:

  1. Cấu hình tùy chọn: Sử dụng HtmlToPdfOptions để định nghĩa cài đặt bố cục và phương tiện.
  2. Chỉ định đường dẫn: Đặt đường dẫn file HTML đầu vào và đường dẫn file PDF đầu ra.
  3. Thực hiện chuyển đổi: Gọi phương thức Convert của PdfConverter để thực hiện chuyển đổi.

Ví dụ: Chuyển đổi HTML sang PDF

1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);

Các tùy chọn bổ sung cho chuyển đổi HTML sang PDF

  • Loại phương tiện:

    • HtmlMediaType.Print: Thích hợp để tạo PDF phù hợp cho việc in ấn.
    • HtmlMediaType.Screen: Dùng khi chuyển đổi nội dung được thiết kế cho hiển thị trên thiết bị kỹ thuật số.
  • Điều chỉnh bố cục:

    • PageLayoutOption: Điều chỉnh cách nội dung HTML khớp với bố cục PDF, như ScaleToPageWidth để đảm bảo nội dung mở rộng theo chiều rộng của PDF.
    • IsRenderToSinglePage: Cho phép render toàn bộ nội dung HTML trên một trang PDF duy nhất nếu cần trình bày ngắn gọn.

Trình chuyển đổi này linh hoạt cho nhiều ứng dụng, từ việc tạo báo cáo PDF dựa trên nội dung web đến chuyển đổi các kho lưu trữ tài liệu PDF để truy cập qua web. Để biết cấu hình nâng cao hơn, hãy tham khảo tài liệu đầy đủ của Documentize.

PDF sang DOC

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC. Thành phần này chuyển đổi các trang PDF một cách mượt mà thành tài liệu Microsoft Word có thể chỉnh sửa, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng.

Cách chuyển PDF sang DOC

Để chuyển đổi tài liệu PDF sang định dạng DOC, thực hiện các bước sau:

  1. Tạo một thực thể của PdfToDocOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm đường dẫn tệp đầu ra cho tệp kết quả bằng phương thức AddOutput.
  4. Chạy phương thức Convert để thực hiện chuyển đổi.
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Perform the process
8PdfConverter.Convert(options);

Chuyển PDF sang DOC với tùy chọn tùy chỉnh

Plugin PDF to DOC Converter cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.

 1// Create PdfToDocOptions object to set instructions
 2var options = new PdfToDocOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output file path
 6options.AddOutput(new FileData("path_to_result_file.doc"));
 7// Set Mode
 8options.Mode = DocConversionMode.Flow;
 9// Perform the process
10PdfConverter.Convert(options);

Tính năng chính:

  • Chuyển đổi DOC: Chuyển đổi tài liệu PDF sang định dạng Microsoft Word có thể chỉnh sửa (DOC).
  • Giữ nguyên định dạng: Duy trì bố cục, văn bản và định dạng gốc trong quá trình chuyển đổi.

PDF sang HTML

The Documentize PDF Converter for .NET cung cấp các khả năng mạnh mẽ để chuyển đổi tài liệu PDF sang định dạng HTML, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, bộ chuyển đổi có thể thích nghi với các yêu cầu dự án khác nhau.

Chuyển đổi PDF sang HTML

Chuyển các tập tin PDF sang HTML để làm cho tài liệu có thể truy cập qua web hoặc tích hợp vào các ứng dụng nơi định dạng HTML được ưa thích.

  1. Cấu hình tùy chọn: Sử dụng PdfToHtmlOptions để tùy chỉnh đầu ra, chọn tài nguyên được nhúng hoặc tách ra.
  2. Xác định đường dẫn đầu vào và đầu ra: Đặt đường dẫn cho PDF đầu vào và HTML đầu ra.
  3. Thực thi quá trình chuyển đổi: Gọi phương thức Convert của PdfConverter để thực hiện chuyển đổi.

Example: Convert PDF to HTML with Embedded Resources

1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);

Các tùy chọn có sẵn cho việc chuyển đổi PDF sang HTML

  • SaveDataType:
    • FileWithEmbeddedResources: Tạo một tệp HTML duy nhất với tất cả tài nguyên được nhúng.
    • FileWithExternalResources: Lưu tài nguyên riêng biệt, thích hợp cho các tệp HTML lớn.

PDF sang JPEG

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ giúp đơn giản hoá việc chuyển đổi tài liệu PDF sang ảnh JPEG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn dễ tiếp cận hơn trên các nền tảng bằng cách biến các trang PDF thành các định dạng ảnh được sử dụng rộng rãi.

Cách chuyển đổi các trang PDF sang JPEG

Để chuyển đổi một tài liệu PDF thành các ảnh JPEG, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToJpegOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các ảnh JPEG bằng phương thức AddOutput.
  4. Gọi phương thức Convert để chuyển đổi các trang PDF thành ảnh JPEG.
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh chuyển đổi PDF sang JPEG

Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, chọn phạm vi trang, hoặc thiết lập chất lượng ảnh. Dưới đây là cách chuyển trang đầu tiên của PDF với độ phân giải 200 DPI:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToJpegOptions();
 3// Process only the first page
 4options.PageList = [1];
 5// Set output resolution to 200 DPI
 6options.OutputResolution = 200;
 7// Set output quality to 50
 8options.Quality = 50;
 9// Add input File path
10options.AddInput(new FileData("path_to_input.pdf"));
11// Set output Directory path
12options.AddOutput(new DirectoryData("path_to_output_directory"));
13// Perform the process
14PdfConverter.Convert(options);

Cách lấy kết quả mà không cần thư mục, hoặc dưới dạng luồng

Phương thức Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng của các tệp JPEG đã chuyển đổi như sau:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToJpegOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Chuyển đổi PDF sang JPEG: Dễ dàng chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh JPEG.
  • Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
  • Chọn trang: Lựa chọn các trang cụ thể để chuyển đổi.
  • Chuyển đổi nhanh: Quá trình nhanh chóng và hiệu quả với ít công sức.

PDF sang PDF/A

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo nội dung của bạn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Thành phần này cũng hỗ trợ kiểm tra tính tuân thủ PDF/A của các tài liệu PDF hiện có, cung cấp cả tính năng chuyển đổi và xác thực trong một giải pháp duy nhất.

Cách chuyển đổi PDF sang PDF/A

Để chuyển đổi một tài liệu PDF sang định dạng PDF/A, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToPdfAOptions để cấu hình việc chuyển đổi.
  2. Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Thêm tệp đầu ra cho PDF/A được tạo bằng phương thức AddOutput.
  5. Gọi phương thức Convert để thực hiện chuyển đổi.
 1// Create the options class to set up the conversion process
 2var options = new PdfToPdfAOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Add the source file
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf")); // replace with your actual file path
 9
10// Add the path to save the converted file
11options.AddOutput(new FileData("path_to_the_converted_file.pdf"));
12
13// Run the conversion
14PdfConverter.Convert(options);

Xác thực tính tuân thủ PDF/A

Bạn có thể xác thực các tệp PDF hiện có để kiểm tra tính tuân thủ PDF/A bằng lớp PdfAValidateOptions.

 1// Create the options class to set up the validation process
 2var options = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// Add one or more files to be validated
 8options.AddInput(new FileData("path_to_your_first_pdf_file.pdf")); // replace with your actual file path
 9options.AddInput(new FileData("path_to_your_second_pdf_file.pdf"));
10// add more files as needed
11
12// Run the validation and get results
13var resultContainer = PdfConverter.Validate(options);
14
15// Check the resultContainer.ResultCollection property for validation results for each file:
16foreach (var result in resultContainer.ResultCollection)
17{
18    var validationResult = (PdfAValidationResult) result.Data;
19    var isValid = validationResult.IsValid; // Validation result for document
20}

Các tính năng chính:

  • Chuyển đổi sang PDF/A: Biến đổi các tệp PDF thành định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) một cách liền mạch để đáp ứng các tiêu chuẩn lưu trữ.
  • Kiểm tra tính tuân thủ PDF/A: Kiểm tra các tài liệu PDF hiện có xem chúng có phù hợp với tiêu chuẩn PDF/A hay không và xác định các vấn đề nếu không tuân thủ.
  • Quy trình làm việc hiệu quả: Tiết kiệm thời gian và công sức với các quá trình chuyển đổi nhanh chóng và đáng tin cậy.

PDF to PNG

The Documentize PDF Converter for .NET là một công cụ tiên tiến cho phép bạn chuyển đổi tài liệu PDF thành hình ảnh PNG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn trở nên đa dạng hơn, dễ tiếp cận hơn và dễ chia sẻ hơn bằng cách biến các trang PDF thành định dạng hình ảnh được hỗ trợ rộng rãi.

Cách chuyển đổi PDF sang PNG

Để chuyển đổi một tài liệu PDF thành các hình ảnh PNG, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToPngOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương pháp AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các hình ảnh PNG bằng phương pháp AddOutput.
  4. Chạy phương pháp Convert để chuyển các trang PDF thành hình ảnh PNG.
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh chuyển đổi PDF sang PNG

Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải và chọn các trang cụ thể. Ví dụ, để chỉ chuyển đổi trang đầu tiên của một PDF ở độ phân giải 200 DPI:

 1// Create PdfToPngOptions object to set instructions
 2var options = new PdfToPngOptions()
 3// Process only the first page
 4options.PageList = [1];
 5// Set output resolution to 200 DPI
 6options.OutputResolution = 200;
 7// Add input File path
 8options.AddInput(new FileData("path_to_input.pdf"));
 9// Set output Directory path
10options.AddOutput(new DirectoryData("path_to_output_directory"));
11// Perform the process
12PdfConverter.Convert(options);

Xử lý kết quả chuyển đổi

Phương pháp Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng dữ liệu của các tệp PNG đã chuyển đổi như sau:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToPngOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Convert PDF to PNG: Nhanh chóng và hiệu quả chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh PNG.
  • Customizable Resolution: Đặt DPI mong muốn (ví dụ: 300 DPI) để có đầu ra hình ảnh chất lượng cao.
  • Page set: Chọn các trang cụ thể để chuyển đổi.
  • Easy Output Management: Chỉ định thư mục đầu ra cho từng tệp PNG đã chuyển đổi.
  • Quick Conversion: Nhanh, hiệu quả và cần ít công sức cấu hình.

PDF sang TIFF

Documentize PDF Converter for .NET là công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành ảnh TIFF chất lượng cao. Thành phần này đảm bảo nội dung của bạn có thể truy cập trên nhiều nền tảng khác nhau đồng thời duy trì độ trung thực và tính linh hoạt tuyệt vời.
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, bật xuất đa trang, hoặc chọn các trang cụ thể.

Cách chuyển PDF sang TIFF

Để chuyển đổi tài liệu PDF thành ảnh TIFF, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToTiffOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Chỉ định đường dẫn tệp đầu ra cho các ảnh TIFF bằng phương thức AddOutput.
  4. Gọi phương thức Convert để chuyển các trang PDF thành ảnh TIFF.
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh các trang và DPI khi chuyển PDF sang TIFF

Dưới đây là cách chuyển 2 trang của một PDF ở độ phân giải 400 DPI thành tệp TIFF:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Set Pages
 8options.PageList = [1, 3];
 9// Set result image Resolution
10options.OutputResolution = 400;
11// Perform the process
12PdfConverter.Convert(options);

Tạo TIFF đa trang

Plugin hỗ trợ tạo TIFF đa trang, cho phép bạn gộp nhiều trang PDF lại thành một tệp TIFF duy nhất để lưu trữ hoặc in ấn hiệu quả.

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5 // Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Enable Multi-Page TIFF output
 8options.MultiPage = true;
 9// Perform the process
10PdfConverter.Convert(options);

Tùy chỉnh nén và độ sâu màu khi chuyển PDF sang TIFF

Dưới đây là cách thiết lập nén và độ sâu màu cho tệp TIFF:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Set Compression and ColorDepth
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// Perform the process
11PdfConverter.Convert(options);

Cách xử lý kết quả chuyển đổi

Phương thức Convert trả về một đối tượng ResultContainer cung cấp chi tiết về kết quả chuyển đổi. Bạn có thể lấy luồng (stream) của các tệp TIFF đã chuyển đổi như sau:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Chuyển PDF sang TIFF: Dễ dàng chuyển toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh TIFF.
  • Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
  • TIFF đa trang: Kết hợp nhiều trang PDF thành một tệp TIFF đa trang.
  • Chọn trang: Lựa chọn các trang cần chuyển đổi.
  • Chuyển đổi nhanh chóng: Quá trình nhanh và hiệu quả với ít công sức.

PDF to XLS

The Documentize PDF Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF sang bảng tính Excel (XLSX/XLS/CSV/XLSM/ODS). Bằng cách tận dụng thành phần này, các nhà phát triển có thể dễ dàng biến dữ liệu PDF tĩnh thành các bảng tính động và có thể chỉnh sửa, đơn giản hoá việc thao tác, phân tích và chia sẻ dữ liệu.

Cách chuyển PDF sang Excel

Để chuyển đổi một tài liệu PDF thành tệp Excel (XLSX), thực hiện các bước sau:

  1. Cấu hình các cài đặt chuyển đổi bằng lớp PdfToXlsOptions.
  2. Thêm các tệp PDF đầu vào bằng phương thức AddInput.
  3. Chỉ định đường dẫn tệp đầu ra bằng phương thức AddOutput.
  4. Thực thi phương thức Convert để bắt đầu quá trình chuyển đổi.
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh quá trình chuyển PDF sang Excel

Lớp PdfToXlsOptions cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển PDF sang tệp XLS và kích hoạt các tùy chọn định dạng nâng cao:

 1// Create PdfToXlsOptions object to set instructions
 2var options = new PdfToXlsOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Specify XLS format
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);

Các định dạng đầu ra được hỗ trợ

Enum PdfToXlsOptions.ExcelFormat cung cấp một loạt các định dạng đầu ra:

  • XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
  • XLSM: Định dạng Excel có hỗ trợ macro.
  • CSV: Giá trị phân tách bằng dấu phẩy.
  • ODS: Bảng tính Open Document.
  • XMLSpreadSheet2003: Định dạng tệp Excel 2003 XML (.xls).

Các tính năng chính:

  • Tuỳ chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF sang XLSX, XLS, CSV hoặc các định dạng khác.
  • Bảo tồn nội dung: Giữ nguyên cấu trúc, bố cục và định dạng gốc.
  • Định dạng nâng cao: Chèn cột trống hoặc giảm số lượng bảng tính.

PDF Extractor

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Trích xuất hình ảnh

Trích xuất hình ảnh một cách dễ dàng từ tài liệu PDF trong các ứng dụng .NET

Trích xuất thuộc tính / Siêu dữ liệu

Trích xuất siêu dữ liệu từ các tệp PDF một cách chính xác với Documentize bằng C#/.NET

Xuất Dữ Liệu Biểu Mẫu

Trích xuất và xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang các định dạng khác như CSV bằng C#/.NET

Tiểu mục của PDF Extractor

Extract Text

The Documentize PDF Extractor for .NET simplifies extracting text from PDF documents. Whether you need pure, raw, or plain text, this plugin allows you to extract text efficiently while preserving formatting or omitting it based on your needs.

How to Extract Text from PDF file

To extract text from a PDF file, follow these steps:

  1. Create an instance of ExtractTextOptions to configure input file path.
  2. Run the Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input file path
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf");
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```

How to Extract Text from PDF stream

To extract text from a PDF stream, follow these steps:

  1. Create an instance of ExtractTextOptions to configure input stream.
  2. Run the Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input stream
3var stream = File.OpenRead("path_to_your_pdf_file.pdf");
4var options = new ExtractTextOptions(stream);
5// Perform the process and get the extracted text
6var textExtracted = PdfExtractor.Extract(options);
7```

Text Extraction Modes

The ExtractTextOptions offers three extraction modes, providing flexibility based on your needs.

  1. Pure Mode: Preserves the original formatting, including spaces and alignment.
  2. Raw Mode: Extracts the text without formatting, useful for raw data processing.
  3. Flatten Mode: Represent PDF content with positioning text fragments by their coordinates.
1```csharp
2// Create ExtractTextOptions object to set input file path and TextFormattingMode
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure);
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```

How to Extract Text from PDF file in the shortest possible style

1```csharp
2// Perform the process and get the extracted text
3var textExtracted = PdfExtractor.Extract(new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure));
4```

Key Features:

  • Pure Mode: Extract text while preserving its original formatting.
  • Raw Mode: Extract text without any formatting.
  • Flatten Mode: Extract text without special characters or formatting.

Trích xuất hình ảnh

Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ các tài liệu PDF. Nó quét các tệp PDF, xác định các hình ảnh được nhúng và trích xuất chúng đồng thời giữ nguyên chất lượng và định dạng gốc. Công cụ này nâng cao khả năng tiếp cận nội dung hình ảnh và tối ưu hoá quá trình lấy hình ảnh từ PDF.

Cách trích xuất hình ảnh từ PDF

Để trích xuất hình ảnh từ một tệp PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Thêm đường dẫn tệp đầu vào vào tùy chọn bằng phương thức AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các hình ảnh bằng phương thức AddOutput.
  4. Thực hiện quá trình trích xuất hình ảnh bằng plugin.
  5. Lấy các hình ảnh đã được trích xuất từ bộ chứa kết quả.
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Trích xuất hình ảnh từ tệp PDF vào Streams mà không cần thư mục

Plugin PdfExtractor hỗ trợ lưu vào streams, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào streams mà không cần tạo thư mục tạm.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Các tính năng chính:

  • Trích xuất hình ảnh được nhúng: Nhận diện và trích xuất hình ảnh từ tài liệu PDF.
  • Bảo toàn chất lượng hình ảnh: Đảm bảo các hình ảnh đã trích xuất giữ nguyên chất lượng gốc.
  • Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất ở định dạng hoặc vị trí mà bạn ưu tiên.

Trích xuất thuộc tính / Siêu dữ liệu

The Documentize PDF Extractor for .NET simplifies extracting Metadata from PDF documents. Available properties that may interest you: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.

Cách trích xuất siêu dữ liệu từ tệp PDF

The example demonstrates how to Extract Properties (Title, Author, Subject, Keywords, Number of Pages) from PDF file. To extract metadata from a PDF document, follow these steps:

  1. Create an instance of ExtractPropertiesOptions to configure the extraction options and input PDF file.
  2. Run the Extract method of PdfExtractor to extract the metadata.
  3. Access the extracted properties using the PdfProperties.
 1// Create ExtractPropertiesOptions object to set input file
 2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
 3// Perform the process and get Properties
 4var pdfProperties = PdfExtractor.Extract(options);
 5var filename = pdfProperties.FileName;
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cách trích xuất siêu dữ liệu từ luồng PDF

You can open the stream at your own discretion.

 1// Create ExtractPropertiesOptions object to set input stream
 2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
 3var options = new ExtractPropertiesOptions(stream);
 4// Perform the process and get Properties
 5var pdfProperties = PdfExtractor.Extract(options);
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cách trích xuất siêu dữ liệu từ tệp PDF theo phong cách ngắn gọn nhất

1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Tính năng chính:

  • Siêu dữ liệu khả dụng: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.

Xuất Dữ Liệu Biểu Mẫu

The Documentize PDF Extractor for .NET plugin provides a seamless way to extract and export data from PDF forms (AcroForms) into other formats like CSV. This dynamic tool simplifies the process of retrieving form field values, allowing for easy data management, transfer, and analysis.

Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang CSV

Để xuất dữ liệu biểu mẫu từ PDF sang CSV, làm theo các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Định nghĩa các tùy chọn xuất bằng lớp FormExporterValuesToCsvOptions.
  3. Thêm các tệp PDF đầu vào và chỉ định tệp CSV đầu ra.
  4. Chạy phương thức Extract để thực hiện việc xuất.
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);

Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang TSV

Sử dụng Tab làm ký tự phân tách.

 1// Create ExtractFormDataToDsvOptions object to set instructions
 2var options = new ExtractFormDataToDsvOptions();
 3//Set Delimiter
 4options.Delimiter = '\t';
 5//Add Field Names to result
 6options.AddFieldName = true;
 7// Add input file path
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 9// Set output file path
10options.AddOutput(new FileData("path_to_result_csv_file.tsv"));
11// Perform the process
12PdfExtractor.Extract(options);

Các tính năng chính:

  • Export Form Data: Extract data from PDF forms (AcroForms) into CSV or other formats.
  • Data Filtering: Use predicates to filter specific form fields for export based on criteria like field type or page number.
  • Flexible Output: Save exported data for analysis or transfer to spreadsheets, databases, or other document formats.

PDF Manager

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Tách PDF

Tách PDF một cách dễ dàng với các công cụ .NET của Documentize — trích xuất các trang, tạo tệp mới và quản lý tài liệu một cách chính xác

Nén PDF

Nén các tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thay đổi kích thước trang của PDF

Thay đổi kích thước trang của tài liệu PDF một cách dễ dàng với Documentize PDF Manager

Tối ưu PDF

Tối ưu PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, nâng cao hiệu năng và duy trì chất lượng

Xoay Trang PDF

Xoay các trang tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thêm Bảng

Tạo các bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.

Thêm TOC

Cải thiện việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC)

Use ChatGPT

Nâng cao tài liệu PDF của bạn với AI bằng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.

Tiểu mục của PDF Manager

Kết hợp PDF

The Documentize PDF Manager for .NET is a versatile tool designed to merge multiple PDF documents into a single file. It simplifies the consolidation of PDF files, ensuring your documents are merged efficiently and maintaining consistency across content. The component handles internal resources such as fonts and images to optimize the merged document.

How to Merge PDF

To merge multiple PDF documents into a single file, follow these steps:

  1. Create an instance of MergeOptions to configure the merging process.
  2. Add input PDF files using the AddInput method.
  3. Add output PDF file using AddOutput method.
  4. Execute the merge using the Merge method of PdfManager class.
1// Create MergeOptions object to set instructions
2var options = new MergeOptions();
3// Add input file paths
4options.AddInput(new FileData("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileData("path_to_your_pdf_file_2.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfManager.Merge(options);

Key Features:

  • Merge Multiple PDFs: Easily combine multiple PDF files into one.
  • Resource Optimization: Removes duplicate fonts and images during merging.
  • Batch Processing: Merge large batches of PDF documents in one go.

Tách PDF

The Documentize PDF Manager for .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình tách các tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất từng trang riêng lẻ hay chia tài liệu thành các phần cụ thể, thành phần này cho phép bạn thực hiện nhanh chóng và với ít nỗ lực.

Cách Tách PDF

Để tách một tài liệu PDF thành các trang riêng lẻ, làm theo các bước sau:

  1. Tạo một thể hiện của SplitOptions để cấu hình các tùy chọn tách.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm các tệp đầu ra cho mỗi trang đã tách bằng phương thức AddOutput.
  4. Chạy phương thức Split trong lớp PdfManager để thực hiện việc tách tài liệu.
1// Create SplitOptions object to set instructions
2var options = new SplitOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file paths
6options.AddOutput(new FileData("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileData("path_to_result_pdf_file_2.pdf"));
8// Perform the process
9PdfManager.Split(options);

Các tính năng chính:

  • Split PDF by Page: Break down a PDF document into individual pages.
  • Custom Split Options: Configure the splitting process based on your requirements.
  • Organized Output: Easily manage the output files for each split page or section.

Nén PDF

Trình Quản lý PDF là một công cụ toàn diện giúp cải thiện các tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Các thao tác này nén các tài liệu PDF, khiến chúng dễ lưu trữ, chia sẻ và xem hơn.

Nén PDF

Nén tài liệu PDF khi có thể bằng cách loại bỏ các tài nguyên trang không sử dụng, hợp nhất các tài nguyên giống nhau và loại bỏ các đối tượng thừa.

  1. Tạo một đối tượng CompressOptions để cấu hình các thiết lập tối ưu hóa.
  2. Thêm tệp đầu vào và chỉ định vị trí tệp đầu ra.
  3. Sử dụng phương thức SetCropBox để định nghĩa khu vực cắt.
  4. Chạy phương thức Compress của PdfManager.
1// Create CompressOptions object to set instructions
2var options = new CompressOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Compress(options);

Các tính năng chính:

  • Nén: Loại bỏ các tài nguyên và đối tượng trang không sử dụng khỏi tài liệu.

Thay đổi kích thước trang của PDF

Bạn có thể Resize Pages của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một ResizeOptions, bạn có thể đặt kích thước trang mong muốn và thực hiện quá trình thay đổi kích thước. PDF kết quả sẽ phản ánh các kích thước mới, đảm bảo phù hợp với yêu cầu cụ thể.

Resize PDF

Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.

  1. Tạo một đối tượng ResizeOptions để định nghĩa kích thước trang.
  2. Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
  3. Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
  4. Gọi phương thức Resize của PdfManager.
 1// Create ResizeOptions object to set instructions
 2var options = new ResizeOptions();
 3// Set new PageSize
 4options.PageSize = PageSize.A3;
 5// Add input file path
 6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Resize(options);

Các tính năng chính:

  • Resizing: Thay đổi kích thước trang thành các kích thước cụ thể
  • Available sizes: A0, A1, A2, A3, A4, A4, A5, A6, B5, Letter, Legal, Ledger, 11x17 inches.

Tối ưu PDF

PDF Manager là một công cụ toàn diện giúp cải thiện tài liệu PDF thông qua các kỹ thuật tối ưu hoá tiên tiến. Nó được thiết kế để giúp giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những thao tác này cải thiện chất lượng và khả năng quản lý của các tệp PDF, làm cho chúng dễ lưu trữ, chia sẻ và xem hơn. Tối ưu hoá, hoặc linearization cho Web, đề cập đến quá trình làm cho tệp PDF phù hợp với việc duyệt trực tuyến bằng trình duyệt web.

Tối ưu PDF

Các bước sau minh họa cách tối ưu hoá một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn duy trì chất lượng.

  1. Tạo một đối tượng OptimizeOptions để cấu hình các thiết lập tối ưu hoá.
  2. Thêm tệp PDF đầu vào và chỉ định vị trí xuất cho tệp đã được tối ưu hoá.
  3. Gọi phương thức Optimize của PdfManager để thực hiện quá trình tối ưu hoá.
1  
2// Create OptimizeOptions object to set instructions  
3var options = new OptimizeOptions();  
4// Add input file path  
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));  
6// Set output file path  
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));  
8// Perform the process  
9PdfManager.Optimize(options);  

Key Features:

  • Optimization: Giảm kích thước tệp PDF mà không làm mất chất lượng.

Xoay Trang PDF

Bạn có thể xoay các trang của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một RotateOptions, bạn có thể đặt góc xoay mong muốn và thực thi quá trình. PDF kết quả sẽ phản ánh kích thước mới, đảm bảo phù hợp với các yêu cầu cụ thể.

Xoay PDF

Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong tệp PDF.

  1. Tạo một đối tượng RotateOptions và cấu hình góc xoay.
  2. Thêm tệp PDF đầu vào và chỉ định vị trí tệp đầu ra.
  3. Đặt góc xoay (ví dụ: 90 độ) bằng phương thức SetRotation.
  4. Gọi phương thức Rotate của PdfManager.
 1// Create RotateOptions object to set instructions
 2var options = new RotateOptions();
 3// Set new Rotation
 4options.Rotation = Rotation.On90;
 5// Add input file path
 6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Rotate(options);

Các tính năng chính:

  • Rotation: Điều chỉnh hướng của các trang PDF.

Thêm Bảng

The Documentize PDF Manager for .NET là một thành phần đa năng được thiết kế để đơn giản hoá việc tích hợp các bảng vào tài liệu PDF. Cho dù bạn đang sắp xếp dữ liệu, thiết kế biểu mẫu, hay cải thiện khả năng đọc tài liệu, thành phần này làm cho quy trình trở nên dễ dàng hơn đồng thời giữ độ chính xác và hiệu suất.

Tạo PDF với Bảng

Thực hiện các bước sau để tạo các bảng có cấu trúc trong PDF bằng cách sử dụng lớp TableOptions:

  1. Cấu hình đối tượng TableOptions để định nghĩa cấu trúc bảng, nội dung và các tệp đầu vào/đầu ra.
  2. Thêm bảng, hàng và ô vào PDF của bạn.
  3. Hoàn thiện quá trình tạo bảng bằng phương thức AddTable.

Ví dụ:

 1// Configure table options
 2var options = new TableOptions();
 3options.InsertPageBefore(1)
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("Name")
 7            .AddCell().AddParagraph("Age")
 8        .AddRow()
 9            .AddCell().AddParagraph("Bob")
10            .AddCell().AddParagraph("12")
11        .AddRow()
12            .AddCell().AddParagraph("Sam")
13            .AddCell().AddParagraph("20")
14        .AddRow()
15            .AddCell().AddParagraph("Sandy")
16            .AddCell().AddParagraph("26")
17        .AddRow()
18            .AddCell().AddParagraph("Tom")
19            .AddCell().AddParagraph("12")
20        .AddRow()
21            .AddCell().AddParagraph("Jim")
22            .AddCell().AddParagraph("27");
23// Add input file path
24options.AddInput(new FileData("path_to_input.pdf"));
25// Set output file path
26options.AddOutput(new FileData("path_to_output.pdf"));
27// Perform the process
28PdfManager.AddTable(options);

Đặt trang cho bảng

Thực hiện các bước sau để tạo bảng trong PDF trước trang 2: Ví dụ:

 1// Configure table options
 2var options = new TableOptions();
 3options.InsertPageBefore(2) // Add table before page 2
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("Name")
 7            .AddCell().AddParagraph("Age");
 8// Add input file path
 9options.AddInput(new FileData("path_to_input.pdf"));
10// Set output file path
11options.AddOutput(new FileData("path_to_output.pdf"));
12// Perform the process
13PdfManager.AddTable(options);

Tính Năng Chính:

  • Tạo Bảng Động: Tạo các bảng có cấu trúc trong tài liệu PDF một cách dễ dàng.
  • Đặt Trang: Chèn bảng vào các vị trí cụ thể trong PDF một cách chính xác.
  • Bố Cục Tùy Chỉnh: Điều chỉnh cấu trúc bảng, căn chỉnh ô và kiểu dáng.

Thêm TOC

The Documentize PDF Manager for .NET là một thành phần mạnh mẽ được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC). Thành phần này đơn giản hoá quá trình thêm TOC vào PDF của bạn, giúp tài liệu dễ dàng điều hướng và quản lý hơn.

Cách tạo TOC cho PDF

Để tạo Mục Lục trong một tệp PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của TocOptions để cấu hình các thiết lập tạo TOC.
  2. Đặt Tiêu đề bằng thuộc tính Title.
  3. Thiết kế Các tiêu đề của TOC bằng phương thức Headings.Add.
  4. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  5. Chỉ định tệp PDF đầu ra có TOC bằng phương thức AddOutput.
  6. Gọi phương thức AddTableOfContents để tạo TOC.
 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Design Headings
 6options.Headings.Add(new TocHeading("Introduction", 2));
 7options.Headings.Add(new TocHeading("Chapter I", 3));
 8options.Headings.Add(new TocHeading("Chapter II", 4));
 9options.Headings.Add(new TocHeading("Chapter III", 5));
10// Add input file path
11options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
12// Set output file path
13options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
14// Perform the process
15PdfManager.AddTableOfContents(options);

Tạo bookmark trong TOC cho PDF

Bạn có thể sử dụng thuộc tính GenerateBookmarks để tạo bookmark.

 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Generate links in bookmarks
 6options.GenerateBookmarks = true;
 7// Design Headings
 8options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 9options.Headings.Add(new TocHeading("Chapter I", 3, true, 1));
10options.Headings.Add(new TocHeading("Chapter II", 4, true, 1));
11options.Headings.Add(new TocHeading("Example A", 4, true, 2));
12options.Headings.Add(new TocHeading("Example B", 4, true, 2));
13options.Headings.Add(new TocHeading("Example C", 4, true, 2));
14options.Headings.Add(new TocHeading("Example D", 4, true, 2));
15options.Headings.Add(new TocHeading("Chapter III", 5, true, 1));
16// Add input file path
17options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
18// Set output file path
19options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
20// Perform the process
21PdfManager.AddTableOfContents(options);

Cách lấy kết quả dưới dạng Stream

 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Design Headings
 6options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 7// Add input file path
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 9// Set output stream 
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamData(outputStream));
12options.CloseOutputStreams = false;
13// Perform the process
14PdfManager.AddTableOfContents(options);

Tùy chỉnh tiêu đề TOC

Bạn có thể tùy chỉnh tiêu đề Mục Lục bằng cách sửa đổi lớp TocHeading. Ví dụ, bạn có thể sử dụng GenerateNumbering hoặc tự thực hiện. Thuộc tính PageNumber được dùng cho các liên kết trên trang. Ngoài ra bạn cũng có thể sử dụng thuộc tính Level.

 1// Create TocOptions object to set instructions
 2var heading = new TocHeading();
 3heading.Text = "Intro";
 4heading.PageNumber = 5;
 5heading.GenerateNumbering = true;
 6heading.Level = 2;
 7var tocOptions = new TocOptions();
 8options.Headings.Add(heading);
 9// Add input and output files
10tocOptions.AddInput(new FileData("path_to_your_pdf_file.pdf"));
11tocOptions.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
12// Generate the TOC with customized options
13PdfManager.AddTableOfContents(tocOptions);

Các tính năng chính:

  • Tạo TOC động: Tạo TOC cho bất kỳ tệp PDF nào với các mục được tạo tự động dựa trên tiêu đề hoặc bookmark.
  • Tùy chỉnh: Kiểm soát giao diện và cấu trúc của TOC, bao gồm kiểu, định dạng và mức độ sâu.
  • Quy trình làm việc hiệu quả: Giảm thiểu thời gian tạo TOC thủ công, đặc biệt với các tài liệu lớn hoặc phức tạp.

Use ChatGPT

Plugin Documentize PDF Manager for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT vào các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo phản hồi trò chuyện dựa trên tin nhắn đầu vào và lưu kết quả dưới dạng PDF, thích hợp cho việc xây dựng giao diện hội thoại hoặc báo cáo phân tích trực tiếp trong tài liệu PDF.

Tạo phản hồi trò chuyện

Để tạo phản hồi trò chuyện và lưu chúng vào tệp PDF bằng plugin ChatGPT, làm theo các bước sau:

  1. Tạo một thể hiện của lớp ChatGptRequestOptions để cấu hình các tùy chọn yêu cầu.
  2. Thêm các tệp PDF đầu vào và đầu ra.
  3. Đặt khóa API và chỉ định các tham số như số token tối đa và truy vấn cho mô hình ChatGPT.
  4. Gọi phương thức CreatePdfByChatGptRequestAsync để tạo phần hoàn chỉnh của cuộc trò chuyện.
 1var options = new ChatGptRequestOptions();
 2// Set output file path
 3options.AddOutput(new FileData("path_to_result_pdf_file.pdf")); 
 4options.ApiKey = "Your API key."; // You need to provide the key to access the API.
 5options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
 6
 7// Add the request messages.
 8options.Messages.Add(new Message
 9{
10    Content = "You are a helpful assistant.",
11    Role = Role.System
12});
13options.Messages.Add(new Message
14{
15    Content = "What is the biggest pizza diameter ever made?",
16    Role = Role.User
17});
18
19// Process the request.
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.

Thêm tin nhắn Hệ thống và Người dùng

Để tạo một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn người dùng. Những tin nhắn này giúp định hình ngữ cảnh của cuộc trò chuyện.

  1. Thêm một tin nhắn hệ thống để thiết lập ngữ cảnh cho ChatGPT.
  2. Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng trong cuộc hội thoại.
 1var options = new ChatGptRequestOptions();
 2// Set output file path
 3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 4
 5// Add the PDF text source.
 6// In case of multiple sources, the text from each document will be added to the request message collection
 7// as a separate message with the role "user".
 8options.AddInput(new FileData("TextSource.pdf"));
 9
10options.ApiKey = "Your API key."; // You need to provide the key to access the API.
11options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
12
13// Add the request message.
14// In this case, the system message with Content = "You are a helpful assistant." is added by default.
15// The role of the query message is "user" by default.
16options.Query = "How many letters in the provided text?";
17
18// Process the request.
19var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
20
21var fileResultPath = result.ResultCollection[0].Data;
22var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.

Các tính năng chính:

  • Chat Completions: Tạo phản hồi bằng API ChatGPT dựa trên đầu vào tùy chỉnh.
  • System & User Messages: Cung cấp cả ngữ cảnh hệ thống và đầu vào người dùng để tạo các cuộc hội thoại động.
  • PDF Output: Lưu các phần hoàn chỉnh của trò chuyện vào tệp PDF có cấu trúc để sử dụng tiếp theo.
  • Asynchronous Processing: Đảm bảo ứng dụng phản hồi nhanh bằng cách xử lý các phần hoàn chỉnh trò chuyện một cách bất đồng bộ.

PDF Security

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Giải mã

Giải mã các tệp PDF của bạn bằng công cụ .NET của Documentize để mở tài liệu.

Ký điện tử các tệp PDF bằng các công cụ .NET của Documentize — đảm bảo an ninh, tính xác thực và tuân thủ một cách dễ dàng.

Tiểu mục của PDF Security

Mã hoá

The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để nâng cao bảo mật cho tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký số. Nó đảm bảo rằng thông tin nhạy cảm của bạn luôn được giữ bí mật và được bảo vệ khỏi việc truy cập trái phép.

Cách mã hoá một tệp PDF

Để mã hoá một tài liệu PDF, làm theo các bước sau:

  1. Tạo một thể hiện của EncryptOptions với mật khẩu người dùng và chủ sở hữu mong muốn.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng phương thức AddOutput.
  4. Thực thi việc mã hoá bằng phương thức Encrypt của lớp PdfSecurity.
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);

Các tính năng chính:

  • Mã hoá tài liệu PDF: Bảo mật các tệp PDF của bạn bằng cách thêm mật khẩu người dùng và chủ sở hữu.
  • Tự động hoá: Tích hợp việc mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
  • Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.

Giải mã

The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để tăng cường bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký điện tử. Nó đảm bảo thông tin nhạy cảm của bạn luôn được giữ bí mật và bảo vệ khỏi truy cập trái phép.

Cách giải mã PDF

Để giải mã một tài liệu PDF, làm theo các bước sau:

  1. Tạo một thể hiện của DecryptionOptions với mật khẩu cần thiết.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng phương thức AddOutput.
  4. Thực hiện việc giải mã bằng phương thức Decrypt của lớp PdfSecurity.
1// Create DecryptOptions object to set instructions
2var options = new DecryptOptions("123456");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Decrypt(options);

Các tính năng chính:

  • Giải mã tài liệu PDF: Loại bỏ mã hoá khỏi các file PDF khi cần.
  • Tự động hoá: Tích hợp mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
  • Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.

The Documentize PDF Security for .NET component allows users to digitally sign PDF documents. It offers a streamlined process for adding signatures, ensuring authenticity, and securing PDF content. The component supports both visible and invisible signatures and provides options to customize the signature’s position, reason, contact information, and more.

How to Sign PDF Documents

To sign a PDF document using a PFX file, follow these steps:

  1. Instantiate the SignOptions class with the PFX file path and password.
  2. Add the input PDF and the output file to the options.
  3. Run the Sign method to apply the signature.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Sign(options);

How to Use Stream for PFX File

You can also sign a PDF using a PFX certificate provided as a stream instead of a file path. This allows more flexible handling of certificate storage.

1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
5// Perform the process
6PdfSecurity.Sign(options);

How to Apply Invisible Signatures

To add an invisible signature (one that secures the document without displaying the signature on the document), simply set the Visible property to false.

  1. Create an instance of SignOptions.
  2. Set Visible to false.
  3. Add input and output files.
  4. Call Sign to apply the invisible signature.
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4// Configure invisible signature
5signOptions.Visible = false;
6// Perform the process
7PdfSecurity.Sign(options);

How to use extra Options for signature of PDF Documents

You can use extra options during adding signature to a PFX file like Reason, Contact, Location, PageNumber.

  1. Instantiate the SignOptions class with the PFX file path and password.
  2. Add the input PDF and the output file to the options.
  3. Set values for your options.
  4. Run the Sign method to apply the signature.
 1// Create SignOptions object to set instructions
 2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output file path
 6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 7// Optional parameters
 8options.Reason = "my Reason";
 9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// Perform the process
13PdfSecurity.Sign(options);

How to Add a Timestamp to PDF

To add a secure timestamp to a PDF document, follow these steps:

  1. Create an instance of AddTimestampOptions to configure the timestamping process.
  2. Add the input PDF file using the AddInput method.
  3. Set the output file path using AddOutput.
  4. Execute the timestamping using the Sign method.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// Add input file path
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfSecurity.Sign(options);

How to Use Custom Authentication with Timestamp Server

You can provide basic authentication credentials when connecting to the timestamp server. This allows you to authenticate with servers that require a username and password.

1// Configure the timestamping options with authentication
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");

Key Features:

  • Digitally Sign PDF Documents: Secure your documents with visible or invisible digital signatures.
  • PFX Support: Sign PDF files using a PFX certificate.
  • Customizable Options: Configure signature settings like reason, location, and contact details.
  • Visible and Invisible Signatures: Choose whether the signature is visible on the document.
  • Customizable Timestamp Servers: Use custom timestamp server URLs and authentication credentials.

Tiểu mục của Mẫu PDF

Làm phẳng các trường biểu mẫu

The Documentize PDF Form for .NET cho phép bạn chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép. Công cụ này biến các trường biểu mẫu thành nội dung tĩnh, tăng cường bảo mật cho tài liệu PDF của bạn. Nó đặc biệt hữu ích khi bạn cần bảo vệ các hợp đồng, thỏa thuận hoặc bất kỳ tài liệu nào mà các trường biểu mẫu phải được giữ nguyên.

Cách làm phẳng các trường biểu mẫu trong PDF

Để làm phẳng các trường biểu mẫu trong tài liệu PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của lớp FlattenFieldsOptions.
  2. Thêm các tệp đầu vào và đầu ra vào tùy chọn.
  3. Gọi phương thức Flatten để thực hiện thao tác làm phẳng.
1// Create FlattenFieldsOptions object to set instructions
2var options = new FlattenFieldsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfForm.Flatten(options);

Cách lấy tất cả các trường trong PDF

Bạn có thể lấy thông tin về số lượng trường mà tài liệu chứa.

1// Get Fields Names
2var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));

Cách làm phẳng mọi thứ ngoại trừ trường đầu tiên trong PDF

Bạn có thể chọn lọc làm phẳng chỉ các trường biểu mẫu nhất định dựa trên tiêu chí như vị trí hoặc tên của trường.

 1// Get Fields Names
 2var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));
 3 // Create FlattenFieldsOptions object to set instructions
 4var options = new FlattenFieldsOptions();
 5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 7 // Skip 1 field.
 8options.SkipFields.Add(fieldNames[0]);
 9 // Perform the process
10PdfForm.Flatten(options);

Tính năng chính:

  • Flatten All Form Fields: Chuyển đổi các trường biểu mẫu tương tác thành nội dung tĩnh không thể chỉnh sửa.
  • Get Fields Names: Lấy tên các trường trong PDF.
  • Flatten Selected Fields: Tùy chọn làm phẳng các trường nhất định trong PDF trong khi giữ các trường khác có thể chỉnh sửa.
 Tiếng Việt