Tổng quan

Documentize là một nền tảng toàn diện cung cấp SDKs để quản lý tài liệu PDF trong các ứng dụng .NET. Những SDK này đơn giản hóa các nhiệm vụ phức tạp liên quan đến việc xử lý PDF, nâng cao quy trình làm việc với tài liệu và làm cho chúng trở nên trực quan hơn và hiệu quả hơn cho người dùng. Dưới đây là cái nhìn tổng quan về các khả năng chính của nó:

Tính năng chính

  • Chuyển đổi PDF:

    • Chuyển đổi PDF sang nhiều định dạng khác nhau như Microsoft Word (DOC/DOCX), Excel (XLS/XLSX), HTML, JPEG và PNG.
    • Hỗ trợ chuyển đổi PDF sang định dạng PDF/A, lý tưởng cho việc lưu trữ lâu dài và tuân thủ các tiêu chuẩn bảo tồn.
  • Xử lý tài liệu:

    • Gộp và Chia PDF: Dễ dàng kết hợp nhiều tệp PDF hoặc chia các tài liệu lớn thành các phần nhỏ hơn, dễ quản lý hơn.
    • Tối ưu hóa PDF: Nén và cải thiện các tài liệu PDF để giảm kích thước tệp mà không làm giảm chất lượng nội dung.
  • Trích xuất văn bản:

    • Trích xuất văn bản một cách chính xác, hỗ trợ cả định dạng dữ liệu có cấu trúc và không có cấu trúc.
  • Chữ ký điện tử:

    • Ký điện tử các tài liệu PDF để đảm bảo tính xác thực và toàn vẹn của chúng, cung cấp sự bảo mật và tin cậy cho các tệp nhạy cảm.

SDKs Chuyên biệt

  • Chuyển đổi PDF sang DOC: Chuyển đổi chính xác nội dung PDF thành các tài liệu Word có thể chỉnh sửa trong khi vẫn giữ nguyên định dạng và bố cục.
  • Chuyển đổi PDF sang Excel: Trích xuất dữ liệu bảng từ PDF và chuyển đổi nó thành bảng tính Excel để phân tích dữ liệu sâu hơn.
  • Tích hợp ChatGPT: Cho phép tương tác với ChatGPT, nhúng các phản hồi AI đối thoại vào trong PDF để cải thiện tài liệu một cách độc đáo.

Sử dụng & Tính tương thích

Các SDK Documentize được xây dựng để tích hợp mượt mà vào các ứng dụng .NET, hỗ trợ nhiều nền tảng bao gồm Windows, macOS, và Linux. Các SDK cung cấp API linh hoạt và mạnh mẽ đáp ứng các yêu cầu xử lý tài liệu đa dạng trong khi vẫn đảm bảo hiệu suất và độ tin cậy cao.

Để biết thêm thông tin chi tiết về các SDK và việc tích hợp chúng vào các dự án của bạn, truy cập vào website chính thức.

Tiểu mục của Tổng quan

Cài đặt

SDK Documentize có thể được cài đặt thông qua nhiều phương pháp, mỗi phương pháp được thiết kế để phù hợp với các môi trường phát triển và sở thích khác nhau. Dưới đây là các cách được khuyến nghị để cài đặt Documentize:

1. NuGet (Phương pháp ưa chuộng)

NuGet là phương pháp đơn giản và được ưa chuộng nhất để cài đặt Documentize, đảm bảo rằng bạn luôn có phiên bản và cập nhật mới nhất ngay trong môi trường phát triển của bạn. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng NuGet.

2. Trình cài đặt MSI

Trình cài đặt MSI là một tùy chọn thuận tiện nếu bạn muốn có các DLL của Documentize được cài đặt trực tiếp lên hệ thống của bạn. Phương pháp này lý tưởng cho các nhà phát triển có thể muốn sử dụng Documentize cho nhiều dự án mà không cần phải quản lý các tệp DLL thủ công. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng MSI.

3. Tệp ZIP

Đối với các nhà phát triển thích cách tiếp cận thủ công, tệp ZIP chứa các DLL của Documentize, có thể được giải nén và thêm vào dự án của bạn trực tiếp. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng ZIP.

25 thg 7, 2025

Tiểu mục của Cài đặt

Yêu Cầu Hệ Thống

Documentize SDKs được thiết kế để tích hợp với các ứng dụng .NET và hỗ trợ nhiều hệ điều hành cùng môi trường phát triển khác nhau. Dưới đây là các yêu cầu hệ thống chính:

Hệ Điều Hành Hỗ Trợ

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 đến Windows Server 2022 (x64, x86)
  • Cloud: Microsoft Azure

macOS

  • macOS 10.12 (Sierra) và các phiên bản mới hơn

Linux

  • Tương thích với nhiều bản phân phối Linux:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Hỗ trợ Android 8.0 (Oreo) và các phiên bản mới hơn.

Môi Trường Phát Triển

  • Microsoft Visual Studio:
    • Visual Studio 2010 và các phiên bản mới hơn (bao gồm 2019 và 2022)
  • Hỗ trợ bất kỳ môi trường phát triển nào nhắm vào các nền tảng .NET.

Các Framework .NET Hỗ Trợ

  • .NET Framework 4.0 và cao hơn
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

Lưu Ý Bổ Sung

  • Adobe Acrobat không cần thiết để chạy Documentize SDKs, nhưng được khuyến nghị để xem PDF.
25 thg 7, 2025

Declaration

Documentize.com SDK yêu cầu một tập quyền Full Trust khi được sử dụng trong các ứng dụng .NET. Mức quyền này là điều cần thiết cho các SDK để thực hiện các thao tác cấp hệ thống nhất định, chẳng hạn như truy cập cài đặt đăng ký, tệp hệ thống và phân tích phông chữ.

Tại sao cần Full Trust

Các SDK của Documentize sử dụng các lớp hệ thống .NET cốt lõi, thường cần quyền cao hơn vì những lý do sau:

  • Truy cập Đăng ký: Một số thao tác có thể yêu cầu đọc hoặc ghi vào đăng ký hệ thống.
  • Tệp Hệ thống: Truy cập vào các tệp hệ thống ngoài thư mục ảo của ứng dụng có thể là cần thiết cho một số nhiệm vụ, chẳng hạn như xử lý phông chữ hoặc thực hiện các thao tác tệp.

Hạn chế của Môi trường Medium Trust

Trong các môi trường lưu trữ áp dụng bảo mật Medium Trust, một số quyền quan trọng bị hạn chế hoặc không có sẵn. Điều này có thể khiến các SDK không hoạt động đúng trong những môi trường như vậy. Các hạn chế sau đây áp dụng theo Medium Trust:

  • OleDbPermission: Không thể sử dụng nhà cung cấp dữ liệu OLE DB quản lý ADO.NET để truy cập cơ sở dữ liệu.
  • EventLogPermission: Cấm truy cập vào Nhật ký Sự kiện Windows.
  • ReflectionPermission: Ngăn cản việc sử dụng phản chiếu, điều này có thể ảnh hưởng đến một số thao tác động.
  • RegistryPermission: Truy cập vào đăng ký hệ thống bị từ chối.
  • WebPermission: Giao tiếp bị hạn chế cho các địa chỉ hoặc phạm vi được định nghĩa trước như đã cấu hình trong phần <trust>.
  • FileIOPermission: Truy cập vào các tệp bị giới hạn trong thư mục ảo của ứng dụng.
25 thg 7, 2025

Môi Trường Không Phải Windows

Documentize SDKs hỗ trợ .NET Standard 2.0, cho phép chúng được sử dụng trong các ứng dụng .NET Core chạy trên Linux hoặc các môi trường không phải Windows khác. Để đảm bảo hiệu suất tối ưu và hiển thị văn bản chính xác, hãy làm theo các bước dưới đây:

Cài Đặt Được Đề Xuất cho Linux

1. Cài Đặt Gói libgdiplus

Gói này cung cấp chức năng GDI+ cần thiết, rất quan trọng cho việc tạo và xử lý PDF. Bạn có thể cài đặt nó bằng cách chạy lệnh sau trong terminal của bạn:

sudo apt-get install libgdiplus

2. Cài Đặt Phông Chữ Tương Thích với Microsoft

Để hiển thị văn bản chính xác, hãy cài đặt phông chữ TrueType của Microsoft bằng cách sử dụng lệnh:

sudo apt-get install ttf-mscorefonts-installer

Các phông chữ này nên được đặt trong thư mục /usr/share/fonts/truetype/msttcorefonts. Nếu hệ thống của bạn lưu trữ phông chữ ở một thư mục khác, hãy cập nhật đường dẫn trong mã của bạn trước khi thực hiện bất kỳ thao tác nào với Documentize SDKs:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<đường dẫn đến phông chữ ms>"));

Mẹo vặt

Bằng cách đảm bảo rằng các cài đặt này đã hoàn tất và cấu hình đường dẫn phông chữ một cách chính xác, bạn có thể tối đa hóa hiệu suất của Documentize SDKs trên Linux hoặc các hệ thống không phải Windows khác.

25 thg 7, 2025

Đánh giá

Bạn có thể dễ dàng tải về các SDK của Documentize cho mục đích đánh giá. Phiên bản đánh giá giống hệt với phiên bản đã mua, với sự khác biệt duy nhất là cách bạn áp dụng giấy phép.

Giới Hạn của Phiên Bản Đánh Giá

Trong khi phiên bản đánh giá cung cấp quyền truy cập đầy đủ vào tất cả các tính năng, nó bao gồm các hạn chế sau đây cho đến khi một giấy phép được áp dụng:

  • Một watermark đánh giá được chèn vào tất cả các tài liệu đầu ra.
  • Chỉ có thể xem hoặc chỉnh sửa bốn trang đầu tiên của bất kỳ tài liệu PDF nào.

Để loại bỏ các hạn chế này và mở khóa phiên bản đầy đủ, chỉ cần áp dụng một giấy phép bằng cách thêm một vài dòng mã vào dự án của bạn.

25 thg 7, 2025

Hướng Dẫn Dành Cho Nhà Phát Triển

Bảo mật PDF

Bảo vệ các tài liệu PDF của bạn với công cụ .NET của Documentize: mã hóa, giải mã và thiết lập quyền một cách dễ dàng để bảo vệ thông tin nhạy cảm.

HTML Converter

Chuyển đổi HTML sang PDF và PDF sang HTML với các công cụ .NET của Documentize—bảo tồn bố cục và định dạng để có kết quả nhất quán, chuyên nghiệp.

PDF Optimizer

Tối ưu hóa PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, cải thiện hiệu suất và duy trì chất lượng

PDF Merger

Hợp nhất các PDF một cách liền mạch với các công cụ .NET của Documentize - kết hợp nhiều tệp thành một trong khi vẫn giữ nguyên chất lượng và cấu trúc.

PDF Table Generator

Tạo bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.

PDF TOC Generator

.NET plugin được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động một Mục lục (TOC)

PDF Signature

Ký số tài liệu PDF với công cụ .NET của Documentize - đảm bảo an ninh, tính xác thực và tuân thủ một cách dễ dàng.

PDF Splitter

Chia tách PDF một cách dễ dàng với công cụ .NET của Documentize—trích xuất trang, tạo tệp mới và quản lý tài liệu với độ chính xác

PDF ChatGPT

Nâng cao PDF của bạn với AI bằng cách sử dụng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.

PDF Image Extractor

Dễ dàng trích xuất hình ảnh từ tài liệu PDF từ bên trong ứng dụng .NET

PDF Text Extractor

Trích xuất văn bản từ PDF một cách chính xác với công cụ .NET của Documentize—lấy, xử lý và phân tích nội dung một cách dễ dàng.

PDF Timestamp Adder

Thêm dấu thời gian vào PDF bằng công cụ .NET của Documentize—tự động chèn ngày và giờ để tăng cường theo dõi tài liệu.

PDF/A Converter

Chuyển đổi PDF thành định dạng PDF/A với công cụ .NET của Documentize—đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.

PDF to XLS Converter

Chuyển đổi PDF sang Excel với công cụ .NET của Documentize - trích xuất bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.

PDF to DOC Converter

Chuyển đổi PDFs sang tài liệu Word với công cụ .NET của Documentize - bảo tồn định dạng và cấu trúc để chỉnh sửa dễ dàng.

PDF to HTML Converter

.NET plugin đơn giản hóa việc chuyển đổi tài liệu PDF sang định dạng HTML

PDF to JPEG Converter

Chuyển đổi PDF thành hình ảnh JPEG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.

PDF to PNG Converter

Chuyển đổi PDF thành hình ảnh PNG với các công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho sử dụng trên web và đồ họa.

PDF to TIFF Converter

Chuyển đổi PDF sang hình ảnh TIFF với công cụ .NET của Documentize—trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.

PDF Form Flattener

Chuyển đổi các mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn khỏi các sửa đổi trái phép

25 thg 7, 2025

Tiểu mục của Hướng Dẫn Dành Cho Nhà Phát Triển

Bảo mật PDF

Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để nâng cao bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp khả năng mã hóa và giải mã. Nó đảm bảo rằng thông tin nhạy cảm của bạn vẫn giữ được tính bí mật và được bảo vệ khỏi sự truy cập trái phép.

Cách Mã Hóa một Tài Liệu PDF

Để mã hóa một tài liệu PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của EncryptionOptions với các mật khẩu người dùng và chủ sở hữu mong muốn.
  2. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng cách sử dụng phương thức AddOutput.
  4. Thực hiện mã hóa bằng cách sử dụng phương thức Process của lớp Security.
1// Tạo đối tượng EncryptionOptions để đặt hướng dẫn
2var options = new EncryptionOptions("123456", "qwerty");
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quy trình
8Security.Process(options);

Cách Giải Mã một Tài Liệu PDF

Để giải mã một tài liệu PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của DecryptionOptions với mật khẩu cần thiết.
  2. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng cách sử dụng phương thức AddOutput.
  4. Thực hiện giải mã bằng cách sử dụng phương thức Process của lớp Security.
1// Tạo đối tượng DecryptionOptions để đặt hướng dẫn
2var options = new DecryptionOptions("123456");
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quy trình
8Security.Process(options);

Tính Năng Nổi Bật:

  • Mã Hóa Tài Liệu PDF: Bảo mật các tệp PDF của bạn bằng cách thêm mật khẩu người dùng và chủ sở hữu.
  • Giải Mã Tài Liệu PDF: Loại bỏ mã hóa khỏi PDF khi cần thiết.
  • Tự Động Hóa: Tích hợp mã hóa và giải mã vào các ứng dụng .NET của bạn để tạo quy trình tự động.
  • Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về bảo mật tài liệu.

HTML Converter

Trình chuyển đổi HTML Documentize cho .NET cung cấp khả năng mạnh mẽ để chuyển đổi tài liệu giữa định dạng PDF và HTML, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn để xử lý tài nguyên và bố cục, trình chuyển đổi thích nghi với các yêu cầu dự án khác nhau.

Chuyển đổi PDF sang HTML

Chuyển đổi các tệp PDF sang HTML để làm cho tài liệu có thể truy cập cho việc xem trên web hoặc tích hợp vào các ứng dụng mà định dạng HTML được ưu tiên.

Chuyển đổi HTML sang PDF

Biến nội dung HTML thành các tệp PDF chất lượng cao, hoàn hảo cho việc tạo báo cáo có thể in, lưu trữ nội dung web, hoặc tạo các định dạng tài liệu có thể chia sẻ.


Chuyển đổi PDF sang HTML

Để chuyển đổi một tệp PDF sang HTML:

  1. Cấu hình Tùy chọn: Sử dụng PdfToHtmlOptions để tùy chỉnh đầu ra, lựa chọn tài nguyên nhúng hoặc bên ngoài.
  2. Xác định Đường dẫn Đầu vào và Đầu ra: Đặt đường dẫn cho PDF đầu vào và HTML đầu ra của bạn.
  3. Thực hiện Chuyển đổi: Gọi phương thức Process của HtmlConverter để chuyển đổi tệp.

Ví dụ: Chuyển PDF sang HTML với Tài nguyên Nhúng

1// Bước 1: Cấu hình tùy chọn cho chuyển đổi PDF sang HTML
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Bước 2: Đặt đường dẫn tệp
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// Bước 3: Chạy quá trình chuyển đổi
9HtmlConverter.Process(options);

Tùy chọn Có sẵn cho Chuyển đổi PDF sang HTML

  • SaveDataType:
    • FileWithEmbeddedResources: Tạo một tệp HTML duy nhất với tất cả tài nguyên được nhúng.
    • FileWithExternalResources: Lưu tài nguyên riêng biệt, lý tưởng cho các tệp HTML lớn.

Chuyển đổi HTML sang PDF

Để chuyển đổi một tài liệu HTML sang PDF, làm theo các bước sau:

  1. Cấu hình Tùy chọn: Sử dụng HtmlToPdfOptions để xác định bố cục và các cài đặt phương tiện.
  2. Chỉ định Đường dẫn: Đặt đường dẫn tệp HTML đầu vào và PDF đầu ra.
  3. Thực hiện Chuyển đổi: Chạy phương thức Process của HtmlConverter để chuyển đổi tệp.

Ví dụ: Chuyển HTML sang PDF

1// Bước 1: Cấu hình tùy chọn cho chuyển đổi HTML sang PDF
2var options = new HtmlToPdfOptions();
3
4// Bước 2: Đặt đường dẫn tệp
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// Bước 3: Chạy quá trình chuyển đổi
9HtmlConverter.Process(options);

Tùy chọn Bổ sung cho Chuyển đổi HTML sang PDF

  • Loại Phương tiện:

    • HtmlMediaType.Print: Lý tưởng để tạo PDF phù hợp cho việc in.
    • HtmlMediaType.Screen: Sử dụng khi chuyển đổi nội dung được thiết kế cho việc xem kỹ thuật số.
  • Điều chỉnh Bố cục:

    • PageLayoutOption: Điều chỉnh cách nội dung HTML phù hợp với bố cục PDF, như ScaleToPageWidth để đảm bảo nội dung được co lại theo chiều rộng của PDF.
    • IsRenderToSinglePage: Cho phép hiển thị toàn bộ nội dung HTML trên một trang PDF duy nhất nếu cần cho các bài trình bày ngắn gọn.

Trình chuyển đổi này đáng chú ý với nhiều ứng dụng khác nhau, từ việc tạo báo cáo PDF dựa trên nội dung web đến việc chuyển đổi kho tàng các tài liệu PDF cho khả năng truy cập trên web. Để biết thêm các cấu hình nâng cao, hãy tham khảo tài liệu đầy đủ của Documentize.

PDF Optimizer

Bộ Tối ưu hóa PDF Documentize là một plugin toàn diện giúp cải thiện tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Nó được thiết kế để giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những thao tác này cải thiện chất lượng và khả năng quản lý của các tệp PDF, giúp chúng dễ dàng lưu trữ, chia sẻ và xem hơn.

Tối ưu hóa PDF

Các bước sau đây cho thấy cách tối ưu hóa một tài liệu PDF bằng cách giảm kích thước tệp trong khi vẫn duy trì chất lượng.

  1. Tạo một đối tượng OptimizeOptions để cấu hình các cài đặt tối ưu hóa.
  2. Thêm tệp PDF đầu vào và đặt vị trí đầu ra cho tệp đã tối ưu hóa.
  3. Chạy phương thức Process của Optimizer để thực hiện tối ưu hóa.
1// Tạo đối tượng OptimizeOptions để đặt hướng dẫn
2var options = new OptimizeOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quá trình
8Optimizer.Process(options);

Xoay PDF

Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong tệp PDF.

  1. Tạo một đối tượng RotateOptions và cấu hình góc xoay.
  2. Thêm tệp PDF đầu vào và chỉ định vị trí tệp đầu ra.
  3. Đặt góc xoay (ví dụ: 90 độ) bằng cách sử dụng phương thức SetRotation.
  4. Chạy phương thức Process của Optimizer.
 1// Tạo đối tượng RotateOptions để đặt hướng dẫn
 2var options = new RotateOptions();
 3// Đặt góc Xoay mới
 4options.Rotation = Rotation.On90;
 5// Thêm đường dẫn tệp đầu vào
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// Đặt đường dẫn tệp đầu ra
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// Thực hiện quá trình
10Optimizer.Process(options);

Thay đổi kích thước PDF

Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.

  1. Tạo một đối tượng ResizeOptions để xác định kích thước trang.
  2. Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
  3. Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
  4. Chạy phương thức Process của Optimizer.
 1// Tạo đối tượng ResizeOptions để đặt hướng dẫn
 2var options = new ResizeOptions();
 3// Đặt Kích thước Trang mới
 4options.PageSize = PageSize.A3;
 5// Thêm đường dẫn tệp đầu vào
 6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
 7// Đặt đường dẫn tệp đầu ra
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
 9// Thực hiện quá trình
10Optimizer.Process(options);

Nén PDF

Nén tài liệu PDF khi có thể bằng cách loại bỏ các tài nguyên trang không sử dụng, gộp các tài sản giống nhau và loại bỏ các đối tượng thừa.

  1. Tạo một đối tượng CompressOptions để cấu hình các cài đặt tối ưu hóa.
  2. Thêm tệp đầu vào và chỉ định vị trí tệp đầu ra.
  3. Sử dụng phương thức SetCropBox để định nghĩa khu vực cắt.
  4. Chạy phương thức Process của Optimizer.
1// Tạo đối tượng CompressOptions để đặt hướng dẫn
2var options = new CompressOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn tệp đầu ra
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Thực hiện quá trình
8Optimizer.Process(options);

Tính năng chính:

  • Tối ưu hóa: Giảm kích thước tệp PDF mà không làm mất chất lượng.
  • Xoay: Điều chỉnh hướng của các trang PDF.
  • Thay đổi kích thước: Thay đổi kích thước các trang theo các kích thước cụ thể (ví dụ: A4, Letter).
  • Nén: Loại bỏ các tài nguyên và đối tượng trang không sử dụng khỏi tài liệu.

PDF Merger

Documentize PDF Merger cho .NET là một công cụ linh hoạt được thiết kế để hợp nhất nhiều tài liệu PDF thành một tệp duy nhất. Nó đơn giản hóa việc hợp nhất các tệp PDF, đảm bảo rằng tài liệu của bạn được hợp nhất một cách hiệu quả và duy trì tính nhất quán trong nội dung. Plugin xử lý các tài nguyên nội bộ như phông chữ và hình ảnh để tối ưu hóa tài liệu đã hợp nhất.

Cách hợp nhất PDF

Để hợp nhất nhiều tài liệu PDF thành một tệp duy nhất, hãy làm theo các bước sau:

  1. Tạo một thể hiện của MergeOptions để cấu hình quá trình hợp nhất.
  2. Thêm các tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng phương thức AddOutput.
  4. Thực hiện hợp nhất bằng cách sử dụng phương thức Process của lớp Merger..
 1  
 2// Tạo đối tượng MergeOptions để thiết lập hướng dẫn  
 3var options = new MergeOptions();  
 4// Thêm các đường dẫn tệp đầu vào  
 5options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));  
 6options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));  
 7// Đặt đường dẫn tệp đầu ra  
 8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));  
 9// Thực hiện quy trình  
10Merger.Process(options);  

Tính năng nổi bật:

  • Hợp nhất nhiều PDF: Dễ dàng kết hợp nhiều tệp PDF thành một.
  • Tối ưu hóa tài nguyên: Xóa phông chữ và hình ảnh trùng lặp trong quá trình hợp nhất.
  • Xử lý theo lô: Hợp nhất các lô tài liệu PDF lớn trong một lần.

PDF Table Generator

Trình tạo bảng Documentize cho .NET là một plugin linh hoạt được thiết kế để đơn giản hóa việc tích hợp các bảng vào tài liệu PDF. Dù bạn đang tổ chức dữ liệu, thiết kế biểu mẫu hay cải thiện khả năng đọc của tài liệu, plugin này giúp quá trình diễn ra một cách dễ dàng mà vẫn đảm bảo độ chính xác và hiệu quả. API trực quan của nó hỗ trợ cả quy trình làm việc của tài liệu đơn lẻ và xử lý theo lô, khiến nó trở thành công cụ thiết yếu cho các nhà phát triển làm việc với dữ liệu có cấu trúc.

Tạo PDF với Các Bảng

Thực hiện theo các bước sau để tạo các bảng có cấu trúc trong một PDF bằng cách sử dụng lớp TableGenerator:

  1. Khởi tạo lớp TableGenerator.
  2. Cấu hình đối tượng TableOptions để xác định cấu trúc bảng, nội dung và tập tin đầu vào/đầu ra.
  3. Thêm bảng, hàng và ô vào PDF của bạn.
  4. Hoàn tất quá trình tạo bảng bằng cách sử dụng phương thức Process.

Dưới đây là một ví dụ:

 1var generator = new TableGenerator();
 2var options = new TableOptions();
 3
 4// Chỉ định các tập tin PDF đầu vào và đầu ra
 5options.AddInput(new FileDataSource("input.pdf"));
 6options.AddOutput(new FileDataSource("output.pdf"));
 7
 8// Xác định một bảng với các hàng và ô
 9options
10    .InsertPageAfter(1) // Thêm bảng sau trang đầu tiên
11    .AddTable()
12        .AddRow()
13            .AddCell().AddParagraph(new TextFragment("Cell 1"))
14            .AddCell().AddParagraph(new TextFragment("Cell 2"))
15            .AddCell().AddParagraph(new TextFragment("Cell 3"));
16
17// Tạo bảng trong tài liệu
18generator.Process(options);

Thêm Nội Dung Đa Dạng vào Các Bảng

Các bảng trong tài liệu PDF có thể bao gồm nhiều loại nội dung khác nhau để nâng cao chức năng và hình thức của chúng. Dưới đây là một ví dụ về việc thêm nội dung HTML vào các ô của bảng:

1options
2    .AddTable()
3        .AddRow()
4            .AddCell().AddParagraph(new HtmlFragment("<h1>Header 1</h1>"))
5            .AddCell().AddParagraph(new HtmlFragment("<h2>Header 2</h2>"))
6            .AddCell().AddParagraph(new HtmlFragment("<h3>Header 3</h3>"));

Các Loại Nội Dung Được Hỗ Trợ trong Các Bảng

Trình tạo bảng PDF hỗ trợ nhiều loại nội dung khác nhau, cho phép các nhà phát triển tùy chỉnh bảng cho nhiều trường hợp sử dụng khác nhau:

  • HtmlFragment: Thêm nội dung dựa trên HTML, chẳng hạn như tiêu đề, danh sách và văn bản định dạng.
  • TeXFragment: Bao gồm nội dung dựa trên LaTeX cho các phương trình toán học và chú thích khoa học.
  • TextFragment: Chèn văn bản đơn giản hoặc định dạng.
  • Image: Nhúng hình ảnh trực tiếp vào các ô bảng.

Tùy Chỉnh Bố Cục và Cấu Trúc Bảng

Plugin cung cấp sự linh hoạt để điều chỉnh cấu trúc bảng, bao gồm chiều cao hàng, chiều rộng cột và căn chỉnh ô. Những tùy chọn tùy chỉnh này cho phép bạn thiết kế các bảng phù hợp với bố cục và phong cách của tài liệu của bạn.

Xử Lý Quá Trình Tạo Bảng

Sau khi thêm tất cả nội dung và tùy chỉnh cấu trúc bảng, hoàn tất quá trình bằng cách gọi phương thức Process. Phương thức này tạo ra các bảng và cập nhật tài liệu PDF. Dưới đây là cách xử lý kết quả:

1var resultContainer = generator.Process(options);
2
3// Xuất số lượng kết quả đã tạo
4Console.WriteLine("Số lượng kết quả: " + resultContainer.ResultCollection.Count);

Các Trường Hợp Sử Dụng cho Trình Tạo Bảng PDF

  1. Báo cáo dữ liệu: Trình bày phân tích, báo cáo tài chính hoặc kết quả khảo sát trong định dạng rõ ràng và có tổ chức.
  2. Thiết kế biểu mẫu: Tạo các biểu mẫu tương tác với bố cục bảng có cấu trúc.
  3. Cải thiện tài liệu: Cải thiện khả năng đọc và sử dụng của hướng dẫn sử dụng, tài liệu chỉ dẫn hoặc tài liệu hướng dẫn.
  4. Xử lý theo lô: Tự động tạo bảng cho nhiều tài liệu PDF.

Tính Năng Chính:

  • Tạo Bảng Động: Dễ dàng tạo bảng có cấu trúc trong tài liệu PDF.
  • Hỗ Trợ Nội Dung Đa Dạng: Làm đầy bảng với văn bản, HTML, hình ảnh và nội dung LaTeX.
  • Đặt Trang: Chèn bảng ở các vị trí cụ thể trong PDF một cách chính xác.
  • Bố Cục Tùy Chỉnh: Điều chỉnh cấu trúc bảng, căn chỉnh ô và kiểu dáng.
  • Xử Lý Theo Lô: Xử lý nhiều tài liệu đồng thời để tối đa hóa hiệu quả.

PDF TOC Generator

Documentize PDF TOC Generator for .NET là một plugin mạnh mẽ được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động một Mục lục (TOC). Plugin này đơn giản hóa quy trình thêm TOC vào PDF của bạn, giúp tài liệu dễ dàng điều hướng và quản lý hơn.

Cách tạo Mục lục cho một PDF

Để tạo một Mục lục trong tệp PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp TocGenerator.
  2. Tạo một thể hiện của TocOptions để cấu hình các cài đặt tạo TOC.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chỉ định tệp PDF đầu ra có TOC bằng phương thức AddOutput.
  5. Gọi phương thức Process để tạo TOC.
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// Thêm tệp đầu vào và đầu ra
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
7
8// Tạo TOC
9tocGenerator.Process(tocOptions);

Tùy chỉnh TOC

Bạn có thể tùy chỉnh Mục lục bằng cách sửa đổi lớp TocOptions. Ví dụ, bạn có thể kiểm soát mức độ sâu cho các mục TOC, thiết lập các tùy chọn định dạng cụ thể và nhiều hơn nữa:

 1var tocOptions = new TocOptions
 2{
 3    Depth = 3,  // Đặt mức độ sâu TOC là 3
 4    FontSize = 12,  // Đặt kích thước phông chữ cho các mục TOC
 5    Title = "Mục lục"  // Tùy chỉnh tiêu đề TOC
 6};
 7
 8// Thêm tệp đầu vào và đầu ra
 9tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
11
12// Tạo TOC với các tùy chọn tùy chỉnh
13tocGenerator.Process(tocOptions);

Cách xử lý kết quả

Sau khi xử lý, phương thức Process trả về một đối tượng ResultContainer chứa thông tin chi tiết về việc tạo TOC. Bạn có thể truy xuất và in chi tiết đầu ra:

1var resultContainer = tocGenerator.Process(tocOptions);
2
3// Truy cập bộ sưu tập kết quả và in đường dẫn tệp đầu ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);

Xử lý hàng loạt cho nhiều PDF

Plugin PDF TOC Generator hỗ trợ xử lý hàng loạt, cho phép bạn thêm TOC vào nhiều tài liệu PDF cùng một lúc.

 1var tocGenerator = new TocGenerator();
 2var tocOptions = new TocOptions();
 3
 4// Thêm nhiều PDF đầu vào
 5tocOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6tocOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Thêm các PDF đầu ra có TOC
 9tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output1_with_toc.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output2_with_toc.pdf"));
11
12// Xử lý việc tạo TOC hàng loạt
13tocGenerator.Process(tocOptions);

Tính năng chính:

  • Tạo TOC động: Tạo TOC cho bất kỳ tệp PDF nào với các mục được tạo tự động dựa trên tiêu đề hoặc dấu trang.
  • Xử lý hàng loạt: Tạo TOC cho nhiều tài liệu PDF tại cùng một thời điểm.
  • Tùy chỉnh: Kiểm soát giao diện và cấu trúc của TOC, bao gồm kiểu dáng, định dạng và mức độ sâu.
  • Quy trình làm việc hiệu quả: Giảm thiểu thời gian dành cho việc tạo TOC thủ công, đặc biệt là cho các tài liệu lớn hoặc phức tạp.

PDF Signature

Plugin Documentize PDF Signature for .NET cho phép người dùng ký số các tài liệu PDF. Nó cung cấp quy trình đơn giản để thêm chữ ký, đảm bảo tính xác thực và bảo mật nội dung PDF. Plugin hỗ trợ cả chữ ký hiển thị và không hiển thị, đồng thời cung cấp tùy chọn tùy chỉnh vị trí chữ ký, lý do, thông tin liên hệ và nhiều hơn nữa.

Cách Ký Tài Liệu PDF

Để ký một tài liệu PDF bằng tệp PFX, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp Signature.
  2. Tạo thể hiện của lớp SignOptions với đường dẫn tệp PFX và mật khẩu.
  3. Thêm PDF đầu vào và tệp đầu ra vào tùy chọn.
  4. Chạy phương thức Process để áp dụng chữ ký.
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// Thêm PDF đầu vào và chỉ định tệp đầu ra
 5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 7
 8// Cấu hình tùy chọn chữ ký
 9signOptions.Reason = "Hợp đồng";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "New York";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// Áp dụng chữ ký vào tài liệu
17signature.Process(signOptions);

Cách Sử Dụng Luồng cho Tệp PFX

Bạn cũng có thể ký một tài liệu PDF bằng một chứng chỉ PFX được cung cấp dưới dạng luồng thay vì đường dẫn tệp. Điều này cho phép xử lý linh hoạt hơn về việc lưu trữ chứng chỉ.

  1. Tạo một thể hiện của lớp Signature.
  2. Tạo thể hiện SignOptions với một luồng chứa PFX và mật khẩu.
  3. Thêm tệp đầu vào và đầu ra.
  4. Chạy phương thức Process để áp dụng chữ ký.
 1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
 2var signature = new Signature();
 3var signOptions = new SignOptions(pfxStream, "pfxPassword");
 4
 5// Thêm tệp đầu vào và đầu ra
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
 8
 9// Áp dụng chữ ký
10signature.Process(signOptions);

Cách Áp Dụng Chữ Ký Không Hiển Thị

Để thêm một chữ ký không hiển thị (chữ ký bảo vệ tài liệu mà không hiển thị trên tài liệu), chỉ cần đặt thuộc tính Visible thành false.

  1. Tạo một thể hiện của SignOptions.
  2. Đặt Visible thành false.
  3. Thêm tệp đầu vào và đầu ra.
  4. Gọi Process để áp dụng chữ ký không hiển thị.
 1var signature = new Signature();
 2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
 3
 4// Cấu hình chữ ký không hiển thị
 5signOptions.Visible = false;
 6
 7// Thêm tệp đầu vào và đầu ra
 8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// Xử lý chữ ký
12signature.Process(signOptions);

Tính Năng Chính:

  • Ký Số Tài Liệu PDF: Bảo vệ tài liệu của bạn bằng chữ ký số hiển thị hoặc không hiển thị.
  • Hỗ Trợ PFX: Ký các tệp PDF bằng một chứng chỉ PFX.
  • Tùy Chọn Tùy Chỉnh: Cấu hình cài đặt chữ ký như lý do, vị trí và thông tin liên hệ.
  • Chữ Ký Hiển Thị và Không Hiển Thị: Chọn xem chữ ký có hiển thị trên tài liệu hay không.

PDF Splitter

Trình Chia Tách PDF Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa quy trình chia tách các tài liệu PDF lớn thành những tệp nhỏ hơn, dễ quản lý hơn. Cho dù bạn cần trích xuất các trang đơn lẻ hay chia tách một tài liệu thành các phần cụ thể, plugin này cho phép bạn thực hiện điều đó một cách hiệu quả và với ít nỗ lực tối thiểu.

Cách Chia Tách PDF

Để chia tách một tài liệu PDF thành các trang đơn lẻ, hãy làm theo các bước sau:

  1. Tạo một instance của SplitOptions để cấu hình các tùy chọn chia tách.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm các tệp đầu ra cho mỗi trang đã chia tách bằng phương thức AddOutput.
  4. Chạy phương thức Process trong lớp Splitter để chia tách tài liệu.
 1var splitOptions = new SplitOptions();
 2
 3// Thêm tệp PDF đầu vào
 4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 5
 6// Xác định các tệp đầu ra cho mỗi trang
 7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
 8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// Xử lý thao tác chia tách
12Splitter.Process(splitOptions);

Các Tính Năng Chính:

  • Chia Tách PDF Theo Trang: Phân tách tài liệu PDF thành các trang đơn lẻ.
  • Xử Lý Hàng Loạt: Chia tách các lô PDF lớn trong một lần.
  • Tùy Chọn Chia Tách Tùy Chỉnh: Cấu hình quy trình chia tách theo yêu cầu của bạn.
  • Đầu Ra Có Tổ Chức: Dễ dàng quản lý các tệp đầu ra cho mỗi trang hoặc phần đã chia tách.

PDF ChatGPT

Plugin Documentize ChatGPT cho .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT với các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo phản hồi trò chuyện dựa trên thông điệp đầu vào và lưu đầu ra ở định dạng PDF, làm cho nó phù hợp cho việc tạo giao diện trò chuyện hoặc báo cáo phân tích trực tiếp trong các tài liệu PDF.

Tạo Phản Hồi Trò Chuyện

Để tạo phản hồi trò chuyện và lưu chúng vào tệp PDF bằng cách sử dụng plugin ChatGPT, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfChatGptRequestOptions để cấu hình các tùy chọn yêu cầu.
  2. Thêm tệp PDF đầu vào và đầu ra.
  3. Đặt khóa API và xác định các tham số như số lượng token tối đa và truy vấn cho mô hình ChatGPT.
  4. Chạy phương thức ProcessAsync để tạo ra hoàn thành trò chuyện.
 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // Đặt khóa API của bạn
 3options.MaxTokens = 1000;  // Đặt số lượng token tối đa
 4options.Query = "Phân tích văn bản này cho các chủ đề chính.";
 5
 6// Thêm tệp PDF đầu vào
 7options.AddInput(new FileDataSource("input.pdf"));
 8
 9// Chỉ định nơi lưu tệp PDF đầu ra với các phản hồi trò chuyện
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// Tạo một thể hiện của plugin PdfChatGpt
13var plugin = new PdfChatGpt();
14
15// Chạy quy trình một cách không đồng bộ
16var result = await plugin.ProcessAsync(options);

Tính Năng Chính:

  • Hoàn Thành Trò Chuyện: Tạo phản hồi bằng cách sử dụng API ChatGPT dựa trên đầu vào tùy chỉnh.
  • Tin Nhắn Hệ Thống & Người Dùng: Cung cấp cả ngữ cảnh hệ thống và đầu vào của người dùng để tạo ra các cuộc trò chuyện linh hoạt.
  • Đầu Ra PDF: Lưu các hoàn thành trò chuyện được tạo ra vào một tệp PDF có cấu trúc để sử dụng sau này.
  • Xử Lý Không Đồng Bộ: Đảm bảo ứng dụng phản hồi bằng cách xử lý các hoàn thành trò chuyện một cách không đồng bộ.

Thêm Tin Nhắn Hệ Thống và Người Dùng

Để tạo ra một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn người dùng. Những tin nhắn này giúp hình thành ngữ cảnh của cuộc trò chuyện.

  1. Thêm một tin nhắn hệ thống để thiết lập ngữ cảnh cho ChatGPT.
  2. Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng cho cuộc trò chuyện.
 1var options = new PdfChatGptRequestOptions();
 2options.ApiKey = "sk-******";  // Đặt khóa API của bạn
 3
 4// Thêm tin nhắn hệ thống cho ngữ cảnh
 5options.AddSystemMessage("Bạn là một AI được đào tạo để tóm tắt văn bản.");
 6
 7// Thêm tin nhắn người dùng để truy vấn mô hình ChatGPT
 8options.AddUserMessage("Vui lòng tóm tắt tài liệu đính kèm.");
 9
10// Thêm tệp PDF đầu vào và đầu ra
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// Xử lý yêu cầu một cách không đồng bộ
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);

PDF Image Extractor

Plugin Documentize PDF Image Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ tài liệu PDF. Nó quét các tệp PDF của bạn, xác định các hình ảnh nhúng và trích xuất chúng trong khi vẫn giữ nguyên chất lượng và định dạng ban đầu. Công cụ này cải thiện khả năng tiếp cận nội dung hình ảnh và đơn giản hóa quá trình lấy hình ảnh từ PDF.

Cách Trích Xuất Hình Ảnh Từ Một Tệp PDF

Để trích xuất hình ảnh từ một tệp PDF, hãy thực hiện các bước sau:

  1. Tạo một thể hiện của lớp ImageExtractor.
  2. Tạo một thể hiện của lớp ImageExtractorOptions.
  3. Thêm đường dẫn tệp đầu vào vào tùy chọn.
  4. Xử lý việc trích xuất hình ảnh bằng cách sử dụng plugin.
  5. Lấy các hình ảnh đã trích xuất từ bộ chứa kết quả.
 1using var plugin = new ImageExtractor();
 2
 3// Tạo một thể hiện của lớp ImageExtractorOptions
 4var imageExtractorOptions = new ImageExtractorOptions();
 5
 6// Thêm đường dẫn tệp đầu vào
 7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
 8
 9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Lấy hình ảnh đã trích xuất và lưu vào tệp
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);

Trích Xuất Hình Ảnh Từ Nhiều Tệp PDF

Plugin ImageExtractor hỗ trợ xử lý hàng loạt, cho phép bạn trích xuất hình ảnh từ nhiều PDF cùng một lúc. Tính năng này đặc biệt hữu ích khi bạn có một bộ sưu tập các tệp PDF và cần lấy tất cả hình ảnh trong một lần.

 1using var plugin = new ImageExtractor();
 2var options = new ImageExtractorOptions();
 3
 4// Thêm nhiều tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
 8
 9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(options);
11
12// Lưu các hình ảnh đã trích xuất từ tất cả các tệp
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15    var extractedImage = resultContainer.ResultCollection[i].ToStream();
16    using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17    extractedImage.CopyTo(outputStream);
18}

Tính Năng Chính:

  • Trích Xuất Hình Ảnh Nhúng: Xác định và trích xuất hình ảnh từ các tài liệu PDF.
  • Giữ Nguyên Chất Lượng Hình Ảnh: Đảm bảo hình ảnh đã trích xuất giữ nguyên chất lượng ban đầu.
  • Xử Lý Hàng Loạt: Trích xuất hình ảnh từ nhiều tài liệu PDF trong một thao tác duy nhất.
  • Đầu Ra Linh Hoạt: Lưu hình ảnh đã trích xuất theo định dạng hoặc vị trí bạn mong muốn.

PDF Text Extractor

Trình Documentize PDF Text Extractor cho .NET đơn giản hóa việc trích xuất văn bản từ tài liệu PDF. Dù bạn cần văn bản nguyên chất, thô hay đơn giản, plugin này cho phép bạn trích xuất văn bản một cách hiệu quả trong khi vẫn giữ nguyên định dạng hoặc bỏ qua tùy theo nhu cầu của bạn.

Cách trích xuất văn bản từ PDF

Để trích xuất văn bản từ tài liệu PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp TextExtractor.
  2. Tạo một thể hiện của TextExtractorOptions để cấu hình các tùy chọn trích xuất.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chạy phương thức Process để trích xuất văn bản.
  5. Truy cập văn bản đã được trích xuất bằng ResultContainer.ResultCollection.
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Xử lý việc trích xuất văn bản
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// In ra văn bản đã được trích xuất
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

Trích xuất văn bản từ nhiều PDF

Plugin cho phép bạn trích xuất văn bản từ nhiều PDF đồng thời, đảm bảo quy trình nhanh chóng và hiệu quả.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm nhiều PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// Xử lý việc trích xuất
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xuất ra văn bản đã được trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Các chế độ trích xuất văn bản

Plugin TextExtractor cung cấp ba chế độ trích xuất, mang lại linh hoạt dựa trên nhu cầu của bạn.

  1. Chế độ nguyên chất: Giữ nguyên định dạng gốc, bao gồm cả khoảng cách và sự canh chỉnh.
  2. Chế độ thô: Trích xuất văn bản mà không có định dạng, hữu ích cho việc xử lý dữ liệu thô.
  3. Chế độ đơn giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng bổ sung.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Đặt thành chế độ Nguyên chất
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Xử lý và xuất ra
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

Cách xử lý xử lý theo lô

Đối với những tập tài liệu lớn, bạn có thể tận dụng xử lý theo lô, cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm nhiều PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// Định nghĩa đầu ra cho mỗi tệp
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xử lý văn bản đã được trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Các tính năng nổi bật:

  • Chế độ Nguyên chất: Trích xuất văn bản trong khi giữ nguyên định dạng gốc của nó.
  • Chế độ Thô: Trích xuất văn bản mà không có bất kỳ định dạng nào.
  • Chế độ Đơn giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng.
  • Xử lý theo lô: Trích xuất văn bản từ nhiều PDF cùng một lúc.

PDF Timestamp Adder

Documentize PDF Timestamp Adder cho .NET là một công cụ mạnh mẽ được thiết kế để thêm dấu thời gian an toàn vào các tài liệu PDF của bạn. Nó nâng cao tính toàn vẹn và xác thực của tài liệu bằng cách cung cấp một tham chiếu thời gian tin cậy, đảm bảo tuân thủ các tiêu chuẩn chữ ký số.

Cách Thêm Dấu Thời Gian vào PDF

Để thêm một dấu thời gian an toàn vào tài liệu PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp Timestamp.
  2. Tạo một thể hiện của AddTimestampOptions để cấu hình quá trình ghi dấu thời gian.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Đặt đường dẫn tệp đầu ra bằng cách sử dụng AddOutput.
  5. Thực hiện quá trình ghi dấu thời gian bằng cách sử dụng phương thức Process.
 1// Khởi tạo plugin Timestamp
 2var plugin = new Timestamp();
 3
 4// Cấu hình các tùy chọn ghi dấu thời gian
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
 6
 7// Thêm tệp PDF đầu vào
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// Chỉ định tệp PDF đầu ra
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Thực hiện quá trình ghi dấu thời gian
14plugin.Process(opt);

Cách Sử Dụng Xác Thực Tùy Chỉnh với Máy Chủ Dấu Thời Gian

Bạn có thể cung cấp thông tin xác thực xác thực cơ bản khi kết nối với máy chủ dấu thời gian. Điều này cho phép bạn xác thực với các máy chủ yêu cầu tên người dùng và mật khẩu.

  1. Tạo một thể hiện của lớp Timestamp.
  2. Tạo một thể hiện của AddTimestampOptions, bao gồm serverBasicAuthCredentials.
  3. Thêm đường dẫn tệp đầu vào và đầu ra.
  4. Gọi phương thức Process.
 1// Khởi tạo plugin Timestamp
 2var plugin = new Timestamp();
 3
 4// Cấu hình các tùy chọn ghi dấu thời gian với xác thực
 5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
 6
 7// Thêm tệp PDF đầu vào
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// Chỉ định tệp PDF đầu ra
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Thực hiện quá trình ghi dấu thời gian
14plugin.Process(opt);

Xử Lý Tệp PFX và Mật Khẩu

Lớp AddTimestampOptions cho phép bạn sử dụng tệp PFX để ký số cùng với mật khẩu.

  • Luồng hoặc Đường Dẫn Tệp PFX: Bạn có thể cung cấp một luồng hoặc đường dẫn đến tệp PFX.
  • Bảo Vệ Mật Khẩu: Đảm bảo bạn quản lý bảo mật mật khẩu cho tệp PFX.

Tính Năng Chính:

  • Thêm Dấu Thời Gian An Toàn: Dễ dàng thêm dấu thời gian an toàn vào tài liệu PDF của bạn.
  • Máy Chủ Dấu Thời Gian Tùy Chỉnh: Sử dụng URL máy chủ dấu thời gian và thông tin xác thực tùy chỉnh.
  • Tự Động Hóa: Tích hợp ghi dấu thời gian vào các ứng dụng .NET của bạn cho các workflow tự động.
  • Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành đối với chữ ký số và dấu thời gian.

PDF/A Converter

Bộ chuyển đổi PDF/A Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành định dạng PDF/A, đảm bảo rằng nội dung của bạn luôn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Plugin này cũng hỗ trợ kiểm tra các tài liệu PDF hiện có để đảm bảo tuân thủ PDF/A, cung cấp cả tính năng chuyển đổi và xác thực trong một giải pháp duy nhất.

Cách chuyển đổi PDF thành PDF/A

Để chuyển đổi một tài liệu PDF thành định dạng PDF/A, làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfAConverter.
  2. Tạo một thể hiện của PdfAConvertOptions để cấu hình quá trình chuyển đổi.
  3. Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
  4. Thêm file PDF đầu vào bằng phương thức AddInput.
  5. Thêm file đầu ra cho PDF/A kết quả bằng phương thức AddOutput.
  6. Gọi phương thức Process để thực hiện quá trình chuyển đổi.
 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Thêm file PDF đầu vào
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// Chỉ định file PDF/A đầu ra
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// Thực hiện quá trình chuyển đổi
14pdfAConverter.Process(pdfAOptions);

Kiểm tra tuân thủ PDF/A

Bạn có thể xác thực các file PDF hiện có để kiểm tra tuân thủ PDF/A bằng cách sử dụng lớp PdfAValidateOptions.

 1var pdfAConverter = new PdfAConverter();
 2var validationOptions = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// Thêm file PDF cần xác thực
 8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// Chạy quy trình xác thực
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// Kiểm tra kết quả xác thực
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("Xác thực PDF/A đã vượt qua: " + validationResult.IsValid);

Xử lý theo lô cho chuyển đổi PDF/A

Plugin này hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi hoặc xác thực nhiều file PDF cho tuân thủ PDF/A cùng một lúc.

 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Thêm nhiều file PDF đầu vào
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Chỉ định file đầu ra cho các PDF/A đã chuyển đổi
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// Thực hiện chuyển đổi theo lô
16pdfAConverter.Process(pdfAOptions);

Tính năng chính:

  • Chuyển đổi sang PDF/A: Chuyển đổi liền mạch các file PDF thành định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) để đảm bảo tuân thủ các tiêu chuẩn lưu trữ.
  • Xác thực tuân thủ PDF/A: Kiểm tra các tài liệu PDF hiện có để đảm bảo tuân thủ các tiêu chuẩn PDF/A và xác định các vấn đề nếu chúng không tuân thủ.
  • Xử lý theo lô: Xử lý nhiều file cùng một lúc cho việc chuyển đổi hoặc xác thực.
  • Quy trình làm việc hiệu quả: Giảm thiểu thời gian và công sức với các quy trình chuyển đổi nhanh chóng và đáng tin cậy.

PDF to XLS Converter

Công cụ Documentize PDF to XLS Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF thành bảng tính Excel (XLS/XLSX). Bằng cách tận dụng plugin này, các nhà phát triển có thể biến đổi dữ liệu PDF tĩnh thành bảng tính động và có thể chỉnh sửa, giúp đơn giản hóa việc thao tác, phân tích và chia sẻ dữ liệu.

Cách chuyển đổi PDF sang Excel

Để chuyển đổi một tài liệu PDF thành một tệp Excel (XLS/XLSX), hãy thực hiện các bước sau:

  1. Tạo một thể hiện của lớp XlsConverter.
  2. Cấu hình các thiết lập chuyển đổi bằng cách sử dụng lớp PdfToXlsOptions.
  3. Thêm các tệp PDF đầu vào bằng phương thức AddInput.
  4. Chỉ định đường dẫn tệp xuất ra bằng phương thức AddOutput.
  5. Thực thi phương thức Process để bắt đầu quá trình chuyển đổi.
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Thêm đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// Thực hiện chuyển đổi
9converter.Process(options);

Tùy chỉnh chuyển đổi PDF sang Excel

Lớp PdfToXlsOptions cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển đổi PDF sang tệp XLSX, đặt tên bảng tính và bật các tùy chọn định dạng nâng cao:

 1var options = new PdfToXlsOptions
 2{
 3    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // Chỉ định định dạng XLSX
 4    WorksheetName = "MySheet",                    // Đặt tên cho bảng tính
 5    InsertBlankColumnAtFirst = true               // Chèn một cột trống ở đầu
 6};
 7
 8// Thêm các tệp đầu vào và đầu ra
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// Xử lý chuyển đổi
13converter.Process(options);

Xử lý hàng loạt chuyển đổi PDF sang XLS

Với xử lý hàng loạt, bạn có thể chuyển đổi nhiều tệp PDF thành bảng tính Excel chỉ trong một lần. Dưới đây là một ví dụ:

 1var converter = new XlsConverter();
 2var options = new PdfToXlsOptions();
 3
 4// Thêm nhiều tệp đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Chỉ định các đường dẫn tệp xuất ra
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// Thực hiện chuyển đổi hàng loạt
13converter.Process(options);

Xử lý kết quả chuyển đổi

Sau quá trình chuyển đổi, phương thức Process trả về một đối tượng ResultContainer chứa thông tin chi tiết của hoạt động. Đây là cách để lấy đường dẫn tệp đã chuyển đổi:

1var resultContainer = converter.Process(options);
2
3// Truy cập đường dẫn tệp xuất ra
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("Đường dẫn tệp đã chuyển đổi: " + result.Data.ToString());

Các định dạng xuất ra được hỗ trợ

Enum PdfToXlsOptions.ExcelFormat cung cấp một loạt các định dạng xuất ra:

  • XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
  • XLSM: Định dạng Excel hỗ trợ macro.
  • CSV: Giá trị phân tách bằng dấu phẩy.
  • ODS: Bảng tính Open Document.
  • XMLSpreadSheet2003: Định dạng XML Excel 2003.

Các tính năng chính:

  • Tùy chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF thành XLSX, XLS, CSV hoặc các định dạng khác.
  • Bảo toàn nội dung: Duy trì cấu trúc, bố cục, và định dạng ban đầu.
  • Đầu ra có thể tùy chỉnh: Cấu hình khoảng trang, tên bảng tính, và định dạng xuất ra.
  • Xử lý hàng loạt: Xử lý nhiều tệp PDF đồng thời để đạt hiệu suất cao.
  • Định dạng nâng cao: Chèn cột trống hoặc giảm thiểu số lượng bảng tính.

PDF to DOC Converter

Trình chuyển đổi PDF sang DOC của Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành định dạng DOC hoặc DOCX. Plugin này chuyển đổi các trang PDF thành các tài liệu Microsoft Word có thể chỉnh sửa, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng.

Cách Chuyển Đổi PDF Sang DOC/DOCX

Để chuyển đổi một tài liệu PDF sang định dạng DOC/DOCX, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp DocConverter.
  2. Tạo một thể hiện của DocConversionOptions để cấu hình quy trình chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Thêm đường dẫn tệp đầu ra cho tệp DOC/DOCX kết quả bằng phương thức AddOutput.
  5. Chạy phương thức Process để thực hiện chuyển đổi.
 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX,       // Định dạng đầu ra là DOCX
 5    ConversionMode = ConversionMode.EnhancedFlow // Tối ưu hóa bố cục và định dạng
 6};
 7
 8// Thêm tệp PDF đầu vào
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Thêm đường dẫn tài liệu Word đầu ra
12options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
13
14// Xử lý chuyển đổi
15docConverter.Process(options);

Chuyển Đổi PDF Sang DOC Với Tùy Chọn Tùy Chỉnh

Plugin Trình chuyển đổi PDF sang DOC cung cấp một số tùy chọn để tùy chỉnh quy trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách xử lý bố cục và cấu trúc của PDF trong quá trình chuyển đổi.

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.Doc,        // Định dạng đầu ra là DOC
 5    ConversionMode = ConversionMode.Precise // Duy trì bố cục PDF gốc một cách gần nhất có thể
 6};
 7
 8// Thêm tệp PDF đầu vào
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Thêm đường dẫn tài liệu Word đầu ra
12options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
13
14// Xử lý chuyển đổi
15docConverter.Process(options);

Xử Lý Lô Chuyển Đổi PDF Sang DOC/DOCX

Trình chuyển đổi PDF sang DOC hỗ trợ xử lý lô, cho phép bạn chuyển đổi nhiều tệp PDF cùng một lúc. Dưới đây là một ví dụ về chuyển đổi lô:

 1var docConverter = new DocConverter();
 2var options = new DocConversionOptions()
 3{
 4    SaveFormat = SaveFormat.DocX
 5};
 6
 7// Thêm nhiều tệp PDF đầu vào
 8options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Thêm đường dẫn tệp đầu ra cho các tệp DOCX kết quả
12options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
14
15// Xử lý chuyển đổi lô
16docConverter.Process(options);

Tính Năng Chính:

  • Chuyển Đổi DOC/DOCX: Chuyển đổi tài liệu PDF thành các định dạng Microsoft Word có thể chỉnh sửa (DOC hoặc DOCX).
  • Duy Trì Định Dạng: Giữ nguyên bố cục, văn bản và định dạng gốc trong quá trình chuyển đổi.
  • Xử Lý Lô: Chuyển đổi nhiều tệp PDF cùng một lúc.
  • Tùy Chọn Chuyển Đổi Tùy Chỉnh: Điều chỉnh quy trình chuyển đổi với các chế độ khác nhau, như Enhanced Flow, để có bố cục tốt hơn.

PDF to HTML Converter

Documentize PDF to HTML Converter cho .NET là một công cụ năng động giúp đơn giản hóa việc chuyển đổi tài liệu PDF sang định dạng HTML. Plugin này được thiết kế không chỉ cho việc thay đổi định dạng tệp đơn giản mà còn để nâng cao khả năng truy cập, làm cho tài liệu thân thiện với người dùng hơn và phù hợp với các môi trường web.

Cách chuyển đổi PDF sang HTML

Để chuyển đổi tài liệu PDF sang HTML, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfHtml.
  2. Tạo một thể hiện của lớp PdfToHtmlOptions để cấu hình tùy chọn chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Thêm đường dẫn tệp HTML đầu ra bằng phương thức AddOutput.
  5. Gọi phương thức Process để chuyển đổi PDF sang HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Thực hiện chuyển đổi PDF sang HTML
9pdfHtml.Process(options);

Cách chuyển đổi HTML sang PDF

PDF to HTML Converter cũng hỗ trợ chuyển đổi các tệp HTML trở lại thành định dạng PDF, cho phép chuyển đổi hai chiều đầy đủ.

1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Đặt đường dẫn tệp đầu vào và đầu ra
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Thực hiện chuyển đổi HTML sang PDF
9pdfHtml.Process(options);

Tùy chỉnh chuyển đổi PDF sang HTML

Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách chỉ định mã hóa, phông chữ hoặc các cài đặt khác. Đây là một ví dụ về việc thiết lập mã hóa UTF-8 và phông Arial cho chuyển đổi:

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Đặt mã hóa và phông chữ
 5options.Encoding = Encoding.UTF8;
 6options.Font = "Arial";
 7
 8// Thêm tệp đầu vào và đầu ra
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Thực hiện chuyển đổi
13pdfHtml.Process(options);

Chuyển đổi hàng loạt từ PDF sang HTML

Plugin này cũng hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi nhiều tệp PDF thành tệp HTML chỉ trong một lần.

 1var pdfHtml = new PdfHtml();
 2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
 3
 4// Thêm nhiều tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Đặt đường dẫn tệp đầu ra cho mỗi chuyển đổi
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Thực hiện chuyển đổi hàng loạt
13pdfHtml.Process(options);

Tính năng chính:

  • Chuyển đổi PDF sang HTML: Chuyển đổi tài liệu PDF thành các tệp HTML hoạt động đầy đủ một cách liền mạch.
  • Tài nguyên nhúng: Chọn xem có nhúng tài nguyên (chẳng hạn như hình ảnh và phông chữ) trực tiếp vào HTML hay liên kết chúng từ bên ngoài.
  • Chuyển đổi hai chiều: Chuyển đổi PDF sang HTML và ngược lại với hỗ trợ đầy đủ cho cả hai chiều.
  • Bảo toàn bố cục: Đảm bảo rằng bố cục và định dạng gốc được giữ nguyên trong quá trình chuyển đổi.
  • Mã hóa tùy chỉnh: Chỉ định định dạng mã hóa như UTF-8 để hiển thị văn bản chính xác trong HTML đã chuyển đổi.

PDF to JPEG Converter

Trình chuyển đổi PDF sang JPEG của Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa việc chuyển đổi tài liệu PDF thành hình ảnh JPEG chất lượng cao. Plugin này được thiết kế để làm cho nội dung của bạn dễ tiếp cận hơn trên nhiều nền tảng bằng cách biến các trang PDF thành các định dạng hình ảnh được sử dụng rộng rãi.

Cách chuyển đổi trang PDF thành JPEG

Để chuyển đổi tài liệu PDF thành hình ảnh JPEG, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp Jpeg.
  2. Tạo một thể hiện của JpegOptions để cấu hình quy trình chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Chỉ định đường dẫn tệp đầu ra cho hình ảnh JPEG bằng cách sử dụng phương thức AddOutput.
  5. Chạy phương thức Process để chuyển đổi các trang PDF thành hình ảnh JPEG.
 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// Thêm tệp PDF đầu vào  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Chỉ định thư mục đầu ra cho hình ảnh JPEG  
 9options.AddOutput(new FileDataSource(@"C:\Samples\images"));  
10
11// Xử lý chuyển đổi PDF sang JPEG  
12converter.Process(options);  

Tùy chỉnh chuyển đổi PDF sang JPEG

Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách điều chỉnh độ phân giải, chọn phạm vi trang hoặc đặt chất lượng hình ảnh. Dưới đây là cách chuyển đổi trang đầu tiên của một PDF ở 300 dpi:

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// Đặt độ phân giải đầu ra là 300 dpi và chỉ chuyển đổi trang đầu tiên  
 6options.OutputResolution = 300;  
 7options.PageRange = new PageRange(1);  
 8
 9// Thêm đường dẫn đầu vào và đầu ra  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
12
13// Xử lý chuyển đổi  
14converter.Process(options);  

Xử lý hàng loạt cho chuyển đổi PDF sang JPEG

Plugin Trình chuyển đổi PDF sang JPEG hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi nhiều trang từ một PDF thành các tệp JPEG riêng lẻ.

 1  
 2var converter = new Jpeg();  
 3var options = new JpegOptions();  
 4
 5// Thêm tệp PDF đầu vào  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Đặt đường dẫn đầu ra cho mỗi trang  
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));  
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));  
11
12// Xử lý chuyển đổi hàng loạt  
13converter.Process(options);  

Cách xử lý kết quả chuyển đổi

Phương thức Process trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể in các đường dẫn của các tệp JPEG đã được chuyển đổi như sau:

1  
2ResultContainer resultContainer = converter.Process(options);  
3
4// In các đường dẫn đầu ra của hình ảnh JPEG  
5foreach (FileResult result in resultContainer.ResultCollection)  
6{  
7    Console.WriteLine(result.Data.ToString());  
8}  

Các tính năng chính:

  • Chuyển đổi PDF sang JPEG: Dễ dàng chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh JPEG.
  • Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) cho các đầu ra chất lượng cao.
  • Phạm vi trang: Chọn các trang hoặc phạm vi cụ thể để chuyển đổi.
  • Xử lý hàng loạt: Chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu cùng một lúc.
  • Chuyển đổi nhanh chóng: Quy trình nhanh và hiệu quả với nỗ lực tối thiểu.

PDF to PNG Converter

Trình chuyển đổi PDF sang PNG Documentize cho .NET là một công cụ tiên tiến cho phép bạn chuyển đổi các tài liệu PDF thành hình ảnh PNG chất lượng cao. Plugin này được thiết kế để làm cho nội dung của bạn linh hoạt hơn, dễ tiếp cận hơn và dễ chia sẻ hơn bằng cách chuyển đổi các trang PDF thành các định dạng hình ảnh được hỗ trợ rộng rãi.

Cách Chuyển Đổi PDF Sang PNG

Để chuyển đổi một tài liệu PDF thành hình ảnh PNG, làm theo các bước sau:

  1. Tạo một thể hiện của lớp Png.
  2. Tạo một thể hiện của PngOptions để cấu hình quá trình chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Chỉ định thư mục đầu ra cho các hình ảnh PNG bằng cách sử dụng phương thức AddOutput.
  5. Chạy phương thức Process để chuyển đổi các trang PDF thành hình ảnh PNG.
 1var converter = new Png();
 2var options = new PngOptions();
 3
 4// Thêm tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
 6
 7// Chỉ định thư mục đầu ra cho các hình ảnh PNG
 8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
 9
10// Thực hiện chuyển đổi PDF sang PNG
11converter.Process(options);

Tùy Chỉnh Quá Trình Chuyển Đổi PDF Sang PNG

Bạn có thể tùy chỉnh quy trình chuyển đổi bằng cách điều chỉnh độ phân giải và chọn các trang cụ thể. Ví dụ, để chỉ chuyển đổi trang đầu tiên của một PDF ở độ phân giải 300 DPI:

 1var converter = new Png();
 2var options = new PngOptions();
 3
 4// Đặt độ phân giải đầu ra là 300 DPI
 5options.OutputResolution = 300;
 6
 7// Chuyển đổi chỉ trang đầu tiên
 8options.PageRange = new PageRange(1);
 9
10// Thêm đường dẫn đầu vào và đầu ra
11options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
13
14// Thực hiện quy trình chuyển đổi
15converter.Process(options);

Xử Lý Lô Đối Với Chuyển Đổi PDF Sang PNG

Plugin PDF to PNG Converter cũng hỗ trợ xử lý lô, cho phép bạn chuyển đổi nhiều trang hoặc thậm chí toàn bộ tài liệu PDF thành các tệp PNG riêng lẻ.

 1var converter = new Png();
 2var options = new PngOptions();
 3
 4// Thêm tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Đặt đường dẫn đầu ra cho từng trang
 8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
10
11// Thực hiện quy trình chuyển đổi lô
12converter.Process(options);

Xử Lý Kết Quả Chuyển Đổi

Sau khi xử lý chuyển đổi, phương thức Process trả về một đối tượng ResultContainer chứa kết quả chuyển đổi. Bạn có thể in các đường dẫn đầu ra của các hình ảnh PNG như sau:

1ResultContainer resultContainer = converter.Process(options);
2
3// In các đường dẫn đầu ra của các hình ảnh PNG
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6    Console.WriteLine(result.Data.ToString());
7}

Tính Năng Chính:

  • Chuyển đổi PDF thành PNG: Nhanh chóng và hiệu quả chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh PNG.
  • Độ Phân Giải Tùy Chỉnh: Đặt DPI mong muốn (ví dụ: 300 DPI) cho đầu ra hình ảnh chất lượng cao.
  • Xử Lý Lô: Chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu chỉ trong một lần.
  • Quản Lý Đầu Ra Dễ Dàng: Chỉ định các thư mục đầu ra cho từng tệp PNG đã chuyển đổi.
  • Chuyển Đổi Nhanh Chóng: Nhanh, hiệu quả và yêu cầu nỗ lực tối thiểu để cấu hình.

PDF to TIFF Converter

Documentize PDF to TIFF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành hình ảnh TIFF chất lượng cao. Plugin này đảm bảo rằng nội dung của bạn có thể truy cập được qua nhiều nền tảng khác nhau trong khi vẫn giữ được độ trung thực và tính linh hoạt tuyệt vời.

Cách Chuyển Đổi PDF Sang TIFF

Để chuyển đổi tài liệu PDF thành hình ảnh TIFF, hãy làm theo các bước sau:

  1. Tạo một đối tượng của lớp TiffConverter.
  2. Tạo một đối tượng của PdfToTiffOptions để cấu hình quá trình chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chỉ định đường dẫn tệp đầu ra cho các hình ảnh TIFF bằng phương thức AddOutput.
  5. Chạy phương thức Process để chuyển đổi các trang PDF thành hình ảnh TIFF.
 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// Thêm tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Chỉ định tệp đầu ra cho hình ảnh TIFF
 8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
 9
10// Xử lý chuyển đổi PDF sang TIFF
11converter.Process(options);

Tùy Chỉnh Chuyển Đổi PDF Sang TIFF

Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, bật đầu ra nhiều trang, hoặc chọn các phạm vi trang. Dưới đây là cách chuyển đổi trang đầu tiên của một PDF ở độ phân giải 300 dpi thành tệp TIFF:

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// Đặt độ phân giải đầu ra là 300 dpi và chỉ chuyển đổi trang đầu tiên
 5options.OutputResolution = 300;
 6options.PageList = new List<int> { 1 };
 7
 8// Thêm đường dẫn đầu vào và đầu ra
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// Xử lý chuyển đổi
13converter.Process(options);

Tạo TIFF Nhiều Trang

Plugin PDF to TIFF Converter hỗ trợ tạo TIFF nhiều trang, cho phép bạn kết hợp nhiều trang PDF thành một tệp TIFF duy nhất để lưu trữ hoặc in ấn hiệu quả.

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions
 3{
 4    MultiPage = true // Bật đầu ra TIFF nhiều trang
 5};
 6
 7// Thêm tệp PDF đầu vào
 8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// Chỉ định tệp đầu ra cho TIFF nhiều trang
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// Xử lý chuyển đổi
14converter.Process(options);

Xử Lý Theo Lô cho Chuyển Đổi PDF Sang TIFF

Plugin PDF to TIFF Converter cũng hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi nhiều trang PDF hoặc toàn bộ tài liệu đồng thời thành các tệp TIFF riêng biệt.

 1var converter = new TiffConverter();
 2var options = new PdfToTiffOptions();
 3
 4// Thêm tệp PDF đầu vào
 5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Đặt đường dẫn đầu ra cho các trang riêng lẻ
 8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
 9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// Xử lý chuyển đổi theo lô
12converter.Process(options);

Cách Xử Lý Kết Quả Chuyển Đổi

Phương thức Process trả về một đối tượng ResultContainer cung cấp thông tin chi tiết về kết quả chuyển đổi. Bạn có thể in các đường dẫn của các tệp TIFF đã chuyển đổi như sau:

1ResultContainer resultContainer = converter.Process(options);
2
3// In các đường dẫn đầu ra của hình ảnh TIFF
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6    Console.WriteLine(result.Data.ToString());
7}

Tính Năng Chính:

  • Chuyển Đổi PDF Sang TIFF: Chuyển đổi dễ dàng toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh TIFF.
  • Độ Phân Giải Tùy Chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao hơn.
  • TIFF Nhiều Trang: Kết hợp nhiều trang PDF thành một tệp TIFF nhiều trang duy nhất.
  • Phạm Vi Trang: Chuyển đổi các trang hoặc phạm vi cụ thể để có kết quả chính xác.
  • Xử Lý Theo Lô: Chuyển đổi nhiều tài liệu PDF hoặc trang cùng một lúc.
  • Chuyển Đổi Nhanh: Quy trình nhanh chóng và hiệu quả với ít nỗ lực.

PDF Form Flattener

Plugin Documentize PDF Form Flattener for .NET được thiết kế để chuyển đổi các mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn khỏi các sửa đổi trái phép. Công cụ này chuyển đổi các trường mẫu thành nội dung tĩnh, nâng cao bảo mật cho các tài liệu PDF của bạn. Nó đặc biệt hữu ích khi bạn cần bảo vệ các hợp đồng, thỏa thuận hoặc bất kỳ tài liệu nào mà các trường mẫu phải giữ nguyên.

Cách làm phẳng các trường mẫu trong PDF

Để làm phẳng các trường mẫu trong tài liệu PDF, vui lòng làm theo các bước sau:

  1. Tạo một thể hiện của lớp FormFlattener.
  2. Tạo một thể hiện của lớp FormFlattenAllFieldsOptions hoặc FormFlattenSelectedFieldsOptions.
  3. Thêm các tệp đầu vào và đầu ra vào các tùy chọn.
  4. Gọi phương thức Process để thực hiện thao tác làm phẳng.
 1var formFlattener = new FormFlattener();
 2
 3// Tạo tùy chọn để làm phẳng tất cả các trường
 4var flattenOptions = new FormFlattenAllFieldsOptions();
 5
 6// Thêm tệp đầu vào và đầu ra
 7flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
 8flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
 9
10// Xử lý thao tác làm phẳng mẫu
11var resultContainer = formFlattener.Process(flattenOptions);

Làm phẳng các trường được chọn

Bạn có thể làm phẳng một cách chọn lọc chỉ các trường mẫu cụ thể dựa trên các tiêu chí như vị trí hoặc loại trường.

  1. Tạo một thể hiện của lớp FormFlattener.
  2. Định nghĩa các tiêu chí để làm phẳng các trường cụ thể bằng cách sử dụng FormFlattenSelectedFieldsOptions.
  3. Thêm các tệp đầu vào và đầu ra vào các tùy chọn.
  4. Gọi phương thức Process để áp dụng các thay đổi.
 1var formFlattener = new FormFlattener();
 2
 3// Tạo tùy chọn để làm phẳng các trường được chọn (ví dụ: các trường có tọa độ x góc dưới bên trái > 300)
 4var flattenOptions = new FormFlattenSelectedFieldsOptions(
 5    (field) => field.Rect.LLX > 300
 6);
 7
 8// Thêm các tệp đầu vào và đầu ra
 9flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
10flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
11
12// Xử lý thao tác làm phẳng mẫu
13var resultContainer = formFlattener.Process(flattenOptions);

Tính năng chính:

  • Làm phẳng tất cả các trường mẫu: Chuyển đổi các trường mẫu tương tác thành nội dung tĩnh không thể chỉnh sửa.
  • Làm phẳng các trường đã chọn: Tùy chọn làm phẳng các trường cụ thể trong PDF trong khi giữ các trường khác có thể chỉnh sửa.
  • Bảo mật tài liệu: Đảm bảo rằng các trường đã làm phẳng được bảo vệ khỏi các sửa đổi tiếp theo.
  • Xử lý theo lô: Có khả năng làm phẳng nhiều mẫu PDF trong một quy trình duy nhất.

FAQs

Câu hỏi thường gặp này cung cấp thông tin toàn diện về các tính năng và chức năng của Documentize .NET Plugins, bao gồm các khía cạnh như chuyển đổi PDF, xử lý biểu mẫu và tạo mục lục (TOC).


Câu hỏi chung

1. Documentize cho .NET là gì?

Documentize cho .NET là một thư viện mạnh mẽ để quản lý và xử lý tài liệu PDF bằng lập trình. Nó bao gồm các plugin để chuyển đổi PDF sang các định dạng khác nhau, chỉnh sửa biểu mẫu PDF, thêm chữ ký điện tử, tạo TOC và đảm bảo tuân thủ PDF/A cho lưu trữ dài hạn.

2. Làm thế nào để cài đặt các plugin Documentize cho .NET?

Bạn có thể cài đặt các plugin Documentize bằng cách tải xuống các tệp assembly từ trang web chính thức hoặc lấy các gói trực tiếp từ NuGet. Hướng dẫn cài đặt chi tiết có sẵn trong tài liệu của từng plugin.


Các plugin chuyển đổi PDF

3. Làm thế nào để chuyển đổi tài liệu PDF sang tệp Word (DOC/DOCX)?

Để chuyển đổi tài liệu PDF sang định dạng Word bằng Trình chuyển đổi PDF sang DOC:

  1. Khởi tạo lớp PdfDoc.
  2. Tạo một đối tượng PdfToDocOptions để cấu hình các tùy chọn chuyển đổi.
  3. Thêm đường dẫn tệp PDF đầu vào và tệp DOC/DOCX đầu ra.
  4. Gọi phương thức Process để thực hiện chuyển đổi.

4. Làm thế nào để chuyển đổi các trang PDF thành hình ảnh JPEG?

Sử dụng Trình chuyển đổi PDF sang JPEG:

  1. Tạo một thể hiện của lớp Jpeg.
  2. Đặt các tùy chọn chuyển đổi (ví dụ: độ phân giải, phạm vi trang) thông qua JpegOptions.
  3. Thêm đường dẫn tệp đầu vào/đầu ra.
  4. Gọi phương thức Jpeg.Process để thực hiện chuyển đổi.

5. Làm thế nào để chuyển đổi PDF sang PNG?

Để chuyển đổi PDF sang định dạng PNG:

  1. Tạo một thể hiện của lớp Png và một đối tượng PngOptions.
  2. Thêm PDF đầu vào và chỉ định thư mục đầu ra.
  3. Đặt các tùy chọn như độ phân giải (ví dụ: 300 DPI).
  4. Gọi phương thức Process để tạo hình ảnh PNG.

6. Làm thế nào để chuyển đổi PDF sang Excel (XLS/XLSX)?

Để chuyển đổi PDF sang Excel:

  1. Khởi tạo lớp PdfXls.
  2. Sử dụng PdfToXlsOptions để cấu hình đường dẫn đầu vào/đầu ra và các tùy chọn chuyển đổi.
  3. Gọi phương thức Process để bắt đầu chuyển đổi.

7. Làm thế nào để chuyển đổi PDF sang HTML?

Để chuyển đổi tài liệu PDF sang HTML:

  1. Tạo một thể hiện của lớp PdfHtml.
  2. Cấu hình các tùy chọn chuyển đổi với PdfToHtmlOptions hoặc HtmlToPdfOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

Xử lý biểu mẫu PDF

8. Làm thế nào tôi có thể chỉnh sửa biểu mẫu PDF bằng Trình chỉnh sửa Biểu mẫu?

Trình chỉnh sửa Biểu mẫu PDF cung cấp khả năng để:

  • Thêm trường (FormEditorAddOptions).
  • Cập nhật trường (FormEditorSetOptions).
  • Xóa trường (FormRemoveSelectedFieldsOptions). Sau khi cấu hình các trường biểu mẫu, hãy chạy phương thức Process.

9. Làm thế nào để gộp biểu mẫu PDF?

Để gộp các trường biểu mẫu:

  1. Khởi tạo lớp FormFlattener.
  2. Sử dụng FormFlattenAllFieldsOptions để gộp tất cả các trường hoặc FormFlattenSelectedFieldsOptions để nhắm đến các trường cụ thể.
  3. Thêm tệp đầu vào/đầu ra và gọi phương thức Process.

10. Làm thế nào tôi có thể xuất dữ liệu từ các biểu mẫu PDF?

Để xuất dữ liệu biểu mẫu, sử dụng Trình xuất Biểu mẫu PDF. Tạo một đối tượng FormExporterValuesToCsvOptions, chỉ định các điều kiện trường biểu mẫu, và chạy phương thức Process để xuất dữ liệu sang định dạng CSV.


Quản lý PDF/A và TOC

11. Làm thế nào để chuyển đổi PDF sang định dạng PDF/A?

Để chuyển đổi PDF sang PDF/A:

  1. Sử dụng lớp PdfAConverter.
  2. Cấu hình phiên bản PDF/A (ví dụ: PDF/A-3B) trong PdfAConvertOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

12. Làm thế nào để tạo một Mục lục (TOC) trong PDF?

Để tạo một TOC:

  1. Tạo một thể hiện của lớp TocGenerator.
  2. Sử dụng TocOptions để định nghĩa các tham số TOC.
  3. Thêm tệp đầu vào/đầu ra và chạy phương thức Process.

Xử lý chữ ký

13. Làm thế nào để tôi ký kỹ thuật số một tài liệu PDF?

Để thêm một chữ ký kỹ thuật số:

  1. Khởi tạo lớp Signature.
  2. Sử dụng SignOptions để cấu hình tệp PFX, mật khẩu và chi tiết chữ ký (ví dụ: lý do, thông tin liên hệ).
  3. Thêm tệp đầu vào/đầu ra và chạy phương thức Process.

Tính năng bổ sung

14. Tôi có thể tách các tệp PDF bằng Documentize không?

Có, bằng cách sử dụng Trình tách PDF:

  1. Khởi tạo lớp Splitter.
  2. Cấu hình các tùy chọn tách bằng SplitOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

15. Làm thế nào để kết hợp nhiều tệp PDF thành một?

Để kết hợp các PDF:

  1. Khởi tạo lớp Merger.
  2. Thêm các PDF đầu vào và chỉ định một tệp đầu ra thông qua MergeOptions.
  3. Chạy phương thức Process để kết hợp các tệp.

16. Documentize có bị giới hạn chỉ làm việc với các tệp PDF không?

Trong khi Documentize chủ yếu tập trung vào thao tác PDF, nó cũng hỗ trợ chuyển đổi tới và từ các định dạng như DOC, XLS, HTML, JPEG và PNG.


Giấy phép và Tương thích

17. Các yêu cầu hệ thống để sử dụng các plugin Documentize là gì?

Documentize hỗ trợ:

  • Hệ điều hành: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), và Linux.
  • Khung làm việc: .NET Framework 4.0 đến 8.0.
  • IDE: Tương thích với nhiều phiên bản của Visual Studio.

18. Làm thế nào để tôi thiết lập các khóa giấy phép cho Documentize?

Để kích hoạt một plugin, tham chiếu Documentize trong dự án của bạn và thiết lập các khóa giấy phép trước khi gọi bất kỳ phương thức nào. Tham khảo tài liệu của từng plugin để biết hướng dẫn chi tiết.

19. Tôi có thể tìm thấy thêm ví dụ và tài liệu cho các plugin Documentize ở đâu?

Tài liệu API hoàn chỉnh và ví dụ có thể được tìm thấy trên trang web Documentize hoặc thông qua các gói NuGet trong môi trường phát triển của bạn.


 Tiếng Việt