Tổng quan

Documentize là một nền tảng toàn diện cung cấp SDK để quản lý tài liệu PDF trong các ứng dụng .NET. Những SDK này đơn giản hóa các tác vụ phức tạp liên quan đến việc xử lý PDF, nâng cao quy trình tài liệu và làm cho chúng trở nên trực quan và hiệu quả hơn cho người dùng. Dưới đây là cái nhìn tổng quan về các khả năng chính của nó:

Tính năng chính

  • Chuyển đổi PDF:

    • Chuyển đổi PDF sang nhiều định dạng như Microsoft Word (DOC/DOCX), Excel (XLS/XLSX), HTML, JPEG, và PNG.
    • Hỗ trợ chuyển đổi PDF sang định dạng PDF/A, lý tưởng cho việc lưu trữ lâu dài và tuân thủ các tiêu chuẩn bảo tồn.
  • Xử lý tài liệu:

    • Gộp và chia PDF: Dễ dàng kết hợp nhiều tệp PDF hoặc chia nhỏ các tài liệu lớn thành các phần nhỏ hơn, dễ quản lý hơn.
    • Tối ưu hóa PDF: Nén và cải thiện tài liệu PDF để giảm kích thước tệp mà không làm giảm chất lượng nội dung.
  • Trích xuất văn bản:

    • Trích xuất văn bản chính xác, hỗ trợ cả định dạng dữ liệu có cấu trúc và không có cấu trúc.
  • Chữ ký số:

    • Ký số các tài liệu PDF để đảm bảo tính xác thực và tính toàn vẹn của chúng, cung cấp sự bảo mật và tin cậy cho các tệp nhạy cảm.

SDK chuyên dụng

  • Bộ chuyển đổi PDF sang DOC: Chuyển đổi chính xác nội dung PDF thành tài liệu Word có thể chỉnh sửa mà vẫn bảo toàn định dạng và bố cục.
  • Bộ chuyển đổi PDF sang Excel: Trích xuất dữ liệu dạng bảng từ PDF và chuyển đổi nó thành bảng tính Excel để phân tích dữ liệu thêm.
  • Tích hợp ChatGPT: Cho phép tương tác với ChatGPT, nhúng phản hồi trí tuệ nhân tạo vào trong PDF để nâng cao tài liệu một cách độc đáo.

Sử dụng & Tương thích

Các SDK Documentize được xây dựng để tích hợp liền mạch vào các ứng dụng .NET, hỗ trợ nhiều nền tảng bao gồm Windows, macOS, và Linux. Các SDK cung cấp các API linh hoạt và mạnh mẽ phục vụ cho những yêu cầu xử lý tài liệu đa dạng trong khi đảm bảo hiệu suất cao và độ tin cậy.

Để biết thêm thông tin chi tiết về các SDK và cách tích hợp chúng vào dự án của bạn, hãy truy cập vào trang web chính thức.

Tiểu mục của Tổng quan

Cài đặt

SDK Documentize có thể được cài đặt qua nhiều phương pháp, mỗi phương pháp phù hợp với các môi trường phát triển và sở thích khác nhau. Dưới đây là những phương pháp được khuyến nghị để cài đặt Documentize:

1. NuGet (Phương pháp ưa chuộng)

NuGet là phương pháp trực tiếp và ưa chuộng nhất để cài đặt Documentize, đảm bảo rằng bạn luôn có phiên bản mới nhất và các bản cập nhật ngay trong môi trường phát triển của bạn. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng NuGet.

2. Trình cài đặt MSI

Trình cài đặt MSI là một lựa chọn tiện lợi nếu bạn muốn có các DLL của Documentize được cài đặt trực tiếp trên hệ thống của bạn. Phương pháp này lý tưởng cho các nhà phát triển có thể muốn sử dụng Documentize trên nhiều dự án mà không cần phải quản lý các tệp DLL một cách thủ công. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng MSI.

3. Tập tin ZIP

Đối với các nhà phát triển thích phương pháp thủ công, tập tin ZIP chứa các DLL của Documentize, có thể được giải nén và thêm vào dự án của bạn một cách trực tiếp. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng ZIP.

10 thg 10, 2024

Tiểu mục của Cài đặt

Yêu cầu hệ thống

Các SDK của Documentize được thiết kế để tích hợp với các ứng dụng .NET và hỗ trợ nhiều hệ điều hành cũng như môi trường phát triển khác nhau. Dưới đây là những yêu cầu hệ thống chính:

Hệ điều hành được hỗ trợ

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 đến Windows Server 2022 (x64, x86)
  • Đám mây: Microsoft Azure

macOS

  • macOS 10.12 (Sierra) và các phiên bản sau

Linux

  • Tương thích với nhiều bản phân phối Linux khác nhau:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Hỗ trợ Android 8.0 (Oreo) và các phiên bản sau.

Môi trường phát triển

  • Microsoft Visual Studio:
    • Visual Studio 2010 và các phiên bản sau (bao gồm 2019 và 2022)
  • Hỗ trợ bất kỳ môi trường phát triển nào nhắm vào các nền tảng .NET.

Các phiên bản .NET Framework được hỗ trợ

  • .NET Framework 4.0 trở lên
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

Ghi chú bổ sung

  • Adobe Acrobat không cần thiết để chạy SDK của Documentize, nhưng được khuyên dùng để xem PDF.
10 thg 10, 2024

Tuyên bố

Các SDK của Documentize.com yêu cầu tập hợp quyền Toàn Quyền khi được sử dụng trong các ứng dụng .NET. Mức độ quyền này là cần thiết cho SDK để thực hiện một số thao tác cấp hệ thống, chẳng hạn như truy cập cài đặt registry, tệp hệ thống và phân tích phông chữ.

Tại sao cần Toàn Quyền

Các SDK của Documentize sử dụng các lớp hệ thống core .NET, thường cần quyền nâng cao vì các lý do sau:

  • Truy cập Registry: Một số thao tác có thể yêu cầu đọc hoặc ghi vào registry hệ thống.
  • Tệp hệ thống: Truy cập vào các tệp hệ thống ngoài thư mục ảo của ứng dụng có thể cần thiết cho một số nhiệm vụ, chẳng hạn như xử lý phông chữ hoặc thực hiện các thao tác tệp.

Hạn chế của môi trường Medium Trust

Trong các môi trường lưu trữ áp dụng bảo mật Medium Trust, một số quyền quan trọng bị hạn chế hoặc không khả dụng. Điều này có thể ngăn cản các SDK hoạt động đúng cách trong các môi trường như vậy. Các hạn chế sau áp dụng dưới Medium Trust:

  • OleDbPermission: Không thể sử dụng nhà cung cấp dữ liệu OLE DB quản lý ADO.NET để truy cập cơ sở dữ liệu.
  • EventLogPermission: Cấm truy cập vào Nhật ký Sự kiện Windows.
  • ReflectionPermission: Ngăn cản việc sử dụng phản chiếu, điều này có thể ảnh hưởng đến một số thao tác động.
  • RegistryPermission: Truy cập vào registry hệ thống bị từ chối.
  • WebPermission: Giao tiếp bị hạn chế đối với các địa chỉ hoặc khoảng địa chỉ được định trước theo cấu hình trong phần tử <trust>.
  • FileIOPermission: Truy cập vào các tệp bị giới hạn trong thư mục ảo của ứng dụng.
10 thg 10, 2024

Môi Trường Không Phải Windows

Các SDK Documentize hỗ trợ .NET Standard 2.0, cho phép chúng được sử dụng trong các ứng dụng .NET Core chạy trên Linux hoặc các môi trường không phải Windows khác. Để đảm bảo hiệu suất tối ưu và hiển thị văn bản chính xác, hãy làm theo các bước dưới đây:

Cài Đặt Được Khuyên Dành cho Linux

1. Cài Đặt Gói libgdiplus

Gói này cung cấp chức năng GDI+ cần thiết, điều này rất quan trọng cho việc hiển thị và xử lý PDF. Bạn có thể cài đặt bằng cách chạy lệnh sau trong terminal của mình:

sudo apt-get install libgdiplus

2. Cài Đặt Phông Chữ Tương Thích với Microsoft

Để hiển thị văn bản chính xác, hãy cài đặt phông chữ TrueType của Microsoft bằng lệnh:

sudo apt-get install ttf-mscorefonts-installer

Các phông chữ này nên được đặt trong thư mục /usr/share/fonts/truetype/msttcorefonts. Nếu hệ thống của bạn lưu trữ phông chữ trong thư mục khác, hãy cập nhật đường dẫn trong mã của bạn trước khi thực hiện bất kỳ thao tác nào với SDK Documentize:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<đường dẫn tới phông chữ microsoft>"));

Mẹo vặt

Bằng cách đảm bảo rằng các cài đặt này đã hoàn tất và cấu hình đúng đường dẫn phông chữ, bạn có thể tối ưu hóa hiệu suất của các SDK Documentize trên Linux hoặc các hệ thống không phải Windows khác.

10 thg 10, 2024

Đánh Giá

Bạn có thể dễ dàng tải xuống SDK Documentize để phục vụ cho mục đích đánh giá. Phiên bản đánh giá giống hệt như phiên bản đã mua, với điểm khác biệt duy nhất là cách bạn áp dụng giấy phép.

Giới Hạn của Phiên Bản Đánh Giá

Mặc dù phiên bản đánh giá cung cấp quyền truy cập đầy đủ vào tất cả các tính năng, nhưng nó bao gồm các giới hạn sau đây cho đến khi giấy phép được áp dụng:

  • Một dấu mờ đánh giá sẽ được chèn vào tất cả các tài liệu đầu ra.
  • Chỉ có thể xem hoặc chỉnh sửa bốn trang đầu tiên của bất kỳ tài liệu PDF nào.

Để loại bỏ những giới hạn này và mở khóa phiên bản đầy đủ, chỉ cần áp dụng một giấy phép bằng cách thêm vài dòng mã vào dự án của bạn.

10 thg 10, 2024

Hướng dẫn cho nhà phát triển

Bảo Mật PDF

Mã hóa và giải mã tài liệu PDF bằng C# .NET

Chuyển Đổi PDF Sang XLS

Plugin .NET cho phép chuyển đổi tài liệu PDF sang bảng tính Excel (XLS/XLSX) một cách liền mạch

Chữ Ký PDF

.NET plugin cung cấp quy trình bổ sung chữ ký dễ dàng, đảm bảo tính xác thực và bảo vệ nội dung PDF

Converter PDF/A

Plugin .NET chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo rằng nội dung của bạn vẫn tuân thủ các tiêu chuẩn lưu trữ lâu dài

Công cụ chia PDF

Công cụ .NET giúp đơn giản hóa quá trình chia tách tài liệu PDF lớn thành các tệp nhỏ hơn và dễ quản lý hơn

PDF ChatGPT

Tích hợp API ChatGPT với ứng dụng PDF .NET

Tối ưu hóa PDF

Giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu

Trích Xuất Văn Bản PDF

.NET plugin cho phép bạn trích xuất văn bản một cách hiệu quả trong khi vẫn giữ nguyên định dạng hoặc bỏ nó đi theo nhu cầu của bạn

Trình Chuyển Đổi PDF sang DOC

Công cụ .NET cho phép chuyển đổi tài liệu PDF sang định dạng DOC hoặc DOCX

Trình Ghép PDF

Ghép nhiều tài liệu PDF thành một tập tin duy nhất bằng C# .NET

Trình Thêm Dấu Thời Gian PDF

Thêm dấu thời gian bảo mật vào tài liệu PDF của bạn bằng C# .NET

10 thg 10, 2024

Tiểu mục của Hướng dẫn cho nhà phát triển

Bảo Mật PDF

Documentize Bảo Mật PDF cho .NET là một công cụ mạnh mẽ được thiết kế để cải thiện bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp khả năng mã hóa và giải mã. Nó đảm bảo rằng thông tin nhạy cảm của bạn vẫn được giữ bí mật và bảo vệ khỏi truy cập trái phép.

Tính Năng Chính:

  • Mã Hóa Tài Liệu PDF: Bảo vệ tệp PDF của bạn bằng cách thêm mật khẩu cho người dùng và chủ sở hữu.
  • Giải Mã Tài Liệu PDF: Xóa bỏ mã hóa khỏi PDF khi cần.
  • Đặt Quyền: Kiểm soát các quyền như in ấn, sao chép và sửa đổi nội dung.
  • Tự Động Hóa: Tích hợp mã hóa và giải mã vào các ứng dụng .NET của bạn để tạo quy trình tự động.
  • Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về bảo mật tài liệu.

Cách Mã Hóa Tài Liệu PDF

Để mã hóa một tài liệu PDF, làm theo các bước sau:

  1. Tạo một phiên bản của lớp Security.
  2. Tạo một phiên bản của EncryptionOptions với các mật khẩu người dùng và chủ sở hữu mong muốn.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Đặt đường dẫn tệp đầu ra bằng cách sử dụng AddOutput.
  5. Thực hiện quá trình mã hóa bằng phương thức Process.
 1  
 2// Khởi tạo plugin Bảo mật  
 3var plugin = new Security();  
 4  
 5// Cấu hình các tùy chọn mã hóa  
 6var opt = new EncryptionOptions("user_password", "owner_password");  
 7  
 8// Thêm tệp PDF đầu vào  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10  
11// Đặt tệp PDF được mã hóa đầu ra  
12opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));  
13  
14// Thực hiện quá trình mã hóa  
15plugin.Process(opt);  

Cách Giải Mã Tài Liệu PDF

Để giải mã một tài liệu PDF, làm theo các bước sau:

  1. Tạo một phiên bản của lớp Security.
  2. Tạo một phiên bản của DecryptionOptions với mật khẩu cần thiết.
  3. Thêm tệp PDF đã được mã hóa bằng cách sử dụng phương thức AddInput.
  4. Đặt đường dẫn tệp đầu ra bằng cách sử dụng AddOutput.
  5. Thực hiện quá trình giải mã bằng phương thức Process.
 1  
 2// Khởi tạo plugin Bảo mật  
 3var plugin = new Security();  
 4  
 5// Cấu hình các tùy chọn giải mã  
 6var opt = new DecryptionOptions("user_password");  
 7  
 8// Thêm tệp PDF đã được mã hóa đầu vào  
 9opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));  
10  
11// Đặt tệp PDF đã được giải mã đầu ra  
12opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));  
13  
14// Thực hiện quá trình giải mã  
15plugin.Process(opt);  

Đặt Quyền Trên Tài Liệu PDF

Khi mã hóa một tệp PDF, bạn có thể đặt nhiều quyền khác nhau để kiểm soát cách tài liệu có thể được sử dụng.

  • In Ấn: Cho phép hoặc không cho phép in tài liệu.
  • Sao Chép: Cho phép hoặc không cho phép sao chép nội dung.
  • Sửa Đổi: Cho phép hoặc không cho phép sửa đổi tài liệu.

Để đặt quyền, bạn có thể cấu hình EncryptionOptions cho phù hợp.

Chuyển Đổi PDF Sang XLS

Chuyển Đổi PDF Sang XLS cho .NET là một công cụ mạnh mẽ cho phép việc chuyển đổi tài liệu PDF sang bảng tính Excel (XLS/XLSX) một cách liền mạch. Plugin này nâng cao khả năng truy cập và tính tiện dụng của nội dung PDF của bạn, giúp dễ dàng thao tác và phân tích dữ liệu ở định dạng bảng tính.

Tính Năng Chính:

  • Chuyển Đổi PDF Sang Excel: Biến các tệp PDF thành bảng tính XLS/XLSX để quản lý dữ liệu dễ dàng.
  • Tùy Chọn Đầu Ra Tùy Chỉnh: Cấu hình định dạng đầu ra, dải trang, tên bảng tính, và nhiều hơn nữa.
  • Chuyển Đổi Độ Trung Thực Cao: Giữ nguyên bố cục, định dạng, và độ chính xác nội dung trong quá trình chuyển đổi.
  • Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc cho các hoạt động quy mô lớn.

Cách Chuyển Đổi PDF Sang XLS

Để chuyển đổi tài liệu PDF thành tệp Excel (XLS/XLSX), làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfXls.
  2. Tạo một thể hiện của PdfToXlsOptions để cấu hình các cài đặt chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chỉ định tệp Excel đầu ra bằng phương thức AddOutput.
  5. Chạy phương thức Process để bắt đầu chuyển đổi.
 1  
 2var pdfXlsConverter = new PdfXls();  
 3var options = new PdfToXlsOptions();  
 4
 5// Thêm đường dẫn tệp đầu vào và đầu ra  
 6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// Chạy quy trình chuyển đổi  
10pdfXlsConverter.Process(options);  

Tùy Chỉnh Việc Chuyển Đổi PDF Sang Excel

Bạn có thể tùy chỉnh các cài đặt chuyển đổi bằng cách sửa đổi lớp PdfToXlsOptions. Chẳng hạn, để chuyển đổi PDF sang định dạng XLSX, chèn một cột trống và đặt tên cho bảng tính, bạn có thể sử dụng mã sau:

 1  
 2var options = new PdfToXlsOptions();  
 3
 4// Đặt định dạng đầu ra là XLSX  
 5options.Format = PdfToXlsOptions.ExcelFormat.XLSX;  
 6
 7// Chèn một cột trống ở vị trí đầu tiên  
 8options.InsertBlankColumnAtFirst = true;  
 9
10// Đặt tên cho bảng tính  
11options.WorksheetName = "MySheet";  
12
13// Thêm tệp đầu vào và đầu ra  
14options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
15options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
16
17// Xử lý chuyển đổi  
18pdfXlsConverter.Process(options);  

Xử Lý Kết Quả Chuyển Đổi

Sau khi xử lý, phương thức Process trả về một đối tượng ResultContainer chứa kết quả của quá trình chuyển đổi. Bạn có thể lấy đường dẫn tệp đã chuyển đổi hoặc các chi tiết đầu ra khác:

1  
2var resultContainer = pdfXlsConverter.Process(options);  
3
4// Truy cập và in ra đường dẫn tệp kết quả  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine(result);  

Xử Lý Theo Lô Cho Việc Chuyển Đổi PDF Sang XLS

Plugin Chuyển Đổi PDF Sang XLS cũng hỗ trợ xử lý theo lô, cho phép chuyển đổi nhiều tệp PDF cùng một lúc.

 1  
 2var pdfXlsConverter = new PdfXls();  
 3var options = new PdfToXlsOptions();  
 4
 5// Thêm nhiều tệp PDF đầu vào  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// Thêm các tệp Excel đầu ra  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// Xử lý chuyển đổi theo lô  
14pdfXlsConverter.Process(options);  

Chữ Ký PDF

Plugin Documentize PDF Signature for .NET cho phép người dùng ký số tài liệu PDF. Nó cung cấp quy trình bổ sung chữ ký dễ dàng, đảm bảo tính xác thực và bảo vệ nội dung PDF. Plugin hỗ trợ cả chữ ký có thể nhìn thấy và chữ ký không hiển thị và cung cấp các tùy chọn để tùy chỉnh vị trí, lý do, thông tin liên hệ và nhiều thứ khác của chữ ký.

Tính Năng Chính:

  • Ký Số Tài Liệu PDF: Bảo mật tài liệu của bạn bằng chữ ký số có thể nhìn thấy hoặc không nhìn thấy.
  • Hỗ Trợ PFX: Ký các tệp PDF bằng chứng chỉ PFX.
  • Tùy Chọn Tùy Chỉnh: Cấu hình các cài đặt chữ ký như lý do, địa điểm và thông tin liên lạc.
  • Chữ Ký Có Thể Nhìn Thấy và Không Nhìn Thấy: Chọn xem chữ ký có hiển thị trên tài liệu hay không.

Cách Ký Tài Liệu PDF

Để ký một tài liệu PDF bằng tệp PFX, thực hiện theo các bước sau:

  1. Tạo một thể hiện của lớp Signature.
  2. Khởi tạo lớp SignOptions với đường dẫn tệp PFX và mật khẩu.
  3. Thêm tài liệu PDF đầu vào và tệp đầu ra vào tùy chọn.
  4. Chạy phương thức Process để áp dụng chữ ký.
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4  
 5// Thêm tài liệu PDF đầu vào và chỉ định tệp đầu ra  
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 8  
 9// Cấu hình các tùy chọn chữ ký  
10signOptions.Reason = "Hợp Đồng Thỏa Thuận";  
11signOptions.Contact = "johndoe@example.com";  
12signOptions.Location = "New York";  
13signOptions.PageNumber = 1;  
14signOptions.Visible = true;  
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);  
16  
17// Áp dụng chữ ký cho tài liệu  
18signature.Process(signOptions);  

Cách Sử Dụng Luồng Để Tệp PFX

Bạn cũng có thể ký một PDF bằng chứng chỉ PFX được cung cấp dưới dạng luồng thay vì đường dẫn tệp. Điều này cho phép xử lý linh hoạt hơn về việc lưu trữ chứng chỉ.

  1. Tạo một thể hiện của lớp Signature.
  2. Khởi tạo SignOptions với một luồng chứa PFX và mật khẩu.
  3. Thêm các tệp đầu vào và đầu ra.
  4. Chạy phương thức Process để áp dụng chữ ký.
 1  
 2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");  
 3var signature = new Signature();  
 4var signOptions = new SignOptions(pfxStream, "pfxPassword");  
 5  
 6// Thêm các tệp đầu vào và đầu ra  
 7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 9  
10// Áp dụng chữ ký  
11signature.Process(signOptions);  

Cách Áp Dụng Chữ Ký Không Nhìn Thấy

Để thêm một chữ ký không nhìn thấy (một chữ ký bảo mật tài liệu mà không hiển thị chữ ký trên tài liệu), chỉ cần đặt thuộc tính Visible thành false.

  1. Tạo một thể hiện của SignOptions.
  2. Đặt Visible thành false.
  3. Thêm các tệp đầu vào và đầu ra.
  4. Gọi Process để áp dụng chữ ký không nhìn thấy.
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4  
 5// Cấu hình chữ ký không nhìn thấy  
 6signOptions.Visible = false;  
 7  
 8// Thêm các tệp đầu vào và đầu ra  
 9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));  
11  
12// Xử lý chữ ký  
13signature.Process(signOptions);  

Converter PDF/A

Documentize PDF/A Converter cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo rằng nội dung của bạn vẫn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Plugin này cũng hỗ trợ xác minh các tài liệu PDF hiện có về sự phù hợp với PDF/A, cung cấp cả tính năng chuyển đổi và xác minh trong một giải pháp duy nhất.

Tính năng chính:

  • Chuyển đổi sang PDF/A: Dễ dàng chuyển đổi tệp PDF sang định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) để đảm bảo tuân thủ các tiêu chuẩn lưu trữ.
  • Xác minh sự phù hợp với PDF/A: Kiểm tra các tài liệu PDF hiện có để xác định sự tuân thủ với các tiêu chuẩn PDF/A và phát hiện các vấn đề nếu không tuân thủ.
  • Xử lý hàng loạt: Xử lý nhiều tệp cùng một lúc để chuyển đổi hoặc xác minh.
  • Luồng công việc hiệu quả: Giảm thiểu thời gian và công sức với quy trình chuyển đổi nhanh và đáng tin cậy.

Cách chuyển đổi PDF sang PDF/A

Để chuyển đổi một tài liệu PDF thành định dạng PDF/A, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfAConverter.
  2. Tạo một thể hiện của PdfAConvertOptions để cấu hình chuyển đổi.
  3. Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
  4. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  5. Thêm tệp đầu ra cho PDF/A kết quả bằng phương thức AddOutput.
  6. Gọi phương thức Process để thực hiện chuyển đổi.
 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Thêm tệp PDF đầu vào
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// Chỉ định tệp PDF/A đầu ra
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// Tiến hành chuyển đổi
14pdfAConverter.Process(pdfAOptions);

Xác minh sự phù hợp với PDF/A

Bạn có thể xác minh các tệp PDF hiện có về sự phù hợp với PDF/A bằng cách sử dụng lớp PdfAValidateOptions.

 1var pdfAConverter = new PdfAConverter();
 2var validationOptions = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// Thêm tệp PDF cần xác minh
 8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 9
10// Chạy quá trình xác minh
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// Kiểm tra kết quả xác minh
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("Xác minh PDF/A đã thành công: " + validationResult.IsValid);

Xử lý hàng loạt cho chuyển đổi PDF/A

Plugin này hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi hoặc xác minh nhiều tệp PDF về sự phù hợp với PDF/A tại một thời điểm.

 1var pdfAConverter = new PdfAConverter();
 2var pdfAOptions = new PdfAConvertOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Thêm nhiều tệp PDF đầu vào
 8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Chỉ định tệp đầu ra cho các PDF/A đã chuyển đổi
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// Tiến hành chuyển đổi hàng loạt
16pdfAConverter.Process(pdfAOptions);

Công cụ chia PDF

Công cụ chia PDF Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình chia tách tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất các trang riêng lẻ hay chia một tài liệu thành các phần cụ thể, plugin này cho phép bạn thực hiện điều đó một cách hiệu quả và với nỗ lực tối thiểu.

Tính năng chính:

  • Chia PDF theo trang: Chia tách một tài liệu PDF thành các trang riêng lẻ.
  • Xử lý hàng loạt: Chia tách nhiều tệp PDF lớn trong một lần.
  • Tùy chọn chia tách tùy chỉnh: Cấu hình quá trình chia tách dựa trên yêu cầu của bạn.
  • Đầu ra được tổ chức: Dễ dàng quản lý các tệp đầu ra cho mỗi trang hoặc phần được chia tách.

Cách chia tách tài liệu PDF

Để chia tách một tài liệu PDF thành các trang riêng lẻ, hãy làm theo các bước sau:

  1. Tạo một phiên bản của lớp Splitter.
  2. Tạo một phiên bản của SplitOptions để cấu hình các tùy chọn chia tách.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Thêm các tệp đầu ra cho mỗi trang chia tách bằng cách sử dụng phương thức AddOutput.
  5. Chạy phương thức Process để chia tách tài liệu.
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Thêm tệp PDF đầu vào  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Chỉ định các tệp đầu ra cho mỗi trang  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12
13// Xử lý thao tác chia tách  
14splitter.Process(splitOptions);  

Chia tách PDF theo dải trang

Bạn cũng có thể chia tách một PDF bằng cách chỉ định các dải trang. Điều này cho phép bạn trích xuất các phần cụ thể hoặc nhiều trang từ một PDF vào các tài liệu riêng biệt.

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Thêm PDF đầu vào  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Định nghĩa đầu ra cho dải trang (ví dụ, trang 1-3)  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10
11// Xử lý việc chia tách  
12splitter.Process(splitOptions);  

Cách xử lý chia tách hàng loạt

Plugin Công cụ chia PDF được tối ưu hóa để xử lý hàng loạt các tài liệu PDF lớn. Bạn có thể chia tách hàng trăm PDF thành các trang hoặc phần riêng lẻ bằng cách tận dụng xử lý hàng loạt.

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Thêm các tệp PDF đầu vào theo lô  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// Định nghĩa đầu ra cho mỗi tệp  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12
13// Xử lý chia tách hàng loạt  
14splitter.Process(splitOptions);  

PDF ChatGPT

Plugin Documentize ChatGPT for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT với các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo ra các phản hồi chat dựa trên tin nhắn đầu vào và lưu đầu ra ở định dạng PDF, giúp phù hợp cho việc tạo ra giao diện đối thoại hoặc báo cáo phân tích trực tiếp trong các tài liệu PDF.

Tính năng chính:

  • Hoàn thành Chat: Tạo phản hồi bằng cách sử dụng API ChatGPT dựa trên đầu vào tùy chỉnh.
  • Tin nhắn Hệ thống & Người dùng: Cung cấp cả bối cảnh hệ thống và đầu vào của người dùng để tạo ra các cuộc hội thoại linh hoạt.
  • Đầu ra PDF: Lưu các hoàn thành chat đã tạo trong một tệp PDF có cấu trúc để sử dụng sau này.
  • Xử lý Không đồng bộ: Đảm bảo ứng dụng phản hồi nhanh chóng bằng cách xử lý các hoàn thành chat không đồng bộ.

Tạo Phản hồi Chat

Để tạo ra các phản hồi chat và lưu chúng vào một tệp PDF bằng cách sử dụng plugin ChatGPT, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfChatGptRequestOptions để cấu hình các tùy chọn yêu cầu.
  2. Thêm các tệp PDF đầu vào và đầu ra.
  3. Đặt khóa API và chỉ định các tham số như số lượng token tối đa và truy vấn cho mô hình ChatGPT.
  4. Chạy phương thức ProcessAsync để tạo hoàn thành chat.
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // Đặt khóa API của bạn  
 4options.MaxTokens = 1000;  // Đặt số lượng token tối đa  
 5options.Query = "Phân tích văn bản này để tìm các chủ đề chính.";  
 6
 7// Thêm tệp PDF đầu vào  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// Chỉ định nơi lưu tệp PDF đầu ra với các phản hồi chat  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// Tạo một thể instance của plugin PdfChatGpt  
14var plugin = new PdfChatGpt();  
15
16// Chạy quá trình không đồng bộ  
17var result = await plugin.ProcessAsync(options);  

Thêm Tin nhắn Hệ thống và Người dùng

Để tạo ra một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn của người dùng. Những tin nhắn này giúp hình thành bối cảnh của cuộc trò chuyện.

  1. Thêm một tin nhắn hệ thống thiết lập bối cảnh cho ChatGPT.
  2. Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng cho cuộc trò chuyện.
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // Đặt khóa API của bạn  
 4
 5// Thêm tin nhắn hệ thống cho bối cảnh  
 6options.AddSystemMessage("Bạn là một trí tuệ nhân tạo được đào tạo để tóm tắt văn bản.");  
 7
 8// Thêm tin nhắn người dùng để truy vấn mô hình ChatGPT  
 9options.AddUserMessage("Xin vui lòng tóm tắt tài liệu đính kèm.");  
10
11// Thêm các tệp PDF đầu vào và đầu ra  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// Xử lý yêu cầu không đồng bộ  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

Tối ưu hóa PDF

Bộ tối ưu hóa PDF Documentize là một plugin toàn diện giúp nâng cao tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Nó được thiết kế để giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những hoạt động này cải thiện chất lượng và khả năng quản lý của các tệp PDF, giúp dễ dàng lưu trữ, chia sẻ và xem.

Tính năng chính:

  • Tối ưu hóa: Giảm kích thước tệp PDF mà không mất chất lượng.
  • Xoay: Điều chỉnh hướng của các trang PDF.
  • Cắt: Loại bỏ các lề hoặc nội dung không cần thiết khỏi tài liệu.
  • Thay đổi kích thước: Thay đổi kích thước các trang theo kích thước cụ thể (ví dụ: A4, Letter).

Tối ưu hóa tài liệu PDF

Các bước sau đây minh họa cách tối ưu hóa một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn giữ được chất lượng.

  1. Tạo một thể hiện của lớp Optimizer.
  2. Tạo một đối tượng OptimizeOptions để cấu hình cài đặt tối ưu hóa.
  3. Thêm tệp PDF đầu vào và đặt vị trí đầu ra cho tệp được tối ưu hóa.
  4. Chạy phương thức Process để thực hiện tối ưu hóa.
1  
2var optimizer = new Optimizer();  
3var optimizeOptions = new OptimizeOptions();  
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));  
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));  
6optimizer.Process(optimizeOptions);  

Thay đổi kích thước tài liệu PDF

Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.

  1. Tạo một thể hiện của lớp Optimizer.
  2. Tạo một đối tượng ResizeOptions để xác định kích thước trang.
  3. Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
  4. Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
  5. Gọi phương thức Process để áp dụng các thay đổi.
1  
2var optimizer = new Optimizer();  
3var resizeOptions = new ResizeOptions();  
4resizeOptions.AddInput(new FileDataSource("input.pdf"));  
5resizeOptions.SetPageSize(PageSize.A4);  
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(resizeOptions);  

Xoay các trang PDF

Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong một tệp PDF.

  1. Tạo một thể hiện của lớp Optimizer.
  2. Tạo một đối tượng RotateOptions và cấu hình góc xoay.
  3. Thêm tệp PDF đầu vào và xác định vị trí tệp đầu ra.
  4. Đặt góc xoay (ví dụ: 90 độ) bằng cách sử dụng phương thức SetRotation.
  5. Thực hiện việc xoay bằng phương thức Process.
1  
2var optimizer = new Optimizer();  
3var rotateOptions = new RotateOptions();  
4rotateOptions.AddInput(new FileDataSource("input.pdf"));  
5rotateOptions.SetRotation(90);  
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(rotateOptions);  

Cắt tài liệu PDF

Cắt bỏ nội dung hoặc các lề không mong muốn khỏi tài liệu PDF. Lớp CropOptions có thể được sử dụng để xác định khu vực cắt.

  1. Tạo một thể hiện của lớp Optimizer.
  2. Định nghĩa khu vực cắt bằng đối tượng CropOptions.
  3. Thêm tệp đầu vào và xác định vị trí tệp đầu ra.
  4. Sử dụng phương thức SetCropBox để xác định khu vực cắt.
  5. Thực hiện việc cắt bằng phương thức Process.
1  
2var optimizer = new Optimizer();  
3var cropOptions = new CropOptions();  
4cropOptions.AddInput(new FileDataSource("input.pdf"));  
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // Định nghĩa khu vực cắt  
6cropOptions.AddOutput(new FileDataSource("output.pdf"));  
7optimizer.Process(cropOptions);  

Trích Xuất Văn Bản PDF

Documentize PDF Text Extractor for .NET đơn giản hóa quá trình trích xuất văn bản từ tài liệu PDF. Cho dù bạn cần văn bản thuần túy, thô, hay văn bản đơn giản, plugin này cho phép bạn trích xuất văn bản một cách hiệu quả trong khi giữ nguyên định dạng hoặc bỏ qua nó theo nhu cầu của bạn.

Các Tính Năng Chính:

  • Chế Độ Thuần Túy: Trích xuất văn bản trong khi giữ nguyên định dạng ban đầu của nó.
  • Chế Độ Thô: Trích xuất văn bản mà không có bất kỳ định dạng nào.
  • Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng.
  • Xử Lý Theo Lô: Trích xuất văn bản từ nhiều PDF cùng một lúc.

Cách Trích Xuất Văn Bản từ Tài Liệu PDF

Để trích xuất văn bản từ tài liệu PDF, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp TextExtractor.
  2. Tạo một thể hiện của TextExtractorOptions để cấu hình các tùy chọn trích xuất.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Chạy phương thức Process để trích xuất văn bản.
  5. Truy cập văn bản đã trích xuất bằng ResultContainer.ResultCollection.
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Xử lý trích xuất văn bản
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// In văn bản đã trích xuất
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

Trích Xuất Văn Bản từ Nhiều PDF

Plugin cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc, đảm bảo xử lý nhanh chóng và hiệu quả.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm nhiều PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// Xử lý trích xuất
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xuất văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Các Chế Độ Trích Xuất Văn Bản

Plugin TextExtractor cung cấp ba chế độ trích xuất, mang lại tính linh hoạt dựa trên nhu cầu của bạn.

  1. Chế Độ Thuần Túy: Giữ nguyên định dạng ban đầu, bao gồm khoảng trắng và căn chỉnh.
  2. Chế Độ Thô: Trích xuất văn bản mà không có định dạng, hữu ích cho việc xử lý dữ liệu thô.
  3. Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng bổ sung.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Đặt chế độ thành Chế độ Thuần Túy
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"))
6
7// Xử lý và xuất
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

Cách Xử Lý Xử Lý Theo Lô

Đối với các bộ tài liệu lớn, bạn có thể tận dụng xử lý theo lô, cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Thêm nhiều PDF đầu vào
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// Định nghĩa đầu ra cho mỗi tệp
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xử lý văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Trình Chuyển Đổi PDF sang DOC

Trình Chuyển Đổi PDF sang DOC cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC hoặc DOCX. Plugin này chuyển đổi các trang PDF thành tài liệu Word Microsoft có thể chỉnh sửa một cách liền mạch, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng khác nhau.

Tính Năng Chính:

  • Chuyển Đổi DOC/DOCX: Chuyển đổi tài liệu PDF thành định dạng Word Microsoft có thể chỉnh sửa (DOC hoặc DOCX).
  • Giữ Nguyên Định Dạng: Giữ nguyên bố cục, văn bản và định dạng ban đầu trong quá trình chuyển đổi.
  • Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc.
  • Tùy Chọn Chuyển Đổi Tùy Chỉnh: Tinh chỉnh quá trình chuyển đổi với các chế độ khác nhau, như Enhanced Flow, để có bố cục tốt hơn.

Cách Chuyển Đổi PDF sang DOC/DOCX

Để chuyển đổi một tài liệu PDF sang định dạng DOC/DOCX, hãy làm theo các bước sau:

  1. Tạo một thể hiện của lớp PdfDoc.
  2. Tạo một thể hiện của PdfToDocOptions để cấu hình quá trình chuyển đổi.
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Thêm đường dẫn tệp đầu ra cho tệp DOC/DOCX kết quả bằng phương thức AddOutput.
  5. Chạy phương thức Process để thực hiện chuyển đổi.
 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX,       // Định dạng đầu ra là DOCX  
 6    ConversionMode = ConversionMode.EnhancedFlow // Tối ưu hóa bố cục và định dạng  
 7};  
 8
 9// Thêm tệp PDF đầu vào  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// Thêm đường dẫn tài liệu Word đầu ra  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));  
14
15// Thực hiện quá trình chuyển đổi  
16pdfToWord.Process(options);  

Chuyển Đổi PDF sang DOC với Tùy Chọn Tùy Chỉnh

Plugin Trình Chuyển Đổi PDF sang DOC cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.Doc,        // Định dạng đầu ra là DOC  
 6    ConversionMode = ConversionMode.Precise // Giữ nguyên bố cục PDF gốc càng gần càng tốt  
 7};  
 8
 9// Thêm tệp PDF đầu vào  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// Thêm đường dẫn tài liệu Word đầu ra  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));  
14
15// Thực hiện quá trình chuyển đổi  
16pdfToWord.Process(options);  

Xử Lý Theo Lô Chuyển Đổi PDF sang DOC/DOCX

Plugin Trình Chuyển Đổi PDF sang DOC hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi nhiều tệp PDF cùng một lúc. Dưới đây là một ví dụ về chuyển đổi theo lô:

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX  
 6};  
 7
 8// Thêm nhiều tệp PDF đầu vào  
 9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// Thêm đường dẫn tệp đầu ra cho các tệp DOCX kết quả  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));  
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));  
15
16// Thực hiện quá trình chuyển đổi theo lô  
17pdfToWord.Process(options);  

Trình Ghép PDF

Trình Ghép PDF Documentize cho .NET là một công cụ đa năng được thiết kế để ghép nhiều tài liệu PDF thành một tập tin duy nhất. Nó đơn giản hóa quá trình hợp nhất các tệp PDF, đảm bảo tài liệu của bạn được ghép một cách hiệu quả và duy trì tính đồng nhất trong nội dung. Plugin này xử lý các nguồn tài nguyên nội bộ như phông chữ và hình ảnh để tối ưu hóa tài liệu đã ghép.

Tính Năng Chính:

  • Ghép Nhiều PDF: Dễ dàng kết hợp nhiều tệp PDF thành một.
  • Tối Ưu Hóa Tài Nguyên: Xóa bỏ phông chữ và hình ảnh trùng lặp trong quá trình ghép.
  • Xử Lý Lô: Ghép các lô tài liệu PDF lớn trong một lần.
  • Ghép An Toàn: Đảm bảo tính toàn vẹn của tài liệu mà không mất dữ liệu hoặc gây hư hỏng nội dung.

Cách Ghép Tài Liệu PDF

Để ghép nhiều tài liệu PDF thành một tập tin duy nhất, làm theo các bước sau:

  1. Tạo một thể hiện của lớp Merger.
  2. Tạo một thể hiện của MergeOptions để cấu hình quá trình ghép.
  3. Thêm các tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Đặt đường dẫn tệp đầu ra bằng cách sử dụng AddOutput.
  5. Thực hiện quá trình ghép bằng phương thức Process.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Thêm các tệp PDF đầu vào để ghép  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));  
 9
10// Đặt đường dẫn tệp đầu ra  
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));  
12
13// Ghép các PDF  
14merger.Process(mergeOptions);  

Cách Ghép PDF với Phạm Vi Trang

Bạn cũng có thể ghép các phạm vi trang cụ thể từ các tệp PDF đầu vào bằng cách sử dụng lớp MergeOptions. Điều này cho phép bạn kết hợp các trang được chọn vào tài liệu đầu ra cuối cùng.

  1. Tạo một thể hiện của lớp Merger.
  2. Cấu hình các phạm vi trang bằng MergeOptions.
  3. Thêm các tệp đầu vào với các phạm vi trang đã chỉ định.
  4. Đặt đường dẫn đầu ra.
  5. Gọi phương thức Process.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Ghép các trang cụ thể từ các PDF đầu vào  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));  
 8
 9// Đặt đường dẫn tệp đầu ra  
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));  
11
12// Ghép các PDF  
13merger.Process(mergeOptions);  

Cách Xử Lý Ghép Lô

Plugin Trình Ghép PDF được tối ưu hóa để xử lý các lô lớn tài liệu PDF. Bằng cách tận dụng tính năng xử lý lô, bạn có thể ghép hàng trăm PDF trong một thao tác duy nhất, đảm bảo quản lý tài liệu hiệu quả và nhanh chóng.

  1. Tạo một thể hiện của lớp Merger.
  2. Thêm tất cả các tệp PDF đầu vào vào lớp MergeOptions.
  3. Đặt đường dẫn đầu ra.
  4. Gọi phương thức Process để ghép tất cả các tệp trong lô.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Thêm một lô lớn các PDF để ghép  
 6for (int i = 1; i <= 100; i++)  
 7{  
 8    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));  
 9}  
10
11// Đặt đường dẫn tệp đầu ra  
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));  
13
14// Xử lý việc ghép lô  
15merger.Process(mergeOptions);  

Trình Thêm Dấu Thời Gian PDF

Trình Thêm Dấu Thời Gian PDF Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để thêm dấu thời gian bảo mật vào tài liệu PDF của bạn. Nó nâng cao tính toàn vẹn và xác thực của tài liệu bằng cách cung cấp một tham chiếu thời gian đáng tin cậy, đảm bảo tuân thủ các tiêu chuẩn chữ ký kỹ thuật số.

Tính Năng Nổi Bật:

  • Thêm Dấu Thời Gian Bảo Mật: Dễ dàng thêm dấu thời gian bảo mật vào tài liệu PDF của bạn.
  • Máy Chủ Dấu Thời Gian Tùy Chỉnh: Sử dụng các URL máy chủ dấu thời gian tùy chỉnh và thông tin xác thực.
  • Tự Động Hóa: Tích hợp quy trình thêm dấu thời gian vào các ứng dụng .NET của bạn để tự động hóa công việc.
  • Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về chữ ký kỹ thuật số và dấu thời gian.

Cách Thêm Dấu Thời Gian vào Tài Liệu PDF

Để thêm dấu thời gian bảo mật vào một tài liệu PDF, hãy thực hiện theo các bước sau:

  1. Tạo một thể hiện của lớp Timestamp.
  2. Tạo một thể hiện của AddTimestampOptions để cấu hình quy trình thêm dấu thời gian.
  3. Thêm tệp PDF đầu vào bằng cách sử dụng phương thức AddInput.
  4. Đặt đường dẫn tệp đầu ra bằng cách sử dụng AddOutput.
  5. Thực hiện quy trình thêm dấu thời gian bằng cách sử dụng phương thức Process.
 1  
 2// Khởi tạo plugin Dấu Thời Gian  
 3var plugin = new Timestamp();  
 4
 5// Cấu hình các tùy chọn thêm dấu thời gian  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");  
 7
 8// Thêm tệp PDF đầu vào  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// Chỉ định tệp PDF đầu ra  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// Thực hiện quy trình thêm dấu thời gian  
15plugin.Process(opt);  

Cách Sử Dụng Xác Thực Tùy Chỉnh với Máy Chủ Dấu Thời Gian

Bạn có thể cung cấp thông tin xác thực xác thực cơ bản khi kết nối với máy chủ dấu thời gian. Điều này cho phép bạn xác thực với các máy chủ yêu cầu tên người dùng và mật khẩu.

  1. Tạo một thể hiện của lớp Timestamp.
  2. Tạo một thể hiện của AddTimestampOptions, bao gồm serverBasicAuthCredentials.
  3. Thêm tệp đầu vào và đường dẫn tệp đầu ra.
  4. Gọi phương thức Process.
 1  
 2// Khởi tạo plugin Dấu Thời Gian  
 3var plugin = new Timestamp();  
 4
 5// Cấu hình các tùy chọn thêm dấu thời gian với xác thực  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");  
 7
 8// Thêm tệp PDF đầu vào  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// Chỉ định tệp PDF đầu ra  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// Thực hiện quy trình thêm dấu thời gian  
15plugin.Process(opt);  

Xử Lý Các Tệp PFX và Mật Khẩu

Lớp AddTimestampOptions cho phép bạn sử dụng tệp PFX cho việc ký kỹ thuật số cùng với mật khẩu.

  • Luồng hoặc Đường Dẫn Tệp PFX: Bạn có thể cung cấp một luồng hoặc đường dẫn tệp đến tệp PFX.
  • Bảo Mật Mật Khẩu: Đảm bảo bạn quản lý mật khẩu cho tệp PFX một cách an toàn.

Câu Hỏi Thường Gặp

Câu hỏi thường gặp này cung cấp thông tin toàn diện liên quan đến các tính năng và chức năng của Documentize .NET Plugins, bao gồm các khía cạnh như chuyển đổi PDF, xử lý biểu mẫu, và tạo mục lục (TOC).


Câu Hỏi Chung

1. Documentize for .NET là gì?

Documentize for .NET là một thư viện mạnh mẽ để quản lý và xử lý tài liệu PDF một cách lập trình. Nó bao gồm các plugin để chuyển đổi PDF sang các định dạng khác nhau, chỉnh sửa các biểu mẫu PDF, thêm chữ ký điện tử, tạo TOC, và đảm bảo tuân thủ PDF/A cho lưu trữ lâu dài.

2. Làm thế nào để tôi cài đặt các plugin Documentize cho .NET?

Bạn có thể cài đặt các plugin Documentize bằng cách tải xuống các tệp assembly từ trang web chính thức hoặc lấy gói trực tiếp từ NuGet. Hướng dẫn cài đặt chi tiết có sẵn trong tài liệu của từng plugin.


Các Plugin Chuyển Đổi PDF

3. Làm thế nào để tôi chuyển đổi tài liệu PDF sang tệp Word (DOC/DOCX)?

Để chuyển đổi tài liệu PDF sang định dạng Word sử dụng PDF to DOC Converter:

  1. Khởi tạo lớp PdfDoc.
  2. Tạo một đối tượng PdfToDocOptions để cấu hình tùy chọn chuyển đổi.
  3. Thêm đường dẫn tệp PDF đầu vào và tệp DOC/DOCX đầu ra.
  4. Gọi phương thức Process để thực hiện chuyển đổi.

4. Làm thế nào để tôi chuyển đổi các trang PDF thành hình ảnh JPEG?

Sử dụng PDF to JPEG Converter:

  1. Tạo một phiên bản của lớp Jpeg.
  2. Đặt tùy chọn chuyển đổi (ví dụ: độ phân giải, phạm vi trang) thông qua JpegOptions.
  3. Thêm đường dẫn tệp đầu vào/đầu ra.
  4. Gọi phương thức Jpeg.Process để thực hiện chuyển đổi.

5. Làm thế nào để tôi chuyển đổi PDF sang PNG?

Để chuyển đổi PDF sang định dạng PNG:

  1. Tạo một phiên bản của lớp Png và một đối tượng PngOptions.
  2. Thêm PDF đầu vào và chỉ định thư mục đầu ra.
  3. Đặt tùy chọn như độ phân giải (ví dụ: 300 DPI).
  4. Gọi phương thức Process để tạo hình ảnh PNG.

6. Làm thế nào để tôi chuyển đổi PDF sang Excel (XLS/XLSX)?

Để chuyển đổi PDF sang Excel:

  1. Khởi tạo lớp PdfXls.
  2. Sử dụng PdfToXlsOptions để cấu hình đường dẫn đầu vào/đầu ra và tùy chọn chuyển đổi.
  3. Gọi phương thức Process để bắt đầu chuyển đổi.

7. Làm thế nào để tôi chuyển đổi PDF sang HTML?

Để chuyển đổi tài liệu PDF thành HTML:

  1. Tạo một phiên bản của lớp PdfHtml.
  2. Cấu hình các tùy chọn chuyển đổi với PdfToHtmlOptions hoặc HtmlToPdfOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

Xử Lý Biểu Mẫu PDF

8. Làm thế nào để tôi chỉnh sửa các biểu mẫu PDF bằng Trình Chỉnh Sửa Biểu Mẫu?

PDF Form Editor cung cấp khả năng để:

  • Thêm trường (FormEditorAddOptions).
  • Cập nhật trường (FormEditorSetOptions).
  • Xóa trường (FormRemoveSelectedFieldsOptions). Sau khi cấu hình các trường biểu mẫu, chạy phương thức Process.

9. Làm thế nào để tôi làm phẳng các biểu mẫu PDF?

Để làm phẳng các trường biểu mẫu:

  1. Khởi tạo lớp FormFlattener.
  2. Sử dụng FormFlattenAllFieldsOptions để làm phẳng tất cả các trường hoặc FormFlattenSelectedFieldsOptions để nhắm mục tiêu vào các trường cụ thể.
  3. Thêm các tệp đầu vào/đầu ra và gọi phương thức Process.

10. Làm thế nào để tôi xuất dữ liệu từ các biểu mẫu PDF?

Để xuất dữ liệu biểu mẫu, sử dụng PDF Form Exporter. Tạo một đối tượng FormExporterValuesToCsvOptions, chỉ định điều kiện trường biểu mẫu, và chạy phương thức Process để xuất dữ liệu vào định dạng CSV.


Quản Lý PDF/A và TOC

11. Làm thế nào để tôi chuyển đổi PDF sang định dạng PDF/A?

Để chuyển đổi PDF sang PDF/A:

  1. Sử dụng lớp PdfAConverter.
  2. Cấu hình phiên bản PDF/A (ví dụ: PDF/A-3B) trong PdfAConvertOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

12. Làm thế nào để tôi tạo một Mục Lục (TOC) trong PDF?

Để tạo một TOC:

  1. Tạo một phiên bản của lớp TocGenerator.
  2. Sử dụng TocOptions để xác định các tham số TOC.
  3. Thêm các tệp đầu vào/đầu ra và chạy phương thức Process.

Xử Lý Chữ Ký

13. Làm thế nào để tôi ký điện tử tài liệu PDF?

Để thêm chữ ký điện tử:

  1. Khởi tạo lớp Signature.
  2. Sử dụng SignOptions để cấu hình tệp PFX, mật khẩu và chi tiết chữ ký (ví dụ: lý do, thông tin liên hệ).
  3. Thêm các tệp đầu vào/đầu ra và chạy phương thức Process.

Các Tính Năng Bổ Sung

14. Tôi có thể tách các tệp PDF bằng cách sử dụng Documentize không?

Có, sử dụng PDF Splitter:

  1. Khởi tạo lớp Splitter.
  2. Cấu hình tùy chọn tách sử dụng SplitOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

15. Làm thế nào để tôi gộp nhiều tệp PDF thành một?

Để gộp PDF:

  1. Khởi tạo lớp Merger.
  2. Thêm các tệp PDF đầu vào và chỉ định một tệp đầu ra thông qua MergeOptions.
  3. Chạy phương thức Process để gộp các tệp lại.

16. Documentize có giới hạn chỉ làm việc với PDF không?

Trong khi Documentize chủ yếu tập trung vào việc thao tác với PDF, nó cũng hỗ trợ chuyển đổi tới và từ các định dạng như DOC, XLS, HTML, JPEG, và PNG.


Giấy Phép và Tính Tương Thích

17. Yêu cầu hệ thống để sử dụng các plugin Documentize là gì?

Documentize hỗ trợ:

  • Hệ điều hành: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), và Linux.
  • Khung: .NET Framework từ 4.0 đến 8.0.
  • IDE: Tương thích với nhiều phiên bản của Visual Studio.

18. Làm thế nào để tôi đặt khóa giấy phép cho Documentize?

Để kích hoạt một plugin, tham chiếu Documentize trong dự án của bạn và đặt các khóa giấy phép trước khi gọi bất kỳ phương thức nào. Tham khảo tài liệu của plugin cụ thể để biết hướng dẫn chi tiết.

19. Tôi có thể tìm thấy thêm các ví dụ và tài liệu cho các plugin Documentize ở đâu?

Tài liệu API đầy đủ và các ví dụ có thể được tìm thấy trên trang web Documentize hoặc thông qua các gói NuGet trong môi trường phát triển của bạn.


 Tiếng Việt