Cài đặt
SDK Documentize có thể được cài đặt qua nhiều phương pháp, mỗi phương pháp phù hợp với các môi trường phát triển và sở thích khác nhau. Dưới đây là những phương pháp được khuyến nghị để cài đặt Documentize:
1. NuGet (Phương pháp ưa chuộng)
NuGet là phương pháp trực tiếp và ưa chuộng nhất để cài đặt Documentize, đảm bảo rằng bạn luôn có phiên bản mới nhất và các bản cập nhật ngay trong môi trường phát triển của bạn. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng NuGet.
2. Trình cài đặt MSI
Trình cài đặt MSI là một lựa chọn tiện lợi nếu bạn muốn có các DLL của Documentize được cài đặt trực tiếp trên hệ thống của bạn. Phương pháp này lý tưởng cho các nhà phát triển có thể muốn sử dụng Documentize trên nhiều dự án mà không cần phải quản lý các tệp DLL một cách thủ công. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng MSI.
3. Tập tin ZIP
Đối với các nhà phát triển thích phương pháp thủ công, tập tin ZIP chứa các DLL của Documentize, có thể được giải nén và thêm vào dự án của bạn một cách trực tiếp. Kiểm tra thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng ZIP.
Tiểu mục của Cài đặt
Yêu cầu hệ thống
Các SDK của Documentize được thiết kế để tích hợp với các ứng dụng .NET và hỗ trợ nhiều hệ điều hành cũng như môi trường phát triển khác nhau. Dưới đây là những yêu cầu hệ thống chính:
Hệ điều hành được hỗ trợ
Windows
- Windows 7 (x64, x86)
- Windows 8, 8.1 (x64, x86)
- Windows 10 (x64, x86)
- Windows 11 (x64, x86)
- Windows Server 2003 đến Windows Server 2022 (x64, x86)
- Đám mây: Microsoft Azure
macOS
- macOS 10.12 (Sierra) và các phiên bản sau
Linux
- Tương thích với nhiều bản phân phối Linux khác nhau:
- Ubuntu (16.04, 18.04, 20.04, 22.04)
- CentOS (7, 8)
- Debian (9, 10)
- OpenSUSE (Leap 15+, SLES 12+)
Android
- Hỗ trợ Android 8.0 (Oreo) và các phiên bản sau.
Môi trường phát triển
- Microsoft Visual Studio:
- Visual Studio 2010 và các phiên bản sau (bao gồm 2019 và 2022)
- Hỗ trợ bất kỳ môi trường phát triển nào nhắm vào các nền tảng .NET.
Các phiên bản .NET Framework được hỗ trợ
- .NET Framework 4.0 trở lên
- .NET Standard 2.0 (.NET Core 3.1+)
- .NET 6.0, .NET 7.0, .NET 8.0
Ghi chú bổ sung
- Adobe Acrobat không cần thiết để chạy SDK của Documentize, nhưng được khuyên dùng để xem PDF.
Tuyên bố
Các SDK của Documentize.com yêu cầu tập hợp quyền Toàn Quyền khi được sử dụng trong các ứng dụng .NET. Mức độ quyền này là cần thiết cho SDK để thực hiện một số thao tác cấp hệ thống, chẳng hạn như truy cập cài đặt registry, tệp hệ thống và phân tích phông chữ.
Tại sao cần Toàn Quyền
Các SDK của Documentize sử dụng các lớp hệ thống core .NET, thường cần quyền nâng cao vì các lý do sau:
- Truy cập Registry: Một số thao tác có thể yêu cầu đọc hoặc ghi vào registry hệ thống.
- Tệp hệ thống: Truy cập vào các tệp hệ thống ngoài thư mục ảo của ứng dụng có thể cần thiết cho một số nhiệm vụ, chẳng hạn như xử lý phông chữ hoặc thực hiện các thao tác tệp.
Hạn chế của môi trường Medium Trust
Trong các môi trường lưu trữ áp dụng bảo mật Medium Trust, một số quyền quan trọng bị hạn chế hoặc không khả dụng. Điều này có thể ngăn cản các SDK hoạt động đúng cách trong các môi trường như vậy. Các hạn chế sau áp dụng dưới Medium Trust:
- OleDbPermission: Không thể sử dụng nhà cung cấp dữ liệu OLE DB quản lý ADO.NET để truy cập cơ sở dữ liệu.
- EventLogPermission: Cấm truy cập vào Nhật ký Sự kiện Windows.
- ReflectionPermission: Ngăn cản việc sử dụng phản chiếu, điều này có thể ảnh hưởng đến một số thao tác động.
- RegistryPermission: Truy cập vào registry hệ thống bị từ chối.
- WebPermission: Giao tiếp bị hạn chế đối với các địa chỉ hoặc khoảng địa chỉ được định trước theo cấu hình trong phần tử
<trust>
. - FileIOPermission: Truy cập vào các tệp bị giới hạn trong thư mục ảo của ứng dụng.
Môi Trường Không Phải Windows
Các SDK Documentize hỗ trợ .NET Standard 2.0, cho phép chúng được sử dụng trong các ứng dụng .NET Core chạy trên Linux hoặc các môi trường không phải Windows khác. Để đảm bảo hiệu suất tối ưu và hiển thị văn bản chính xác, hãy làm theo các bước dưới đây:
Cài Đặt Được Khuyên Dành cho Linux
1. Cài Đặt Gói libgdiplus
Gói này cung cấp chức năng GDI+ cần thiết, điều này rất quan trọng cho việc hiển thị và xử lý PDF. Bạn có thể cài đặt bằng cách chạy lệnh sau trong terminal của mình:
sudo apt-get install libgdiplus
2. Cài Đặt Phông Chữ Tương Thích với Microsoft
Để hiển thị văn bản chính xác, hãy cài đặt phông chữ TrueType của Microsoft bằng lệnh:
sudo apt-get install ttf-mscorefonts-installer
Các phông chữ này nên được đặt trong thư mục /usr/share/fonts/truetype/msttcorefonts
. Nếu hệ thống của bạn lưu trữ phông chữ trong thư mục khác, hãy cập nhật đường dẫn trong mã của bạn trước khi thực hiện bất kỳ thao tác nào với SDK Documentize:
Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<đường dẫn tới phông chữ microsoft>"));
Mẹo vặt
Bằng cách đảm bảo rằng các cài đặt này đã hoàn tất và cấu hình đúng đường dẫn phông chữ, bạn có thể tối ưu hóa hiệu suất của các SDK Documentize trên Linux hoặc các hệ thống không phải Windows khác.
Đánh Giá
Bạn có thể dễ dàng tải xuống SDK Documentize để phục vụ cho mục đích đánh giá. Phiên bản đánh giá giống hệt như phiên bản đã mua, với điểm khác biệt duy nhất là cách bạn áp dụng giấy phép.
Giới Hạn của Phiên Bản Đánh Giá
Mặc dù phiên bản đánh giá cung cấp quyền truy cập đầy đủ vào tất cả các tính năng, nhưng nó bao gồm các giới hạn sau đây cho đến khi giấy phép được áp dụng:
- Một dấu mờ đánh giá sẽ được chèn vào tất cả các tài liệu đầu ra.
- Chỉ có thể xem hoặc chỉnh sửa bốn trang đầu tiên của bất kỳ tài liệu PDF nào.
Để loại bỏ những giới hạn này và mở khóa phiên bản đầy đủ, chỉ cần áp dụng một giấy phép bằng cách thêm vài dòng mã vào dự án của bạn.
Tiểu mục của Hướng dẫn cho nhà phát triển
Bảo Mật PDF
Documentize Bảo Mật PDF cho .NET là một công cụ mạnh mẽ được thiết kế để cải thiện bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp khả năng mã hóa và giải mã. Nó đảm bảo rằng thông tin nhạy cảm của bạn vẫn được giữ bí mật và bảo vệ khỏi truy cập trái phép.
Tính Năng Chính:
- Mã Hóa Tài Liệu PDF: Bảo vệ tệp PDF của bạn bằng cách thêm mật khẩu cho người dùng và chủ sở hữu.
- Giải Mã Tài Liệu PDF: Xóa bỏ mã hóa khỏi PDF khi cần.
- Đặt Quyền: Kiểm soát các quyền như in ấn, sao chép và sửa đổi nội dung.
- Tự Động Hóa: Tích hợp mã hóa và giải mã vào các ứng dụng .NET của bạn để tạo quy trình tự động.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về bảo mật tài liệu.
Cách Mã Hóa Tài Liệu PDF
Để mã hóa một tài liệu PDF, làm theo các bước sau:
- Tạo một phiên bản của lớp
Security
. - Tạo một phiên bản của
EncryptionOptions
với các mật khẩu người dùng và chủ sở hữu mong muốn. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình mã hóa bằng phương thức
Process
.
1
2// Khởi tạo plugin Bảo mật
3var plugin = new Security();
4
5// Cấu hình các tùy chọn mã hóa
6var opt = new EncryptionOptions("user_password", "owner_password");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Đặt tệp PDF được mã hóa đầu ra
12opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
13
14// Thực hiện quá trình mã hóa
15plugin.Process(opt);
Cách Giải Mã Tài Liệu PDF
Để giải mã một tài liệu PDF, làm theo các bước sau:
- Tạo một phiên bản của lớp
Security
. - Tạo một phiên bản của
DecryptionOptions
với mật khẩu cần thiết. - Thêm tệp PDF đã được mã hóa bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình giải mã bằng phương thức
Process
.
1
2// Khởi tạo plugin Bảo mật
3var plugin = new Security();
4
5// Cấu hình các tùy chọn giải mã
6var opt = new DecryptionOptions("user_password");
7
8// Thêm tệp PDF đã được mã hóa đầu vào
9opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
10
11// Đặt tệp PDF đã được giải mã đầu ra
12opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
13
14// Thực hiện quá trình giải mã
15plugin.Process(opt);
Đặt Quyền Trên Tài Liệu PDF
Khi mã hóa một tệp PDF, bạn có thể đặt nhiều quyền khác nhau để kiểm soát cách tài liệu có thể được sử dụng.
- In Ấn: Cho phép hoặc không cho phép in tài liệu.
- Sao Chép: Cho phép hoặc không cho phép sao chép nội dung.
- Sửa Đổi: Cho phép hoặc không cho phép sửa đổi tài liệu.
Để đặt quyền, bạn có thể cấu hình EncryptionOptions
cho phù hợp.
Chuyển Đổi PDF Sang XLS
Chuyển Đổi PDF Sang XLS cho .NET là một công cụ mạnh mẽ cho phép việc chuyển đổi tài liệu PDF sang bảng tính Excel (XLS/XLSX) một cách liền mạch. Plugin này nâng cao khả năng truy cập và tính tiện dụng của nội dung PDF của bạn, giúp dễ dàng thao tác và phân tích dữ liệu ở định dạng bảng tính.
Tính Năng Chính:
- Chuyển Đổi PDF Sang Excel: Biến các tệp PDF thành bảng tính XLS/XLSX để quản lý dữ liệu dễ dàng.
- Tùy Chọn Đầu Ra Tùy Chỉnh: Cấu hình định dạng đầu ra, dải trang, tên bảng tính, và nhiều hơn nữa.
- Chuyển Đổi Độ Trung Thực Cao: Giữ nguyên bố cục, định dạng, và độ chính xác nội dung trong quá trình chuyển đổi.
- Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc cho các hoạt động quy mô lớn.
Cách Chuyển Đổi PDF Sang XLS
Để chuyển đổi tài liệu PDF thành tệp Excel (XLS/XLSX), làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfXls
. - Tạo một thể hiện của
PdfToXlsOptions
để cấu hình các cài đặt chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chỉ định tệp Excel đầu ra bằng phương thức
AddOutput
. - Chạy phương thức
Process
để bắt đầu chuyển đổi.
1
2var pdfXlsConverter = new PdfXls();
3var options = new PdfToXlsOptions();
4
5// Thêm đường dẫn tệp đầu vào và đầu ra
6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// Chạy quy trình chuyển đổi
10pdfXlsConverter.Process(options);
Tùy Chỉnh Việc Chuyển Đổi PDF Sang Excel
Bạn có thể tùy chỉnh các cài đặt chuyển đổi bằng cách sửa đổi lớp PdfToXlsOptions
. Chẳng hạn, để chuyển đổi PDF sang định dạng XLSX, chèn một cột trống và đặt tên cho bảng tính, bạn có thể sử dụng mã sau:
1
2var options = new PdfToXlsOptions();
3
4// Đặt định dạng đầu ra là XLSX
5options.Format = PdfToXlsOptions.ExcelFormat.XLSX;
6
7// Chèn một cột trống ở vị trí đầu tiên
8options.InsertBlankColumnAtFirst = true;
9
10// Đặt tên cho bảng tính
11options.WorksheetName = "MySheet";
12
13// Thêm tệp đầu vào và đầu ra
14options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
15options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
16
17// Xử lý chuyển đổi
18pdfXlsConverter.Process(options);
Xử Lý Kết Quả Chuyển Đổi
Sau khi xử lý, phương thức Process trả về một đối tượng ResultContainer
chứa kết quả của quá trình chuyển đổi. Bạn có thể lấy đường dẫn tệp đã chuyển đổi hoặc các chi tiết đầu ra khác:
1
2var resultContainer = pdfXlsConverter.Process(options);
3
4// Truy cập và in ra đường dẫn tệp kết quả
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine(result);
Xử Lý Theo Lô Cho Việc Chuyển Đổi PDF Sang XLS
Plugin Chuyển Đổi PDF Sang XLS cũng hỗ trợ xử lý theo lô, cho phép chuyển đổi nhiều tệp PDF cùng một lúc.
1
2var pdfXlsConverter = new PdfXls();
3var options = new PdfToXlsOptions();
4
5// Thêm nhiều tệp PDF đầu vào
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Thêm các tệp Excel đầu ra
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// Xử lý chuyển đổi theo lô
14pdfXlsConverter.Process(options);
Chữ Ký PDF
Plugin Documentize PDF Signature for .NET cho phép người dùng ký số tài liệu PDF. Nó cung cấp quy trình bổ sung chữ ký dễ dàng, đảm bảo tính xác thực và bảo vệ nội dung PDF. Plugin hỗ trợ cả chữ ký có thể nhìn thấy và chữ ký không hiển thị và cung cấp các tùy chọn để tùy chỉnh vị trí, lý do, thông tin liên hệ và nhiều thứ khác của chữ ký.
Tính Năng Chính:
- Ký Số Tài Liệu PDF: Bảo mật tài liệu của bạn bằng chữ ký số có thể nhìn thấy hoặc không nhìn thấy.
- Hỗ Trợ PFX: Ký các tệp PDF bằng chứng chỉ PFX.
- Tùy Chọn Tùy Chỉnh: Cấu hình các cài đặt chữ ký như lý do, địa điểm và thông tin liên lạc.
- Chữ Ký Có Thể Nhìn Thấy và Không Nhìn Thấy: Chọn xem chữ ký có hiển thị trên tài liệu hay không.
Cách Ký Tài Liệu PDF
Để ký một tài liệu PDF bằng tệp PFX, thực hiện theo các bước sau:
- Tạo một thể hiện của lớp
Signature
. - Khởi tạo lớp
SignOptions
với đường dẫn tệp PFX và mật khẩu. - Thêm tài liệu PDF đầu vào và tệp đầu ra vào tùy chọn.
- Chạy phương thức
Process
để áp dụng chữ ký.
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// Thêm tài liệu PDF đầu vào và chỉ định tệp đầu ra
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// Cấu hình các tùy chọn chữ ký
10signOptions.Reason = "Hợp Đồng Thỏa Thuận";
11signOptions.Contact = "johndoe@example.com";
12signOptions.Location = "New York";
13signOptions.PageNumber = 1;
14signOptions.Visible = true;
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
16
17// Áp dụng chữ ký cho tài liệu
18signature.Process(signOptions);
Cách Sử Dụng Luồng Để Tệp PFX
Bạn cũng có thể ký một PDF bằng chứng chỉ PFX được cung cấp dưới dạng luồng thay vì đường dẫn tệp. Điều này cho phép xử lý linh hoạt hơn về việc lưu trữ chứng chỉ.
- Tạo một thể hiện của lớp
Signature
. - Khởi tạo
SignOptions
với một luồng chứa PFX và mật khẩu. - Thêm các tệp đầu vào và đầu ra.
- Chạy phương thức
Process
để áp dụng chữ ký.
1
2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
3var signature = new Signature();
4var signOptions = new SignOptions(pfxStream, "pfxPassword");
5
6// Thêm các tệp đầu vào và đầu ra
7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
9
10// Áp dụng chữ ký
11signature.Process(signOptions);
Cách Áp Dụng Chữ Ký Không Nhìn Thấy
Để thêm một chữ ký không nhìn thấy (một chữ ký bảo mật tài liệu mà không hiển thị chữ ký trên tài liệu), chỉ cần đặt thuộc tính Visible
thành false
.
- Tạo một thể hiện của
SignOptions
. - Đặt
Visible
thành false
. - Thêm các tệp đầu vào và đầu ra.
- Gọi
Process
để áp dụng chữ ký không nhìn thấy.
1
2var signature = new Signature();
3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
4
5// Cấu hình chữ ký không nhìn thấy
6signOptions.Visible = false;
7
8// Thêm các tệp đầu vào và đầu ra
9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
11
12// Xử lý chữ ký
13signature.Process(signOptions);
Converter PDF/A
Documentize PDF/A Converter cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo rằng nội dung của bạn vẫn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Plugin này cũng hỗ trợ xác minh các tài liệu PDF hiện có về sự phù hợp với PDF/A, cung cấp cả tính năng chuyển đổi và xác minh trong một giải pháp duy nhất.
Tính năng chính:
- Chuyển đổi sang PDF/A: Dễ dàng chuyển đổi tệp PDF sang định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) để đảm bảo tuân thủ các tiêu chuẩn lưu trữ.
- Xác minh sự phù hợp với PDF/A: Kiểm tra các tài liệu PDF hiện có để xác định sự tuân thủ với các tiêu chuẩn PDF/A và phát hiện các vấn đề nếu không tuân thủ.
- Xử lý hàng loạt: Xử lý nhiều tệp cùng một lúc để chuyển đổi hoặc xác minh.
- Luồng công việc hiệu quả: Giảm thiểu thời gian và công sức với quy trình chuyển đổi nhanh và đáng tin cậy.
Cách chuyển đổi PDF sang PDF/A
Để chuyển đổi một tài liệu PDF thành định dạng PDF/A, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfAConverter
. - Tạo một thể hiện của
PdfAConvertOptions
để cấu hình chuyển đổi. - Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
- Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm tệp đầu ra cho PDF/A kết quả bằng phương thức
AddOutput
. - Gọi phương thức
Process
để thực hiện chuyển đổi.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm tệp PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chỉ định tệp PDF/A đầu ra
11pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
12
13// Tiến hành chuyển đổi
14pdfAConverter.Process(pdfAOptions);
Xác minh sự phù hợp với PDF/A
Bạn có thể xác minh các tệp PDF hiện có về sự phù hợp với PDF/A bằng cách sử dụng lớp PdfAValidateOptions
.
1var pdfAConverter = new PdfAConverter();
2var validationOptions = new PdfAValidateOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_1A
5};
6
7// Thêm tệp PDF cần xác minh
8validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Chạy quá trình xác minh
11var resultContainer = pdfAConverter.Process(validationOptions);
12
13// Kiểm tra kết quả xác minh
14var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
15Console.WriteLine("Xác minh PDF/A đã thành công: " + validationResult.IsValid);
Xử lý hàng loạt cho chuyển đổi PDF/A
Plugin này hỗ trợ xử lý hàng loạt, cho phép bạn chuyển đổi hoặc xác minh nhiều tệp PDF về sự phù hợp với PDF/A tại một thời điểm.
1var pdfAConverter = new PdfAConverter();
2var pdfAOptions = new PdfAConvertOptions
3{
4 PdfAVersion = PdfAStandardVersion.PDF_A_3B
5};
6
7// Thêm nhiều tệp PDF đầu vào
8pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
10
11// Chỉ định tệp đầu ra cho các PDF/A đã chuyển đổi
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
14
15// Tiến hành chuyển đổi hàng loạt
16pdfAConverter.Process(pdfAOptions);
Công cụ chia PDF
Công cụ chia PDF Documentize cho .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình chia tách tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất các trang riêng lẻ hay chia một tài liệu thành các phần cụ thể, plugin này cho phép bạn thực hiện điều đó một cách hiệu quả và với nỗ lực tối thiểu.
Tính năng chính:
- Chia PDF theo trang: Chia tách một tài liệu PDF thành các trang riêng lẻ.
- Xử lý hàng loạt: Chia tách nhiều tệp PDF lớn trong một lần.
- Tùy chọn chia tách tùy chỉnh: Cấu hình quá trình chia tách dựa trên yêu cầu của bạn.
- Đầu ra được tổ chức: Dễ dàng quản lý các tệp đầu ra cho mỗi trang hoặc phần được chia tách.
Cách chia tách tài liệu PDF
Để chia tách một tài liệu PDF thành các trang riêng lẻ, hãy làm theo các bước sau:
- Tạo một phiên bản của lớp
Splitter
. - Tạo một phiên bản của
SplitOptions
để cấu hình các tùy chọn chia tách. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Thêm các tệp đầu ra cho mỗi trang chia tách bằng cách sử dụng phương thức
AddOutput
. - Chạy phương thức
Process
để chia tách tài liệu.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm tệp PDF đầu vào
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Chỉ định các tệp đầu ra cho mỗi trang
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
12
13// Xử lý thao tác chia tách
14splitter.Process(splitOptions);
Chia tách PDF theo dải trang
Bạn cũng có thể chia tách một PDF bằng cách chỉ định các dải trang. Điều này cho phép bạn trích xuất các phần cụ thể hoặc nhiều trang từ một PDF vào các tài liệu riêng biệt.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm PDF đầu vào
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7
8// Định nghĩa đầu ra cho dải trang (ví dụ, trang 1-3)
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));
10
11// Xử lý việc chia tách
12splitter.Process(splitOptions);
Cách xử lý chia tách hàng loạt
Plugin Công cụ chia PDF được tối ưu hóa để xử lý hàng loạt các tài liệu PDF lớn. Bạn có thể chia tách hàng trăm PDF thành các trang hoặc phần riêng lẻ bằng cách tận dụng xử lý hàng loạt.
1
2var splitter = new Splitter();
3var splitOptions = new SplitOptions();
4
5// Thêm các tệp PDF đầu vào theo lô
6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Định nghĩa đầu ra cho mỗi tệp
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));
12
13// Xử lý chia tách hàng loạt
14splitter.Process(splitOptions);
PDF ChatGPT
Plugin Documentize ChatGPT for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT với các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo ra các phản hồi chat dựa trên tin nhắn đầu vào và lưu đầu ra ở định dạng PDF, giúp phù hợp cho việc tạo ra giao diện đối thoại hoặc báo cáo phân tích trực tiếp trong các tài liệu PDF.
Tính năng chính:
- Hoàn thành Chat: Tạo phản hồi bằng cách sử dụng API ChatGPT dựa trên đầu vào tùy chỉnh.
- Tin nhắn Hệ thống & Người dùng: Cung cấp cả bối cảnh hệ thống và đầu vào của người dùng để tạo ra các cuộc hội thoại linh hoạt.
- Đầu ra PDF: Lưu các hoàn thành chat đã tạo trong một tệp PDF có cấu trúc để sử dụng sau này.
- Xử lý Không đồng bộ: Đảm bảo ứng dụng phản hồi nhanh chóng bằng cách xử lý các hoàn thành chat không đồng bộ.
Tạo Phản hồi Chat
Để tạo ra các phản hồi chat và lưu chúng vào một tệp PDF bằng cách sử dụng plugin ChatGPT, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfChatGptRequestOptions
để cấu hình các tùy chọn yêu cầu. - Thêm các tệp PDF đầu vào và đầu ra.
- Đặt khóa API và chỉ định các tham số như số lượng token tối đa và truy vấn cho mô hình ChatGPT.
- Chạy phương thức
ProcessAsync
để tạo hoàn thành chat.
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // Đặt khóa API của bạn
4options.MaxTokens = 1000; // Đặt số lượng token tối đa
5options.Query = "Phân tích văn bản này để tìm các chủ đề chính.";
6
7// Thêm tệp PDF đầu vào
8options.AddInput(new FileDataSource("input.pdf"));
9
10// Chỉ định nơi lưu tệp PDF đầu ra với các phản hồi chat
11options.AddOutput(new FileDataSource("output.pdf"));
12
13// Tạo một thể instance của plugin PdfChatGpt
14var plugin = new PdfChatGpt();
15
16// Chạy quá trình không đồng bộ
17var result = await plugin.ProcessAsync(options);
Thêm Tin nhắn Hệ thống và Người dùng
Để tạo ra một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn của người dùng. Những tin nhắn này giúp hình thành bối cảnh của cuộc trò chuyện.
- Thêm một tin nhắn hệ thống thiết lập bối cảnh cho ChatGPT.
- Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng cho cuộc trò chuyện.
1
2var options = new PdfChatGptRequestOptions();
3options.ApiKey = "sk-******"; // Đặt khóa API của bạn
4
5// Thêm tin nhắn hệ thống cho bối cảnh
6options.AddSystemMessage("Bạn là một trí tuệ nhân tạo được đào tạo để tóm tắt văn bản.");
7
8// Thêm tin nhắn người dùng để truy vấn mô hình ChatGPT
9options.AddUserMessage("Xin vui lòng tóm tắt tài liệu đính kèm.");
10
11// Thêm các tệp PDF đầu vào và đầu ra
12options.AddInput(new FileDataSource("input.pdf"));
13options.AddOutput(new FileDataSource("output.pdf"));
14
15// Xử lý yêu cầu không đồng bộ
16var plugin = new PdfChatGpt();
17var result = await plugin.ProcessAsync(options);
Tối ưu hóa PDF
Bộ tối ưu hóa PDF Documentize là một plugin toàn diện giúp nâng cao tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Nó được thiết kế để giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những hoạt động này cải thiện chất lượng và khả năng quản lý của các tệp PDF, giúp dễ dàng lưu trữ, chia sẻ và xem.
Tính năng chính:
- Tối ưu hóa: Giảm kích thước tệp PDF mà không mất chất lượng.
- Xoay: Điều chỉnh hướng của các trang PDF.
- Cắt: Loại bỏ các lề hoặc nội dung không cần thiết khỏi tài liệu.
- Thay đổi kích thước: Thay đổi kích thước các trang theo kích thước cụ thể (ví dụ: A4, Letter).
Tối ưu hóa tài liệu PDF
Các bước sau đây minh họa cách tối ưu hóa một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn giữ được chất lượng.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng OptimizeOptions để cấu hình cài đặt tối ưu hóa.
- Thêm tệp PDF đầu vào và đặt vị trí đầu ra cho tệp được tối ưu hóa.
- Chạy phương thức Process để thực hiện tối ưu hóa.
1
2var optimizer = new Optimizer();
3var optimizeOptions = new OptimizeOptions();
4optimizeOptions.AddInput(new FileDataSource("input.pdf"));
5optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(optimizeOptions);
Thay đổi kích thước tài liệu PDF
Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng ResizeOptions để xác định kích thước trang.
- Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
- Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
- Gọi phương thức Process để áp dụng các thay đổi.
1
2var optimizer = new Optimizer();
3var resizeOptions = new ResizeOptions();
4resizeOptions.AddInput(new FileDataSource("input.pdf"));
5resizeOptions.SetPageSize(PageSize.A4);
6resizeOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(resizeOptions);
Xoay các trang PDF
Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong một tệp PDF.
- Tạo một thể hiện của lớp Optimizer.
- Tạo một đối tượng RotateOptions và cấu hình góc xoay.
- Thêm tệp PDF đầu vào và xác định vị trí tệp đầu ra.
- Đặt góc xoay (ví dụ: 90 độ) bằng cách sử dụng phương thức SetRotation.
- Thực hiện việc xoay bằng phương thức Process.
1
2var optimizer = new Optimizer();
3var rotateOptions = new RotateOptions();
4rotateOptions.AddInput(new FileDataSource("input.pdf"));
5rotateOptions.SetRotation(90);
6rotateOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(rotateOptions);
Cắt tài liệu PDF
Cắt bỏ nội dung hoặc các lề không mong muốn khỏi tài liệu PDF. Lớp CropOptions có thể được sử dụng để xác định khu vực cắt.
- Tạo một thể hiện của lớp Optimizer.
- Định nghĩa khu vực cắt bằng đối tượng CropOptions.
- Thêm tệp đầu vào và xác định vị trí tệp đầu ra.
- Sử dụng phương thức SetCropBox để xác định khu vực cắt.
- Thực hiện việc cắt bằng phương thức Process.
1
2var optimizer = new Optimizer();
3var cropOptions = new CropOptions();
4cropOptions.AddInput(new FileDataSource("input.pdf"));
5cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // Định nghĩa khu vực cắt
6cropOptions.AddOutput(new FileDataSource("output.pdf"));
7optimizer.Process(cropOptions);
Trích Xuất Văn Bản PDF
Documentize PDF Text Extractor for .NET đơn giản hóa quá trình trích xuất văn bản từ tài liệu PDF. Cho dù bạn cần văn bản thuần túy, thô, hay văn bản đơn giản, plugin này cho phép bạn trích xuất văn bản một cách hiệu quả trong khi giữ nguyên định dạng hoặc bỏ qua nó theo nhu cầu của bạn.
Các Tính Năng Chính:
- Chế Độ Thuần Túy: Trích xuất văn bản trong khi giữ nguyên định dạng ban đầu của nó.
- Chế Độ Thô: Trích xuất văn bản mà không có bất kỳ định dạng nào.
- Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng.
- Xử Lý Theo Lô: Trích xuất văn bản từ nhiều PDF cùng một lúc.
Cách Trích Xuất Văn Bản từ Tài Liệu PDF
Để trích xuất văn bản từ tài liệu PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
TextExtractor
. - Tạo một thể hiện của
TextExtractorOptions
để cấu hình các tùy chọn trích xuất. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Chạy phương thức
Process
để trích xuất văn bản. - Truy cập văn bản đã trích xuất bằng
ResultContainer.ResultCollection
.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Xử lý trích xuất văn bản
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// In văn bản đã trích xuất
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
Trích Xuất Văn Bản từ Nhiều PDF
Plugin cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc, đảm bảo xử lý nhanh chóng và hiệu quả.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// Xử lý trích xuất
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xuất văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Các Chế Độ Trích Xuất Văn Bản
Plugin TextExtractor cung cấp ba chế độ trích xuất, mang lại tính linh hoạt dựa trên nhu cầu của bạn.
- Chế Độ Thuần Túy: Giữ nguyên định dạng ban đầu, bao gồm khoảng trắng và căn chỉnh.
- Chế Độ Thô: Trích xuất văn bản mà không có định dạng, hữu ích cho việc xử lý dữ liệu thô.
- Chế Độ Đơn Giản: Trích xuất văn bản mà không có ký tự đặc biệt hoặc định dạng bổ sung.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Đặt chế độ thành Chế độ Thuần Túy
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"))
6
7// Xử lý và xuất
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
Cách Xử Lý Xử Lý Theo Lô
Đối với các bộ tài liệu lớn, bạn có thể tận dụng xử lý theo lô, cho phép bạn trích xuất văn bản từ nhiều PDF cùng một lúc.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Thêm nhiều PDF đầu vào
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// Định nghĩa đầu ra cho mỗi tệp
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Xử lý văn bản đã trích xuất
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Trình Chuyển Đổi PDF sang DOC
Trình Chuyển Đổi PDF sang DOC cho .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC hoặc DOCX. Plugin này chuyển đổi các trang PDF thành tài liệu Word Microsoft có thể chỉnh sửa một cách liền mạch, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng khác nhau.
Tính Năng Chính:
- Chuyển Đổi DOC/DOCX: Chuyển đổi tài liệu PDF thành định dạng Word Microsoft có thể chỉnh sửa (DOC hoặc DOCX).
- Giữ Nguyên Định Dạng: Giữ nguyên bố cục, văn bản và định dạng ban đầu trong quá trình chuyển đổi.
- Xử Lý Theo Lô: Chuyển đổi nhiều tệp PDF cùng một lúc.
- Tùy Chọn Chuyển Đổi Tùy Chỉnh: Tinh chỉnh quá trình chuyển đổi với các chế độ khác nhau, như Enhanced Flow, để có bố cục tốt hơn.
Cách Chuyển Đổi PDF sang DOC/DOCX
Để chuyển đổi một tài liệu PDF sang định dạng DOC/DOCX, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
PdfDoc
. - Tạo một thể hiện của
PdfToDocOptions
để cấu hình quá trình chuyển đổi. - Thêm tệp PDF đầu vào bằng phương thức
AddInput
. - Thêm đường dẫn tệp đầu ra cho tệp DOC/DOCX kết quả bằng phương thức
AddOutput
. - Chạy phương thức
Process
để thực hiện chuyển đổi.
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX, // Định dạng đầu ra là DOCX
6 ConversionMode = ConversionMode.EnhancedFlow // Tối ưu hóa bố cục và định dạng
7};
8
9// Thêm tệp PDF đầu vào
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Thêm đường dẫn tài liệu Word đầu ra
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
14
15// Thực hiện quá trình chuyển đổi
16pdfToWord.Process(options);
Chuyển Đổi PDF sang DOC với Tùy Chọn Tùy Chỉnh
Plugin Trình Chuyển Đổi PDF sang DOC cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.Doc, // Định dạng đầu ra là DOC
6 ConversionMode = ConversionMode.Precise // Giữ nguyên bố cục PDF gốc càng gần càng tốt
7};
8
9// Thêm tệp PDF đầu vào
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Thêm đường dẫn tài liệu Word đầu ra
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
14
15// Thực hiện quá trình chuyển đổi
16pdfToWord.Process(options);
Xử Lý Theo Lô Chuyển Đổi PDF sang DOC/DOCX
Plugin Trình Chuyển Đổi PDF sang DOC hỗ trợ xử lý theo lô, cho phép bạn chuyển đổi nhiều tệp PDF cùng một lúc. Dưới đây là một ví dụ về chuyển đổi theo lô:
1
2var pdfToWord = new PdfDoc();
3var options = new PdfToDocOptions()
4{
5 SaveFormat = SaveFormat.DocX
6};
7
8// Thêm nhiều tệp PDF đầu vào
9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// Thêm đường dẫn tệp đầu ra cho các tệp DOCX kết quả
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
15
16// Thực hiện quá trình chuyển đổi theo lô
17pdfToWord.Process(options);
Trình Ghép PDF
Trình Ghép PDF Documentize cho .NET là một công cụ đa năng được thiết kế để ghép nhiều tài liệu PDF thành một tập tin duy nhất. Nó đơn giản hóa quá trình hợp nhất các tệp PDF, đảm bảo tài liệu của bạn được ghép một cách hiệu quả và duy trì tính đồng nhất trong nội dung. Plugin này xử lý các nguồn tài nguyên nội bộ như phông chữ và hình ảnh để tối ưu hóa tài liệu đã ghép.
Tính Năng Chính:
- Ghép Nhiều PDF: Dễ dàng kết hợp nhiều tệp PDF thành một.
- Tối Ưu Hóa Tài Nguyên: Xóa bỏ phông chữ và hình ảnh trùng lặp trong quá trình ghép.
- Xử Lý Lô: Ghép các lô tài liệu PDF lớn trong một lần.
- Ghép An Toàn: Đảm bảo tính toàn vẹn của tài liệu mà không mất dữ liệu hoặc gây hư hỏng nội dung.
Cách Ghép Tài Liệu PDF
Để ghép nhiều tài liệu PDF thành một tập tin duy nhất, làm theo các bước sau:
- Tạo một thể hiện của lớp
Merger
. - Tạo một thể hiện của
MergeOptions
để cấu hình quá trình ghép. - Thêm các tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quá trình ghép bằng phương thức
Process
.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Thêm các tệp PDF đầu vào để ghép
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
9
10// Đặt đường dẫn tệp đầu ra
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));
12
13// Ghép các PDF
14merger.Process(mergeOptions);
Cách Ghép PDF với Phạm Vi Trang
Bạn cũng có thể ghép các phạm vi trang cụ thể từ các tệp PDF đầu vào bằng cách sử dụng lớp MergeOptions
. Điều này cho phép bạn kết hợp các trang được chọn vào tài liệu đầu ra cuối cùng.
- Tạo một thể hiện của lớp
Merger
. - Cấu hình các phạm vi trang bằng
MergeOptions
. - Thêm các tệp đầu vào với các phạm vi trang đã chỉ định.
- Đặt đường dẫn đầu ra.
- Gọi phương thức
Process
.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Ghép các trang cụ thể từ các PDF đầu vào
6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));
7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));
8
9// Đặt đường dẫn tệp đầu ra
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));
11
12// Ghép các PDF
13merger.Process(mergeOptions);
Cách Xử Lý Ghép Lô
Plugin Trình Ghép PDF được tối ưu hóa để xử lý các lô lớn tài liệu PDF. Bằng cách tận dụng tính năng xử lý lô, bạn có thể ghép hàng trăm PDF trong một thao tác duy nhất, đảm bảo quản lý tài liệu hiệu quả và nhanh chóng.
- Tạo một thể hiện của lớp
Merger
. - Thêm tất cả các tệp PDF đầu vào vào lớp
MergeOptions
. - Đặt đường dẫn đầu ra.
- Gọi phương thức
Process
để ghép tất cả các tệp trong lô.
1
2var merger = new Merger();
3var mergeOptions = new MergeOptions();
4
5// Thêm một lô lớn các PDF để ghép
6for (int i = 1; i <= 100; i++)
7{
8 mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));
9}
10
11// Đặt đường dẫn tệp đầu ra
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));
13
14// Xử lý việc ghép lô
15merger.Process(mergeOptions);
Trình Thêm Dấu Thời Gian PDF
Trình Thêm Dấu Thời Gian PDF Documentize cho .NET là một công cụ mạnh mẽ được thiết kế để thêm dấu thời gian bảo mật vào tài liệu PDF của bạn. Nó nâng cao tính toàn vẹn và xác thực của tài liệu bằng cách cung cấp một tham chiếu thời gian đáng tin cậy, đảm bảo tuân thủ các tiêu chuẩn chữ ký kỹ thuật số.
Tính Năng Nổi Bật:
- Thêm Dấu Thời Gian Bảo Mật: Dễ dàng thêm dấu thời gian bảo mật vào tài liệu PDF của bạn.
- Máy Chủ Dấu Thời Gian Tùy Chỉnh: Sử dụng các URL máy chủ dấu thời gian tùy chỉnh và thông tin xác thực.
- Tự Động Hóa: Tích hợp quy trình thêm dấu thời gian vào các ứng dụng .NET của bạn để tự động hóa công việc.
- Tuân Thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn ngành về chữ ký kỹ thuật số và dấu thời gian.
Cách Thêm Dấu Thời Gian vào Tài Liệu PDF
Để thêm dấu thời gian bảo mật vào một tài liệu PDF, hãy thực hiện theo các bước sau:
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
để cấu hình quy trình thêm dấu thời gian. - Thêm tệp PDF đầu vào bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn tệp đầu ra bằng cách sử dụng
AddOutput
. - Thực hiện quy trình thêm dấu thời gian bằng cách sử dụng phương thức
Process
.
1
2// Khởi tạo plugin Dấu Thời Gian
3var plugin = new Timestamp();
4
5// Cấu hình các tùy chọn thêm dấu thời gian
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Chỉ định tệp PDF đầu ra
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// Thực hiện quy trình thêm dấu thời gian
15plugin.Process(opt);
Cách Sử Dụng Xác Thực Tùy Chỉnh với Máy Chủ Dấu Thời Gian
Bạn có thể cung cấp thông tin xác thực xác thực cơ bản khi kết nối với máy chủ dấu thời gian. Điều này cho phép bạn xác thực với các máy chủ yêu cầu tên người dùng và mật khẩu.
- Tạo một thể hiện của lớp
Timestamp
. - Tạo một thể hiện của
AddTimestampOptions
, bao gồm serverBasicAuthCredentials
. - Thêm tệp đầu vào và đường dẫn tệp đầu ra.
- Gọi phương thức
Process
.
1
2// Khởi tạo plugin Dấu Thời Gian
3var plugin = new Timestamp();
4
5// Cấu hình các tùy chọn thêm dấu thời gian với xác thực
6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
7
8// Thêm tệp PDF đầu vào
9opt.AddInput(new FileDataSource("path_to_pdf"));
10
11// Chỉ định tệp PDF đầu ra
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));
13
14// Thực hiện quy trình thêm dấu thời gian
15plugin.Process(opt);
Xử Lý Các Tệp PFX và Mật Khẩu
Lớp AddTimestampOptions
cho phép bạn sử dụng tệp PFX cho việc ký kỹ thuật số cùng với mật khẩu.
- Luồng hoặc Đường Dẫn Tệp PFX: Bạn có thể cung cấp một luồng hoặc đường dẫn tệp đến tệp PFX.
- Bảo Mật Mật Khẩu: Đảm bảo bạn quản lý mật khẩu cho tệp PFX một cách an toàn.
Câu Hỏi Thường Gặp
Câu hỏi thường gặp này cung cấp thông tin toàn diện liên quan đến các tính năng và chức năng của Documentize .NET Plugins, bao gồm các khía cạnh như chuyển đổi PDF, xử lý biểu mẫu, và tạo mục lục (TOC).
Câu Hỏi Chung
1. Documentize for .NET là gì?
Documentize for .NET là một thư viện mạnh mẽ để quản lý và xử lý tài liệu PDF một cách lập trình. Nó bao gồm các plugin để chuyển đổi PDF sang các định dạng khác nhau, chỉnh sửa các biểu mẫu PDF, thêm chữ ký điện tử, tạo TOC, và đảm bảo tuân thủ PDF/A cho lưu trữ lâu dài.
2. Làm thế nào để tôi cài đặt các plugin Documentize cho .NET?
Bạn có thể cài đặt các plugin Documentize bằng cách tải xuống các tệp assembly từ trang web chính thức hoặc lấy gói trực tiếp từ NuGet. Hướng dẫn cài đặt chi tiết có sẵn trong tài liệu của từng plugin.
Các Plugin Chuyển Đổi PDF
3. Làm thế nào để tôi chuyển đổi tài liệu PDF sang tệp Word (DOC/DOCX)?
Để chuyển đổi tài liệu PDF sang định dạng Word sử dụng PDF to DOC Converter:
- Khởi tạo lớp
PdfDoc
. - Tạo một đối tượng
PdfToDocOptions
để cấu hình tùy chọn chuyển đổi. - Thêm đường dẫn tệp PDF đầu vào và tệp DOC/DOCX đầu ra.
- Gọi phương thức
Process
để thực hiện chuyển đổi.
4. Làm thế nào để tôi chuyển đổi các trang PDF thành hình ảnh JPEG?
Sử dụng PDF to JPEG Converter:
- Tạo một phiên bản của lớp
Jpeg
. - Đặt tùy chọn chuyển đổi (ví dụ: độ phân giải, phạm vi trang) thông qua
JpegOptions
. - Thêm đường dẫn tệp đầu vào/đầu ra.
- Gọi phương thức
Jpeg.Process
để thực hiện chuyển đổi.
5. Làm thế nào để tôi chuyển đổi PDF sang PNG?
Để chuyển đổi PDF sang định dạng PNG:
- Tạo một phiên bản của lớp
Png
và một đối tượng PngOptions
. - Thêm PDF đầu vào và chỉ định thư mục đầu ra.
- Đặt tùy chọn như độ phân giải (ví dụ: 300 DPI).
- Gọi phương thức
Process
để tạo hình ảnh PNG.
6. Làm thế nào để tôi chuyển đổi PDF sang Excel (XLS/XLSX)?
Để chuyển đổi PDF sang Excel:
- Khởi tạo lớp
PdfXls
. - Sử dụng
PdfToXlsOptions
để cấu hình đường dẫn đầu vào/đầu ra và tùy chọn chuyển đổi. - Gọi phương thức
Process
để bắt đầu chuyển đổi.
7. Làm thế nào để tôi chuyển đổi PDF sang HTML?
Để chuyển đổi tài liệu PDF thành HTML:
- Tạo một phiên bản của lớp
PdfHtml
. - Cấu hình các tùy chọn chuyển đổi với
PdfToHtmlOptions
hoặc HtmlToPdfOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
Xử Lý Biểu Mẫu PDF
8. Làm thế nào để tôi chỉnh sửa các biểu mẫu PDF bằng Trình Chỉnh Sửa Biểu Mẫu?
PDF Form Editor cung cấp khả năng để:
- Thêm trường (
FormEditorAddOptions
). - Cập nhật trường (
FormEditorSetOptions
). - Xóa trường (
FormRemoveSelectedFieldsOptions
).
Sau khi cấu hình các trường biểu mẫu, chạy phương thức Process
.
9. Làm thế nào để tôi làm phẳng các biểu mẫu PDF?
Để làm phẳng các trường biểu mẫu:
- Khởi tạo lớp
FormFlattener
. - Sử dụng
FormFlattenAllFieldsOptions
để làm phẳng tất cả các trường hoặc FormFlattenSelectedFieldsOptions
để nhắm mục tiêu vào các trường cụ thể. - Thêm các tệp đầu vào/đầu ra và gọi phương thức
Process
.
10. Làm thế nào để tôi xuất dữ liệu từ các biểu mẫu PDF?
Để xuất dữ liệu biểu mẫu, sử dụng PDF Form Exporter. Tạo một đối tượng FormExporterValuesToCsvOptions
, chỉ định điều kiện trường biểu mẫu, và chạy phương thức Process
để xuất dữ liệu vào định dạng CSV.
Quản Lý PDF/A và TOC
11. Làm thế nào để tôi chuyển đổi PDF sang định dạng PDF/A?
Để chuyển đổi PDF sang PDF/A:
- Sử dụng lớp
PdfAConverter
. - Cấu hình phiên bản PDF/A (ví dụ: PDF/A-3B) trong
PdfAConvertOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
12. Làm thế nào để tôi tạo một Mục Lục (TOC) trong PDF?
Để tạo một TOC:
- Tạo một phiên bản của lớp
TocGenerator
. - Sử dụng
TocOptions
để xác định các tham số TOC. - Thêm các tệp đầu vào/đầu ra và chạy phương thức
Process
.
Xử Lý Chữ Ký
13. Làm thế nào để tôi ký điện tử tài liệu PDF?
Để thêm chữ ký điện tử:
- Khởi tạo lớp
Signature
. - Sử dụng
SignOptions
để cấu hình tệp PFX, mật khẩu và chi tiết chữ ký (ví dụ: lý do, thông tin liên hệ). - Thêm các tệp đầu vào/đầu ra và chạy phương thức
Process
.
Các Tính Năng Bổ Sung
14. Tôi có thể tách các tệp PDF bằng cách sử dụng Documentize không?
Có, sử dụng PDF Splitter:
- Khởi tạo lớp
Splitter
. - Cấu hình tùy chọn tách sử dụng
SplitOptions
. - Thêm đường dẫn đầu vào/đầu ra và gọi phương thức
Process
.
15. Làm thế nào để tôi gộp nhiều tệp PDF thành một?
Để gộp PDF:
- Khởi tạo lớp
Merger
. - Thêm các tệp PDF đầu vào và chỉ định một tệp đầu ra thông qua
MergeOptions
. - Chạy phương thức
Process
để gộp các tệp lại.
16. Documentize có giới hạn chỉ làm việc với PDF không?
Trong khi Documentize chủ yếu tập trung vào việc thao tác với PDF, nó cũng hỗ trợ chuyển đổi tới và từ các định dạng như DOC, XLS, HTML, JPEG, và PNG.
Giấy Phép và Tính Tương Thích
17. Yêu cầu hệ thống để sử dụng các plugin Documentize là gì?
Documentize hỗ trợ:
- Hệ điều hành: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), và Linux.
- Khung: .NET Framework từ 4.0 đến 8.0.
- IDE: Tương thích với nhiều phiên bản của Visual Studio.
18. Làm thế nào để tôi đặt khóa giấy phép cho Documentize?
Để kích hoạt một plugin, tham chiếu Documentize trong dự án của bạn và đặt các khóa giấy phép trước khi gọi bất kỳ phương thức nào. Tham khảo tài liệu của plugin cụ thể để biết hướng dẫn chi tiết.
19. Tôi có thể tìm thấy thêm các ví dụ và tài liệu cho các plugin Documentize ở đâu?
Tài liệu API đầy đủ và các ví dụ có thể được tìm thấy trên trang web Documentize hoặc thông qua các gói NuGet trong môi trường phát triển của bạn.