Tổng quan

Documentize là một nền tảng toàn diện cung cấp SDKs để quản lý tài liệu PDF trong các ứng dụng .NET. Những SDK này đơn giản hóa các nhiệm vụ phức tạp liên quan đến việc xử lý PDF, nâng cao quy trình làm việc với tài liệu và làm cho chúng trở nên trực quan hơn và hiệu quả hơn cho người dùng. Dưới đây là cái nhìn tổng quan về các khả năng chính của nó:

Tính năng chính

  • Chuyển đổi PDF:

    • Chuyển đổi PDF sang nhiều định dạng khác nhau như Microsoft Word (DOC/DOCX), Excel (XLS/XLSX), HTML, JPEG và PNG.
    • Hỗ trợ chuyển đổi PDF sang định dạng PDF/A, lý tưởng cho việc lưu trữ lâu dài và tuân thủ các tiêu chuẩn bảo tồn.
  • Xử lý tài liệu:

    • Gộp và Chia PDF: Dễ dàng kết hợp nhiều tệp PDF hoặc chia các tài liệu lớn thành các phần nhỏ hơn, dễ quản lý hơn.
    • Tối ưu hóa PDF: Nén và cải thiện các tài liệu PDF để giảm kích thước tệp mà không làm giảm chất lượng nội dung.
  • Trích xuất văn bản:

    • Trích xuất văn bản một cách chính xác, hỗ trợ cả định dạng dữ liệu có cấu trúc và không có cấu trúc.
  • Chữ ký điện tử:

    • Ký điện tử các tài liệu PDF để đảm bảo tính xác thực và toàn vẹn của chúng, cung cấp sự bảo mật và tin cậy cho các tệp nhạy cảm.

SDKs Chuyên biệt

  • Chuyển đổi PDF sang DOC: Chuyển đổi chính xác nội dung PDF thành các tài liệu Word có thể chỉnh sửa trong khi vẫn giữ nguyên định dạng và bố cục.
  • Chuyển đổi PDF sang Excel: Trích xuất dữ liệu bảng từ PDF và chuyển đổi nó thành bảng tính Excel để phân tích dữ liệu sâu hơn.
  • Tích hợp ChatGPT: Cho phép tương tác với ChatGPT, nhúng các phản hồi AI đối thoại vào trong PDF để cải thiện tài liệu một cách độc đáo.

Sử dụng & Tính tương thích

Các SDK Documentize được xây dựng để tích hợp mượt mà vào các ứng dụng .NET, hỗ trợ nhiều nền tảng bao gồm Windows, macOS, và Linux. Các SDK cung cấp API linh hoạt và mạnh mẽ đáp ứng các yêu cầu xử lý tài liệu đa dạng trong khi vẫn đảm bảo hiệu suất và độ tin cậy cao.

Để biết thêm thông tin chi tiết về các SDK và việc tích hợp chúng vào các dự án của bạn, truy cập vào website chính thức.

Tiểu mục của Tổng quan

Cài đặt

SDK Documentize có thể được cài đặt thông qua nhiều phương pháp, mỗi phương pháp được thiết kế để phù hợp với các môi trường phát triển và sở thích khác nhau. Dưới đây là các cách được khuyến nghị để cài đặt Documentize:

1. NuGet (Phương pháp ưa chuộng)

NuGet là phương pháp đơn giản và được ưa chuộng nhất để cài đặt Documentize, đảm bảo rằng bạn luôn có phiên bản và cập nhật mới nhất ngay trong môi trường phát triển của bạn. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng NuGet.

2. Trình cài đặt MSI

Trình cài đặt MSI là một tùy chọn thuận tiện nếu bạn muốn có các DLL của Documentize được cài đặt trực tiếp lên hệ thống của bạn. Phương pháp này lý tưởng cho các nhà phát triển có thể muốn sử dụng Documentize cho nhiều dự án mà không cần phải quản lý các tệp DLL thủ công. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng MSI.

3. Tệp ZIP

Đối với các nhà phát triển thích cách tiếp cận thủ công, tệp ZIP chứa các DLL của Documentize, có thể được giải nén và thêm vào dự án của bạn trực tiếp. Xem thêm chi tiết về phương pháp cài đặt này tại Cách cài đặt SDK Documentize bằng ZIP.

25 thg 7, 2025

Tiểu mục của Cài đặt

Yêu Cầu Hệ Thống

Documentize SDKs được thiết kế để tích hợp với các ứng dụng .NET và hỗ trợ nhiều hệ điều hành cùng môi trường phát triển khác nhau. Dưới đây là các yêu cầu hệ thống chính:

Hệ Điều Hành Hỗ Trợ

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 đến Windows Server 2022 (x64, x86)
  • Cloud: Microsoft Azure

macOS

  • macOS 10.12 (Sierra) và các phiên bản mới hơn

Linux

  • Tương thích với nhiều bản phân phối Linux:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Hỗ trợ Android 8.0 (Oreo) và các phiên bản mới hơn.

Môi Trường Phát Triển

  • Microsoft Visual Studio:
    • Visual Studio 2010 và các phiên bản mới hơn (bao gồm 2019 và 2022)
  • Hỗ trợ bất kỳ môi trường phát triển nào nhắm vào các nền tảng .NET.

Các Framework .NET Hỗ Trợ

  • .NET Framework 4.0 và cao hơn
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

Lưu Ý Bổ Sung

  • Adobe Acrobat không cần thiết để chạy Documentize SDKs, nhưng được khuyến nghị để xem PDF.
25 thg 7, 2025

Declaration

Documentize.com SDK yêu cầu một tập quyền Full Trust khi được sử dụng trong các ứng dụng .NET. Mức quyền này là điều cần thiết cho các SDK để thực hiện các thao tác cấp hệ thống nhất định, chẳng hạn như truy cập cài đặt đăng ký, tệp hệ thống và phân tích phông chữ.

Tại sao cần Full Trust

Các SDK của Documentize sử dụng các lớp hệ thống .NET cốt lõi, thường cần quyền cao hơn vì những lý do sau:

  • Truy cập Đăng ký: Một số thao tác có thể yêu cầu đọc hoặc ghi vào đăng ký hệ thống.
  • Tệp Hệ thống: Truy cập vào các tệp hệ thống ngoài thư mục ảo của ứng dụng có thể là cần thiết cho một số nhiệm vụ, chẳng hạn như xử lý phông chữ hoặc thực hiện các thao tác tệp.

Hạn chế của Môi trường Medium Trust

Trong các môi trường lưu trữ áp dụng bảo mật Medium Trust, một số quyền quan trọng bị hạn chế hoặc không có sẵn. Điều này có thể khiến các SDK không hoạt động đúng trong những môi trường như vậy. Các hạn chế sau đây áp dụng theo Medium Trust:

  • OleDbPermission: Không thể sử dụng nhà cung cấp dữ liệu OLE DB quản lý ADO.NET để truy cập cơ sở dữ liệu.
  • EventLogPermission: Cấm truy cập vào Nhật ký Sự kiện Windows.
  • ReflectionPermission: Ngăn cản việc sử dụng phản chiếu, điều này có thể ảnh hưởng đến một số thao tác động.
  • RegistryPermission: Truy cập vào đăng ký hệ thống bị từ chối.
  • WebPermission: Giao tiếp bị hạn chế cho các địa chỉ hoặc phạm vi được định nghĩa trước như đã cấu hình trong phần <trust>.
  • FileIOPermission: Truy cập vào các tệp bị giới hạn trong thư mục ảo của ứng dụng.
25 thg 7, 2025

Môi Trường Không Phải Windows

Documentize SDKs hỗ trợ .NET Standard 2.0, cho phép chúng được sử dụng trong các ứng dụng .NET Core chạy trên Linux hoặc các môi trường không phải Windows khác. Để đảm bảo hiệu suất tối ưu và hiển thị văn bản chính xác, hãy làm theo các bước dưới đây:

Cài Đặt Được Đề Xuất cho Linux

1. Cài Đặt Gói libgdiplus

Gói này cung cấp chức năng GDI+ cần thiết, rất quan trọng cho việc tạo và xử lý PDF. Bạn có thể cài đặt nó bằng cách chạy lệnh sau trong terminal của bạn:

sudo apt-get install libgdiplus

2. Cài Đặt Phông Chữ Tương Thích với Microsoft

Để hiển thị văn bản chính xác, hãy cài đặt phông chữ TrueType của Microsoft bằng cách sử dụng lệnh:

sudo apt-get install ttf-mscorefonts-installer

Các phông chữ này nên được đặt trong thư mục /usr/share/fonts/truetype/msttcorefonts. Nếu hệ thống của bạn lưu trữ phông chữ ở một thư mục khác, hãy cập nhật đường dẫn trong mã của bạn trước khi thực hiện bất kỳ thao tác nào với Documentize SDKs:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<đường dẫn đến phông chữ ms>"));

Mẹo vặt

Bằng cách đảm bảo rằng các cài đặt này đã hoàn tất và cấu hình đường dẫn phông chữ một cách chính xác, bạn có thể tối đa hóa hiệu suất của Documentize SDKs trên Linux hoặc các hệ thống không phải Windows khác.

25 thg 7, 2025

Giấy phép và Đánh giá

Đánh giá Documentize cho .NET

Khi bạn bắt đầu làm việc với các sản phẩm Documentize, bạn có thể sử dụng chúng ngay lập tức với giấy phép đánh giá miễn phí. Giấy phép này cho phép các nhà phát triển và doanh nghiệp khám phá, thử nghiệm và tích hợp các tính năng của Documentize vào ứng dụng của họ trước khi thực hiện mua hàng.

Giấy phép đánh giá là gì?

Giấy phép đánh giá là chế độ thử nghiệm không giới hạn thời gian được tích hợp sẵn trong mọi sản phẩm Documentize. Nó cho bạn quyền truy cập vào hầu hết các tính năng cơ bản để bạn có thể đánh giá đầy đủ khả năng của sản phẩm trong các tình huống thực tế. Cho dù bạn đang tạo, chỉnh sửa hoặc chuyển đổi tài liệu, bạn có thể kiểm tra hiệu suất và tích hợp với công nghệ của bạn.

Các tính năng chính của Giấy phép đánh giá

  • Không cần cài đặt – Chỉ cần tải xuống và bắt đầu sử dụng các sản phẩm Documentize.
  • 🧪 Khám phá chức năng cốt lõi – Thử nghiệm các tính năng thiết yếu như chuyển đổi tài liệu, thao tác và xuất khẩu.
  • 💻 Thân thiện với nhà phát triển – Thích hợp cho chứng minh khái niệm (POC), thử nghiệm tích hợp hoặc đánh giá kỹ thuật.
  • 🔁 Dễ dàng nâng cấp – Chuyển sang giấy phép đầy đủ bất cứ lúc nào mà không cần thay đổi triển khai của bạn.

Nếu bạn muốn nâng cấp lên giấy phép đầy đủ, bạn cần thêm mã sau:

License.Set("path_to_your_license_file.lic");

Giới hạn của Chế độ Đánh giá

Trong khi giấy phép đánh giá cung cấp quyền truy cập rộng rãi, có một số giới hạn được thiết kế để bảo vệ sản phẩm có giấy phép:

  • Tất cả các trang trong các tài liệu PDF được tạo đều có dấu bản quyền.
  • Trong phiên bản đánh giá, bạn chỉ có thể xử lý bốn trang đầu tiên của một tài liệu.
  • Giấy phép đánh giá không dành cho triển khai sản xuất hoặc thương mại.

Để có quyền truy cập đầy đủ mà không bị hạn chế, bạn cần phải mua một giấy phép Documentize hợp lệ và áp dụng nó trong dự án của bạn.

Cách bắt đầu sử dụng Giấy phép Đánh giá

Không cần thiết lập đặc biệt. Chỉ cần tải xuống SDK Documentize mà bạn mong muốn và bắt đầu làm việc với nó. Nếu không có tệp giấy phép nào được áp dụng, sản phẩm sẽ tự động chạy ở chế độ đánh giá.

Để kiểm tra hành vi với giấy phép hợp lệ, bạn cũng có thể yêu cầu một giấy phép tạm thời đầy đủ tính năng để đánh giá sâu.

Khi nào nên sử dụng Giấy phép Đánh giá

Bạn nên sử dụng giấy phép đánh giá nếu:

  • Bạn đang khám phá khả năng của Documentize lần đầu tiên.
  • Bạn muốn xác nhận tính tương thích với ứng dụng hoặc nền tảng của bạn.
  • Bạn cần xây dựng một nguyên mẫu hoặc chứng minh khái niệm trước khi mua hàng.
  • Bạn đang so sánh các giải pháp tự động hóa tài liệu.

Bắt đầu với Documentize Ngày hôm Nay

Đánh giá các sản phẩm Documentize mà không lo rủi ro và xem cách chúng có thể cải thiện quy trình làm việc của bạn với tài liệu. Khi bạn sẵn sàng chuyển sang sản xuất, việc nâng cấp lên giấy phép đầy đủ nhanh chóng và liền mạch.

📘 Cần trợ giúp? Truy cập Tài liệu của chúng tôi hoặc Liên hệ với chúng tôi để được hỗ trợ.

15 thg 8, 2025

Hướng Dẫn Dành Cho Nhà Phát Triển

PDF Converter

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF sang DOC

Chuyển đổi PDF sang tài liệu Word với công cụ .NET của Documentize — giữ nguyên định dạng và cấu trúc để dễ dàng chỉnh sửa.

PDF sang HTML

Chuyển PDF sang HTML bằng các công cụ .NET của Documentize—giữ nguyên bố cục và định dạng để đạt kết quả nhất quán, chuyên nghiệp.

PDF sang JPEG

Chuyển đổi PDF sang ảnh JPEG với các công cụ .NET của Documentize — trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.

PDF sang PDF/A

Chuyển đổi PDF sang định dạng PDF/A với công cụ .NET của Documentize — đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.

PDF to PNG

Chuyển đổi PDF sang hình ảnh PNG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho web và đồ họa.

PDF sang TIFF

Chuyển đổi PDF sang ảnh TIFF với công cụ .NET của Documentize — trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.

PDF to XLS

Chuyển đổi PDF sang Excel với công cụ .NET của Documentize — khai thác bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.

PDF Extractor

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Trích xuất hình ảnh

Trích xuất hình ảnh một cách dễ dàng từ tài liệu PDF trong các ứng dụng .NET

Trích xuất thuộc tính / Siêu dữ liệu

Trích xuất siêu dữ liệu từ các tệp PDF một cách chính xác với Documentize bằng C#/.NET

Xuất Dữ Liệu Biểu Mẫu

Trích xuất và xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang các định dạng khác như CSV bằng C#/.NET

PDF Manager

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Tách PDF

Tách PDF một cách dễ dàng với các công cụ .NET của Documentize — trích xuất các trang, tạo tệp mới và quản lý tài liệu một cách chính xác

Nén PDF

Nén các tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thay đổi kích thước trang của PDF

Thay đổi kích thước trang của tài liệu PDF một cách dễ dàng với Documentize PDF Manager

Tối ưu PDF

Tối ưu PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, nâng cao hiệu năng và duy trì chất lượng

Xoay Trang PDF

Xoay các trang tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thêm Bảng

Tạo các bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.

Thêm TOC

Cải thiện việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC)

Use ChatGPT

Nâng cao tài liệu PDF của bạn với AI bằng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.

PDF Security

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Giải mã

Giải mã các tệp PDF của bạn bằng công cụ .NET của Documentize để mở tài liệu.

Ký điện tử các tệp PDF bằng các công cụ .NET của Documentize — đảm bảo an ninh, tính xác thực và tuân thủ một cách dễ dàng.

Mẫu PDF

Làm phẳng các trường biểu mẫu

Chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép

Làm phẳng các trường biểu mẫu

Chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép

25 thg 7, 2025

Tiểu mục của Hướng Dẫn Dành Cho Nhà Phát Triển

PDF Converter

HTML to PDF

Convert HTML to PDF with Documentize's .NET tools—preserve layout and formatting for consistent, professional results.

PDF sang DOC

Chuyển đổi PDF sang tài liệu Word với công cụ .NET của Documentize — giữ nguyên định dạng và cấu trúc để dễ dàng chỉnh sửa.

PDF sang HTML

Chuyển PDF sang HTML bằng các công cụ .NET của Documentize—giữ nguyên bố cục và định dạng để đạt kết quả nhất quán, chuyên nghiệp.

PDF sang JPEG

Chuyển đổi PDF sang ảnh JPEG với các công cụ .NET của Documentize — trích xuất hình ảnh chất lượng cao từ tài liệu của bạn một cách dễ dàng.

PDF sang PDF/A

Chuyển đổi PDF sang định dạng PDF/A với công cụ .NET của Documentize — đảm bảo lưu trữ lâu dài và tuân thủ dễ dàng.

PDF to PNG

Chuyển đổi PDF sang hình ảnh PNG với công cụ .NET của Documentize—trích xuất hình ảnh chất lượng cao cho web và đồ họa.

PDF sang TIFF

Chuyển đổi PDF sang ảnh TIFF với công cụ .NET của Documentize — trích xuất hình ảnh độ phân giải cao cho quản lý tài liệu chuyên nghiệp.

PDF to XLS

Chuyển đổi PDF sang Excel với công cụ .NET của Documentize — khai thác bảng và dữ liệu nhanh chóng để phân tích và xử lý liền mạch.

Tiểu mục của PDF Converter

HTML to PDF

The Documentize PDF Converter for .NET cung cấp khả năng mạnh mẽ để chuyển đổi tài liệu giữa định dạng HTML sang PDF, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, trình chuyển đổi thích ứng với các yêu cầu dự án đa dạng.

Chuyển đổi HTML sang PDF

Biến nội dung HTML thành các file PDF chất lượng cao, phù hợp cho việc tạo báo cáo có thể in, lưu trữ nội dung web hoặc tạo định dạng tài liệu có thể chia sẻ. Để chuyển đổi một tài liệu HTML sang PDF, thực hiện các bước sau:

  1. Cấu hình tùy chọn: Sử dụng HtmlToPdfOptions để định nghĩa cài đặt bố cục và phương tiện.
  2. Chỉ định đường dẫn: Đặt đường dẫn file HTML đầu vào và đường dẫn file PDF đầu ra.
  3. Thực hiện chuyển đổi: Gọi phương thức Convert của PdfConverter để thực hiện chuyển đổi.

Ví dụ: Chuyển đổi HTML sang PDF

1// Create HtmlToPdfOptions
2var options = new HtmlToPdfOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_input.html"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.pdf"));
7//Perform the process
8PdfConverter.Convert(options);

Các tùy chọn bổ sung cho chuyển đổi HTML sang PDF

  • Loại phương tiện:

    • HtmlMediaType.Print: Thích hợp để tạo PDF phù hợp cho việc in ấn.
    • HtmlMediaType.Screen: Dùng khi chuyển đổi nội dung được thiết kế cho hiển thị trên thiết bị kỹ thuật số.
  • Điều chỉnh bố cục:

    • PageLayoutOption: Điều chỉnh cách nội dung HTML khớp với bố cục PDF, như ScaleToPageWidth để đảm bảo nội dung mở rộng theo chiều rộng của PDF.
    • IsRenderToSinglePage: Cho phép render toàn bộ nội dung HTML trên một trang PDF duy nhất nếu cần trình bày ngắn gọn.

Trình chuyển đổi này linh hoạt cho nhiều ứng dụng, từ việc tạo báo cáo PDF dựa trên nội dung web đến chuyển đổi các kho lưu trữ tài liệu PDF để truy cập qua web. Để biết cấu hình nâng cao hơn, hãy tham khảo tài liệu đầy đủ của Documentize.

PDF sang DOC

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng DOC. Thành phần này chuyển đổi các trang PDF một cách mượt mà thành tài liệu Microsoft Word có thể chỉnh sửa, giúp dễ dàng tái sử dụng, chỉnh sửa và chia sẻ nội dung trên nhiều nền tảng.

Cách chuyển PDF sang DOC

Để chuyển đổi tài liệu PDF sang định dạng DOC, thực hiện các bước sau:

  1. Tạo một thực thể của PdfToDocOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm đường dẫn tệp đầu ra cho tệp kết quả bằng phương thức AddOutput.
  4. Chạy phương thức Convert để thực hiện chuyển đổi.
1// Create PdfToDocOptions object to set instructions
2var options = new PdfToDocOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_file.doc"));
7// Perform the process
8PdfConverter.Convert(options);

Chuyển PDF sang DOC với tùy chọn tùy chỉnh

Plugin PDF to DOC Converter cung cấp một số tùy chọn để tùy chỉnh quá trình chuyển đổi của bạn. Bạn có thể chọn giữa các chế độ khác nhau để kiểm soát cách bố cục và cấu trúc của PDF được xử lý trong quá trình chuyển đổi.

 1// Create PdfToDocOptions object to set instructions
 2var options = new PdfToDocOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output file path
 6options.AddOutput(new FileData("path_to_result_file.doc"));
 7// Set Mode
 8options.Mode = DocConversionMode.Flow;
 9// Perform the process
10PdfConverter.Convert(options);

Tính năng chính:

  • Chuyển đổi DOC: Chuyển đổi tài liệu PDF sang định dạng Microsoft Word có thể chỉnh sửa (DOC).
  • Giữ nguyên định dạng: Duy trì bố cục, văn bản và định dạng gốc trong quá trình chuyển đổi.

PDF sang HTML

The Documentize PDF Converter for .NET cung cấp các khả năng mạnh mẽ để chuyển đổi tài liệu PDF sang định dạng HTML, lý tưởng cho các ứng dụng web, lưu trữ và tạo báo cáo. Với nhiều tùy chọn xử lý tài nguyên và bố cục, bộ chuyển đổi có thể thích nghi với các yêu cầu dự án khác nhau.

Chuyển đổi PDF sang HTML

Chuyển các tập tin PDF sang HTML để làm cho tài liệu có thể truy cập qua web hoặc tích hợp vào các ứng dụng nơi định dạng HTML được ưa thích.

  1. Cấu hình tùy chọn: Sử dụng PdfToHtmlOptions để tùy chỉnh đầu ra, chọn tài nguyên được nhúng hoặc tách ra.
  2. Xác định đường dẫn đầu vào và đầu ra: Đặt đường dẫn cho PDF đầu vào và HTML đầu ra.
  3. Thực thi quá trình chuyển đổi: Gọi phương thức Convert của PdfConverter để thực hiện chuyển đổi.

Example: Convert PDF to HTML with Embedded Resources

1// Create PdfToHtmlOptions object to set output data type as file with embedded resources
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3// Add input file path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_output.html"));
7//Perform the process
8PdfConverter.Convert(options);

Các tùy chọn có sẵn cho việc chuyển đổi PDF sang HTML

  • SaveDataType:
    • FileWithEmbeddedResources: Tạo một tệp HTML duy nhất với tất cả tài nguyên được nhúng.
    • FileWithExternalResources: Lưu tài nguyên riêng biệt, thích hợp cho các tệp HTML lớn.

PDF sang JPEG

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ giúp đơn giản hoá việc chuyển đổi tài liệu PDF sang ảnh JPEG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn dễ tiếp cận hơn trên các nền tảng bằng cách biến các trang PDF thành các định dạng ảnh được sử dụng rộng rãi.

Cách chuyển đổi các trang PDF sang JPEG

Để chuyển đổi một tài liệu PDF thành các ảnh JPEG, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToJpegOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các ảnh JPEG bằng phương thức AddOutput.
  4. Gọi phương thức Convert để chuyển đổi các trang PDF thành ảnh JPEG.
1// Create PdfToJpegOptions object to set instructions
2var options = new PdfToJpegOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh chuyển đổi PDF sang JPEG

Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, chọn phạm vi trang, hoặc thiết lập chất lượng ảnh. Dưới đây là cách chuyển trang đầu tiên của PDF với độ phân giải 200 DPI:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToJpegOptions();
 3// Process only the first page
 4options.PageList = [1];
 5// Set output resolution to 200 DPI
 6options.OutputResolution = 200;
 7// Set output quality to 50
 8options.Quality = 50;
 9// Add input File path
10options.AddInput(new FileData("path_to_input.pdf"));
11// Set output Directory path
12options.AddOutput(new DirectoryData("path_to_output_directory"));
13// Perform the process
14PdfConverter.Convert(options);

Cách lấy kết quả mà không cần thư mục, hoặc dưới dạng luồng

Phương thức Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng của các tệp JPEG đã chuyển đổi như sau:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToJpegOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Chuyển đổi PDF sang JPEG: Dễ dàng chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh JPEG.
  • Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
  • Chọn trang: Lựa chọn các trang cụ thể để chuyển đổi.
  • Chuyển đổi nhanh: Quá trình nhanh chóng và hiệu quả với ít công sức.

PDF sang PDF/A

The Documentize PDF Converter for .NET là một công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF sang định dạng PDF/A, đảm bảo nội dung của bạn tuân thủ các tiêu chuẩn lưu trữ lâu dài. Thành phần này cũng hỗ trợ kiểm tra tính tuân thủ PDF/A của các tài liệu PDF hiện có, cung cấp cả tính năng chuyển đổi và xác thực trong một giải pháp duy nhất.

Cách chuyển đổi PDF sang PDF/A

Để chuyển đổi một tài liệu PDF sang định dạng PDF/A, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToPdfAOptions để cấu hình việc chuyển đổi.
  2. Chỉ định phiên bản PDF/A mong muốn (ví dụ: PDF/A-3B).
  3. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  4. Thêm tệp đầu ra cho PDF/A được tạo bằng phương thức AddOutput.
  5. Gọi phương thức Convert để thực hiện chuyển đổi.
 1// Create the options class to set up the conversion process
 2var options = new PdfToPdfAOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_3B
 5};
 6
 7// Add the source file
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf")); // replace with your actual file path
 9
10// Add the path to save the converted file
11options.AddOutput(new FileData("path_to_the_converted_file.pdf"));
12
13// Run the conversion
14PdfConverter.Convert(options);

Xác thực tính tuân thủ PDF/A

Bạn có thể xác thực các tệp PDF hiện có để kiểm tra tính tuân thủ PDF/A bằng lớp PdfAValidateOptions.

 1// Create the options class to set up the validation process
 2var options = new PdfAValidateOptions
 3{
 4    PdfAVersion = PdfAStandardVersion.PDF_A_1A
 5};
 6
 7// Add one or more files to be validated
 8options.AddInput(new FileData("path_to_your_first_pdf_file.pdf")); // replace with your actual file path
 9options.AddInput(new FileData("path_to_your_second_pdf_file.pdf"));
10// add more files as needed
11
12// Run the validation and get results
13var resultContainer = PdfConverter.Validate(options);
14
15// Check the resultContainer.ResultCollection property for validation results for each file:
16foreach (var result in resultContainer.ResultCollection)
17{
18    var validationResult = (PdfAValidationResult) result.Data;
19    var isValid = validationResult.IsValid; // Validation result for document
20}

Các tính năng chính:

  • Chuyển đổi sang PDF/A: Biến đổi các tệp PDF thành định dạng PDF/A (như PDF/A-1a, PDF/A-2b, PDF/A-3b) một cách liền mạch để đáp ứng các tiêu chuẩn lưu trữ.
  • Kiểm tra tính tuân thủ PDF/A: Kiểm tra các tài liệu PDF hiện có xem chúng có phù hợp với tiêu chuẩn PDF/A hay không và xác định các vấn đề nếu không tuân thủ.
  • Quy trình làm việc hiệu quả: Tiết kiệm thời gian và công sức với các quá trình chuyển đổi nhanh chóng và đáng tin cậy.

PDF to PNG

The Documentize PDF Converter for .NET là một công cụ tiên tiến cho phép bạn chuyển đổi tài liệu PDF thành hình ảnh PNG chất lượng cao. Thành phần này được thiết kế để làm cho nội dung của bạn trở nên đa dạng hơn, dễ tiếp cận hơn và dễ chia sẻ hơn bằng cách biến các trang PDF thành định dạng hình ảnh được hỗ trợ rộng rãi.

Cách chuyển đổi PDF sang PNG

Để chuyển đổi một tài liệu PDF thành các hình ảnh PNG, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToPngOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương pháp AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các hình ảnh PNG bằng phương pháp AddOutput.
  4. Chạy phương pháp Convert để chuyển các trang PDF thành hình ảnh PNG.
1// Create PdfToPngOptions object to set instructions
2var options = new PdfToPngOptions();
3// Add input File path
4options.AddInput(new FileData("path_to_input.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh chuyển đổi PDF sang PNG

Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải và chọn các trang cụ thể. Ví dụ, để chỉ chuyển đổi trang đầu tiên của một PDF ở độ phân giải 200 DPI:

 1// Create PdfToPngOptions object to set instructions
 2var options = new PdfToPngOptions()
 3// Process only the first page
 4options.PageList = [1];
 5// Set output resolution to 200 DPI
 6options.OutputResolution = 200;
 7// Add input File path
 8options.AddInput(new FileData("path_to_input.pdf"));
 9// Set output Directory path
10options.AddOutput(new DirectoryData("path_to_output_directory"));
11// Perform the process
12PdfConverter.Convert(options);

Xử lý kết quả chuyển đổi

Phương pháp Convert trả về một đối tượng ResultContainer chứa thông tin về kết quả chuyển đổi. Bạn có thể lấy luồng dữ liệu của các tệp PNG đã chuyển đổi như sau:

 1// Create PdfToJpegOptions object to set instructions
 2var options = new PdfToPngOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Convert PDF to PNG: Nhanh chóng và hiệu quả chuyển đổi toàn bộ tài liệu PDF hoặc các trang cụ thể thành hình ảnh PNG.
  • Customizable Resolution: Đặt DPI mong muốn (ví dụ: 300 DPI) để có đầu ra hình ảnh chất lượng cao.
  • Page set: Chọn các trang cụ thể để chuyển đổi.
  • Easy Output Management: Chỉ định thư mục đầu ra cho từng tệp PNG đã chuyển đổi.
  • Quick Conversion: Nhanh, hiệu quả và cần ít công sức cấu hình.

PDF sang TIFF

Documentize PDF Converter for .NET là công cụ mạnh mẽ được thiết kế để chuyển đổi tài liệu PDF thành ảnh TIFF chất lượng cao. Thành phần này đảm bảo nội dung của bạn có thể truy cập trên nhiều nền tảng khác nhau đồng thời duy trì độ trung thực và tính linh hoạt tuyệt vời.
Bạn có thể tùy chỉnh quá trình chuyển đổi bằng cách điều chỉnh độ phân giải, bật xuất đa trang, hoặc chọn các trang cụ thể.

Cách chuyển PDF sang TIFF

Để chuyển đổi tài liệu PDF thành ảnh TIFF, thực hiện các bước sau:

  1. Tạo một thể hiện của PdfToTiffOptions để cấu hình quá trình chuyển đổi.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Chỉ định đường dẫn tệp đầu ra cho các ảnh TIFF bằng phương thức AddOutput.
  4. Gọi phương thức Convert để chuyển các trang PDF thành ảnh TIFF.
1// Create PdfToTiffOptions object to set instructions
2var options = new PdfToTiffOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_output_directory"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh các trang và DPI khi chuyển PDF sang TIFF

Dưới đây là cách chuyển 2 trang của một PDF ở độ phân giải 400 DPI thành tệp TIFF:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Set Pages
 8options.PageList = [1, 3];
 9// Set result image Resolution
10options.OutputResolution = 400;
11// Perform the process
12PdfConverter.Convert(options);

Tạo TIFF đa trang

Plugin hỗ trợ tạo TIFF đa trang, cho phép bạn gộp nhiều trang PDF lại thành một tệp TIFF duy nhất để lưu trữ hoặc in ấn hiệu quả.

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5 // Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Enable Multi-Page TIFF output
 8options.MultiPage = true;
 9// Perform the process
10PdfConverter.Convert(options);

Tùy chỉnh nén và độ sâu màu khi chuyển PDF sang TIFF

Dưới đây là cách thiết lập nén và độ sâu màu cho tệp TIFF:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_output_directory"));
 7// Set Compression and ColorDepth
 8options.Compression = TiffCompression.RLE;
 9options.ColorDepth = TiffColorDepth.Format24bpp;
10// Perform the process
11PdfConverter.Convert(options);

Cách xử lý kết quả chuyển đổi

Phương thức Convert trả về một đối tượng ResultContainer cung cấp chi tiết về kết quả chuyển đổi. Bạn có thể lấy luồng (stream) của các tệp TIFF đã chuyển đổi như sau:

 1// Create PdfToTiffOptions object to set instructions
 2var options = new PdfToTiffOptions();
 3// Add input File path
 4options.AddInput(new FileData("path_to_input.pdf"));
 5// Perform the process
 6var results = PdfConverter.Convert(options);
 7// Get stream results
 8foreach (var result in results.ResultCollection)
 9{
10    var streamResultPage1 = result.ToStream();
11}

Các tính năng chính:

  • Chuyển PDF sang TIFF: Dễ dàng chuyển toàn bộ tài liệu PDF hoặc các trang cụ thể thành ảnh TIFF.
  • Độ phân giải tùy chỉnh: Điều chỉnh độ phân giải (ví dụ: 300 dpi) để có đầu ra chất lượng cao.
  • TIFF đa trang: Kết hợp nhiều trang PDF thành một tệp TIFF đa trang.
  • Chọn trang: Lựa chọn các trang cần chuyển đổi.
  • Chuyển đổi nhanh chóng: Quá trình nhanh và hiệu quả với ít công sức.

PDF to XLS

The Documentize PDF Converter for .NET là một công cụ đa năng và mạnh mẽ để chuyển đổi tài liệu PDF sang bảng tính Excel (XLSX/XLS/CSV/XLSM/ODS). Bằng cách tận dụng thành phần này, các nhà phát triển có thể dễ dàng biến dữ liệu PDF tĩnh thành các bảng tính động và có thể chỉnh sửa, đơn giản hoá việc thao tác, phân tích và chia sẻ dữ liệu.

Cách chuyển PDF sang Excel

Để chuyển đổi một tài liệu PDF thành tệp Excel (XLSX), thực hiện các bước sau:

  1. Cấu hình các cài đặt chuyển đổi bằng lớp PdfToXlsOptions.
  2. Thêm các tệp PDF đầu vào bằng phương thức AddInput.
  3. Chỉ định đường dẫn tệp đầu ra bằng phương thức AddOutput.
  4. Thực thi phương thức Convert để bắt đầu quá trình chuyển đổi.
1// Create PdfToXlsOptions object to set instructions
2var options = new PdfToXlsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_xlsx_file.xlsx"));
7// Perform the process
8PdfConverter.Convert(options);

Tùy chỉnh quá trình chuyển PDF sang Excel

Lớp PdfToXlsOptions cho phép bạn tùy chỉnh quá trình chuyển đổi. Ví dụ, để chuyển PDF sang tệp XLS và kích hoạt các tùy chọn định dạng nâng cao:

 1// Create PdfToXlsOptions object to set instructions
 2var options = new PdfToXlsOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Specify XLS format
 6options.Format = PdfToXlsOptions.ExcelFormat.XMLSpreadSheet2003;
 7options.InsertBlankColumnAtFirst = true;
 8options.MinimizeTheNumberOfWorksheets = true;
 9// Set output file path
10options.AddOutput(new FileData("path_to_result_xlsx_file.xls"));
11// Perform the process
12PdfConverter.Convert(options);

Các định dạng đầu ra được hỗ trợ

Enum PdfToXlsOptions.ExcelFormat cung cấp một loạt các định dạng đầu ra:

  • XLSX: Định dạng tệp Office Open XML (.xlsx) (mặc định).
  • XLSM: Định dạng Excel có hỗ trợ macro.
  • CSV: Giá trị phân tách bằng dấu phẩy.
  • ODS: Bảng tính Open Document.
  • XMLSpreadSheet2003: Định dạng tệp Excel 2003 XML (.xls).

Các tính năng chính:

  • Tuỳ chọn chuyển đổi linh hoạt: Chuyển đổi tệp PDF sang XLSX, XLS, CSV hoặc các định dạng khác.
  • Bảo tồn nội dung: Giữ nguyên cấu trúc, bố cục và định dạng gốc.
  • Định dạng nâng cao: Chèn cột trống hoặc giảm số lượng bảng tính.

PDF Extractor

Extract Text

Trích xuất văn bản từ tài liệu PDF một cách chính xác với các công cụ .NET của Documentize — lấy, xử lý và phân tích nội dung một cách dễ dàng.

Trích xuất hình ảnh

Trích xuất hình ảnh một cách dễ dàng từ tài liệu PDF trong các ứng dụng .NET

Trích xuất thuộc tính / Siêu dữ liệu

Trích xuất siêu dữ liệu từ các tệp PDF một cách chính xác với Documentize bằng C#/.NET

Xuất Dữ Liệu Biểu Mẫu

Trích xuất và xuất dữ liệu từ các biểu mẫu PDF (AcroForms) sang các định dạng khác như CSV bằng C#/.NET

Tiểu mục của PDF Extractor

Extract Text

The Documentize PDF Extractor for .NET simplifies extracting text from PDF documents. Whether you need pure, raw, or plain text, this plugin allows you to extract text efficiently while preserving formatting or omitting it based on your needs.

How to Extract Text from PDF file

To extract text from a PDF file, follow these steps:

  1. Create an instance of ExtractTextOptions to configure input file path.
  2. Run the Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input file path
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf");
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```

How to Extract Text from PDF stream

To extract text from a PDF stream, follow these steps:

  1. Create an instance of ExtractTextOptions to configure input stream.
  2. Run the Extract method to extract the text.
1```csharp
2// Create ExtractTextOptions object to set input stream
3var stream = File.OpenRead("path_to_your_pdf_file.pdf");
4var options = new ExtractTextOptions(stream);
5// Perform the process and get the extracted text
6var textExtracted = PdfExtractor.Extract(options);
7```

Text Extraction Modes

The ExtractTextOptions offers three extraction modes, providing flexibility based on your needs.

  1. Pure Mode: Preserves the original formatting, including spaces and alignment.
  2. Raw Mode: Extracts the text without formatting, useful for raw data processing.
  3. Flatten Mode: Represent PDF content with positioning text fragments by their coordinates.
1```csharp
2// Create ExtractTextOptions object to set input file path and TextFormattingMode
3var options = new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure);
4// Perform the process and get the extracted text
5var textExtracted = PdfExtractor.Extract(options);
6```

How to Extract Text from PDF file in the shortest possible style

1```csharp
2// Perform the process and get the extracted text
3var textExtracted = PdfExtractor.Extract(new ExtractTextOptions("path_to_your_pdf_file.pdf", TextFormattingMode.Pure));
4```

Key Features:

  • Pure Mode: Extract text while preserving its original formatting.
  • Raw Mode: Extract text without any formatting.
  • Flatten Mode: Extract text without special characters or formatting.

Trích xuất hình ảnh

Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ các tài liệu PDF. Nó quét các tệp PDF, xác định các hình ảnh được nhúng và trích xuất chúng đồng thời giữ nguyên chất lượng và định dạng gốc. Công cụ này nâng cao khả năng tiếp cận nội dung hình ảnh và tối ưu hoá quá trình lấy hình ảnh từ PDF.

Cách trích xuất hình ảnh từ PDF

Để trích xuất hình ảnh từ một tệp PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Thêm đường dẫn tệp đầu vào vào tùy chọn bằng phương thức AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các hình ảnh bằng phương thức AddOutput.
  4. Thực hiện quá trình trích xuất hình ảnh bằng plugin.
  5. Lấy các hình ảnh đã được trích xuất từ bộ chứa kết quả.
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Trích xuất hình ảnh từ tệp PDF vào Streams mà không cần thư mục

Plugin PdfExtractor hỗ trợ lưu vào streams, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào streams mà không cần tạo thư mục tạm.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Các tính năng chính:

  • Trích xuất hình ảnh được nhúng: Nhận diện và trích xuất hình ảnh từ tài liệu PDF.
  • Bảo toàn chất lượng hình ảnh: Đảm bảo các hình ảnh đã trích xuất giữ nguyên chất lượng gốc.
  • Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất ở định dạng hoặc vị trí mà bạn ưu tiên.

Trích xuất thuộc tính / Siêu dữ liệu

The Documentize PDF Extractor for .NET simplifies extracting Metadata from PDF documents. Available properties that may interest you: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.

Cách trích xuất siêu dữ liệu từ tệp PDF

The example demonstrates how to Extract Properties (Title, Author, Subject, Keywords, Number of Pages) from PDF file. To extract metadata from a PDF document, follow these steps:

  1. Create an instance of ExtractPropertiesOptions to configure the extraction options and input PDF file.
  2. Run the Extract method of PdfExtractor to extract the metadata.
  3. Access the extracted properties using the PdfProperties.
 1// Create ExtractPropertiesOptions object to set input file
 2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
 3// Perform the process and get Properties
 4var pdfProperties = PdfExtractor.Extract(options);
 5var filename = pdfProperties.FileName;
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cách trích xuất siêu dữ liệu từ luồng PDF

You can open the stream at your own discretion.

 1// Create ExtractPropertiesOptions object to set input stream
 2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
 3var options = new ExtractPropertiesOptions(stream);
 4// Perform the process and get Properties
 5var pdfProperties = PdfExtractor.Extract(options);
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cách trích xuất siêu dữ liệu từ tệp PDF theo phong cách ngắn gọn nhất

1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Tính năng chính:

  • Siêu dữ liệu khả dụng: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.

Xuất Dữ Liệu Biểu Mẫu

The Documentize PDF Extractor for .NET plugin provides a seamless way to extract and export data from PDF forms (AcroForms) into other formats like CSV. This dynamic tool simplifies the process of retrieving form field values, allowing for easy data management, transfer, and analysis.

Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang CSV

Để xuất dữ liệu biểu mẫu từ PDF sang CSV, làm theo các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Định nghĩa các tùy chọn xuất bằng lớp FormExporterValuesToCsvOptions.
  3. Thêm các tệp PDF đầu vào và chỉ định tệp CSV đầu ra.
  4. Chạy phương thức Extract để thực hiện việc xuất.
1// Create ExtractFormDataToDsvOptions object to set instructions
2var options = new ExtractFormDataToDsvOptions(',', true);
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_csv_file.csv"));
7// Perform the process
8PdfExtractor.Extract(options);

Cách Xuất Dữ Liệu Biểu Mẫu từ PDF sang TSV

Sử dụng Tab làm ký tự phân tách.

 1// Create ExtractFormDataToDsvOptions object to set instructions
 2var options = new ExtractFormDataToDsvOptions();
 3//Set Delimiter
 4options.Delimiter = '\t';
 5//Add Field Names to result
 6options.AddFieldName = true;
 7// Add input file path
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 9// Set output file path
10options.AddOutput(new FileData("path_to_result_csv_file.tsv"));
11// Perform the process
12PdfExtractor.Extract(options);

Các tính năng chính:

  • Export Form Data: Extract data from PDF forms (AcroForms) into CSV or other formats.
  • Data Filtering: Use predicates to filter specific form fields for export based on criteria like field type or page number.
  • Flexible Output: Save exported data for analysis or transfer to spreadsheets, databases, or other document formats.

PDF Manager

Kết hợp PDF

Kết hợp PDF dễ dàng với các công cụ .NET của Documentize — ghép nhiều tệp thành một trong khi giữ nguyên chất lượng và cấu trúc.

Tách PDF

Tách PDF một cách dễ dàng với các công cụ .NET của Documentize — trích xuất các trang, tạo tệp mới và quản lý tài liệu một cách chính xác

Nén PDF

Nén các tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thay đổi kích thước trang của PDF

Thay đổi kích thước trang của tài liệu PDF một cách dễ dàng với Documentize PDF Manager

Tối ưu PDF

Tối ưu PDF của bạn một cách dễ dàng với các công cụ .NET của Documentize—giảm kích thước tệp, nâng cao hiệu năng và duy trì chất lượng

Xoay Trang PDF

Xoay các trang tài liệu PDF của bạn một cách dễ dàng với Documentize PDF Manager

Thêm Bảng

Tạo các bảng PDF chuyên nghiệp với các công cụ .NET của Documentize—tùy chỉnh bố cục, kiểu dáng và dữ liệu một cách dễ dàng.

Thêm TOC

Cải thiện việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC)

Use ChatGPT

Nâng cao tài liệu PDF của bạn với AI bằng tích hợp ChatGPT của Documentize—tạo, chỉnh sửa và phân tích nội dung một cách thông minh.

Tiểu mục của PDF Manager

Kết hợp PDF

The Documentize PDF Manager for .NET is a versatile tool designed to merge multiple PDF documents into a single file. It simplifies the consolidation of PDF files, ensuring your documents are merged efficiently and maintaining consistency across content. The component handles internal resources such as fonts and images to optimize the merged document.

How to Merge PDF

To merge multiple PDF documents into a single file, follow these steps:

  1. Create an instance of MergeOptions to configure the merging process.
  2. Add input PDF files using the AddInput method.
  3. Add output PDF file using AddOutput method.
  4. Execute the merge using the Merge method of PdfManager class.
1// Create MergeOptions object to set instructions
2var options = new MergeOptions();
3// Add input file paths
4options.AddInput(new FileData("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileData("path_to_your_pdf_file_2.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfManager.Merge(options);

Key Features:

  • Merge Multiple PDFs: Easily combine multiple PDF files into one.
  • Resource Optimization: Removes duplicate fonts and images during merging.
  • Batch Processing: Merge large batches of PDF documents in one go.

Tách PDF

The Documentize PDF Manager for .NET là một công cụ mạnh mẽ giúp đơn giản hóa quá trình tách các tài liệu PDF lớn thành các tệp nhỏ hơn, dễ quản lý hơn. Dù bạn cần trích xuất từng trang riêng lẻ hay chia tài liệu thành các phần cụ thể, thành phần này cho phép bạn thực hiện nhanh chóng và với ít nỗ lực.

Cách Tách PDF

Để tách một tài liệu PDF thành các trang riêng lẻ, làm theo các bước sau:

  1. Tạo một thể hiện của SplitOptions để cấu hình các tùy chọn tách.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm các tệp đầu ra cho mỗi trang đã tách bằng phương thức AddOutput.
  4. Chạy phương thức Split trong lớp PdfManager để thực hiện việc tách tài liệu.
1// Create SplitOptions object to set instructions
2var options = new SplitOptions();
3// Add input file path
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Set output file paths
6options.AddOutput(new FileData("path_to_result_pdf_file_1.pdf"));
7options.AddOutput(new FileData("path_to_result_pdf_file_2.pdf"));
8// Perform the process
9PdfManager.Split(options);

Các tính năng chính:

  • Split PDF by Page: Break down a PDF document into individual pages.
  • Custom Split Options: Configure the splitting process based on your requirements.
  • Organized Output: Easily manage the output files for each split page or section.

Nén PDF

Trình Quản lý PDF là một công cụ toàn diện giúp cải thiện các tài liệu PDF thông qua các kỹ thuật tối ưu hóa tiên tiến. Các thao tác này nén các tài liệu PDF, khiến chúng dễ lưu trữ, chia sẻ và xem hơn.

Nén PDF

Nén tài liệu PDF khi có thể bằng cách loại bỏ các tài nguyên trang không sử dụng, hợp nhất các tài nguyên giống nhau và loại bỏ các đối tượng thừa.

  1. Tạo một đối tượng CompressOptions để cấu hình các thiết lập tối ưu hóa.
  2. Thêm tệp đầu vào và chỉ định vị trí tệp đầu ra.
  3. Sử dụng phương thức SetCropBox để định nghĩa khu vực cắt.
  4. Chạy phương thức Compress của PdfManager.
1// Create CompressOptions object to set instructions
2var options = new CompressOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfManager.Compress(options);

Các tính năng chính:

  • Nén: Loại bỏ các tài nguyên và đối tượng trang không sử dụng khỏi tài liệu.

Thay đổi kích thước trang của PDF

Bạn có thể Resize Pages của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một ResizeOptions, bạn có thể đặt kích thước trang mong muốn và thực hiện quá trình thay đổi kích thước. PDF kết quả sẽ phản ánh các kích thước mới, đảm bảo phù hợp với yêu cầu cụ thể.

Resize PDF

Để thay đổi kích thước một tài liệu PDF, lớp ResizeOptions được sử dụng để chỉ định kích thước trang mới cho tài liệu.

  1. Tạo một đối tượng ResizeOptions để định nghĩa kích thước trang.
  2. Thêm tệp đầu vào và đặt vị trí đầu ra mong muốn.
  3. Sử dụng phương thức SetPageSize để chỉ định kích thước mới (ví dụ: A4).
  4. Gọi phương thức Resize của PdfManager.
 1// Create ResizeOptions object to set instructions
 2var options = new ResizeOptions();
 3// Set new PageSize
 4options.PageSize = PageSize.A3;
 5// Add input file path
 6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Resize(options);

Các tính năng chính:

  • Resizing: Thay đổi kích thước trang thành các kích thước cụ thể
  • Available sizes: A0, A1, A2, A3, A4, A4, A5, A6, B5, Letter, Legal, Ledger, 11x17 inches.

Tối ưu PDF

PDF Manager là một công cụ toàn diện giúp cải thiện tài liệu PDF thông qua các kỹ thuật tối ưu hoá tiên tiến. Nó được thiết kế để giúp giảm kích thước tệp, xoay trang, cắt nội dung và thay đổi kích thước tài liệu. Những thao tác này cải thiện chất lượng và khả năng quản lý của các tệp PDF, làm cho chúng dễ lưu trữ, chia sẻ và xem hơn. Tối ưu hoá, hoặc linearization cho Web, đề cập đến quá trình làm cho tệp PDF phù hợp với việc duyệt trực tuyến bằng trình duyệt web.

Tối ưu PDF

Các bước sau minh họa cách tối ưu hoá một tài liệu PDF bằng cách giảm kích thước tệp mà vẫn duy trì chất lượng.

  1. Tạo một đối tượng OptimizeOptions để cấu hình các thiết lập tối ưu hoá.
  2. Thêm tệp PDF đầu vào và chỉ định vị trí xuất cho tệp đã được tối ưu hoá.
  3. Gọi phương thức Optimize của PdfManager để thực hiện quá trình tối ưu hoá.
1  
2// Create OptimizeOptions object to set instructions  
3var options = new OptimizeOptions();  
4// Add input file path  
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));  
6// Set output file path  
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));  
8// Perform the process  
9PdfManager.Optimize(options);  

Key Features:

  • Optimization: Giảm kích thước tệp PDF mà không làm mất chất lượng.

Xoay Trang PDF

Bạn có thể xoay các trang của tài liệu PDF bằng lớp PDF Manager. Sau khi tạo một RotateOptions, bạn có thể đặt góc xoay mong muốn và thực thi quá trình. PDF kết quả sẽ phản ánh kích thước mới, đảm bảo phù hợp với các yêu cầu cụ thể.

Xoay PDF

Sử dụng lớp RotateOptions để điều chỉnh hướng của các trang trong tệp PDF.

  1. Tạo một đối tượng RotateOptions và cấu hình góc xoay.
  2. Thêm tệp PDF đầu vào và chỉ định vị trí tệp đầu ra.
  3. Đặt góc xoay (ví dụ: 90 độ) bằng phương thức SetRotation.
  4. Gọi phương thức Rotate của PdfManager.
 1// Create RotateOptions object to set instructions
 2var options = new RotateOptions();
 3// Set new Rotation
 4options.Rotation = Rotation.On90;
 5// Add input file path
 6options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 7// Set output file path
 8options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 9// Perform the process
10PdfManager.Rotate(options);

Các tính năng chính:

  • Rotation: Điều chỉnh hướng của các trang PDF.

Thêm Bảng

The Documentize PDF Manager for .NET là một thành phần đa năng được thiết kế để đơn giản hoá việc tích hợp các bảng vào tài liệu PDF. Cho dù bạn đang sắp xếp dữ liệu, thiết kế biểu mẫu, hay cải thiện khả năng đọc tài liệu, thành phần này làm cho quy trình trở nên dễ dàng hơn đồng thời giữ độ chính xác và hiệu suất.

Tạo PDF với Bảng

Thực hiện các bước sau để tạo các bảng có cấu trúc trong PDF bằng cách sử dụng lớp TableOptions:

  1. Cấu hình đối tượng TableOptions để định nghĩa cấu trúc bảng, nội dung và các tệp đầu vào/đầu ra.
  2. Thêm bảng, hàng và ô vào PDF của bạn.
  3. Hoàn thiện quá trình tạo bảng bằng phương thức AddTable.

Ví dụ:

 1// Configure table options
 2var options = new TableOptions();
 3options.InsertPageBefore(1)
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("Name")
 7            .AddCell().AddParagraph("Age")
 8        .AddRow()
 9            .AddCell().AddParagraph("Bob")
10            .AddCell().AddParagraph("12")
11        .AddRow()
12            .AddCell().AddParagraph("Sam")
13            .AddCell().AddParagraph("20")
14        .AddRow()
15            .AddCell().AddParagraph("Sandy")
16            .AddCell().AddParagraph("26")
17        .AddRow()
18            .AddCell().AddParagraph("Tom")
19            .AddCell().AddParagraph("12")
20        .AddRow()
21            .AddCell().AddParagraph("Jim")
22            .AddCell().AddParagraph("27");
23// Add input file path
24options.AddInput(new FileData("path_to_input.pdf"));
25// Set output file path
26options.AddOutput(new FileData("path_to_output.pdf"));
27// Perform the process
28PdfManager.AddTable(options);

Đặt trang cho bảng

Thực hiện các bước sau để tạo bảng trong PDF trước trang 2: Ví dụ:

 1// Configure table options
 2var options = new TableOptions();
 3options.InsertPageBefore(2) // Add table before page 2
 4   .AddTable()
 5        .AddRow()
 6            .AddCell().AddParagraph("Name")
 7            .AddCell().AddParagraph("Age");
 8// Add input file path
 9options.AddInput(new FileData("path_to_input.pdf"));
10// Set output file path
11options.AddOutput(new FileData("path_to_output.pdf"));
12// Perform the process
13PdfManager.AddTable(options);

Tính Năng Chính:

  • Tạo Bảng Động: Tạo các bảng có cấu trúc trong tài liệu PDF một cách dễ dàng.
  • Đặt Trang: Chèn bảng vào các vị trí cụ thể trong PDF một cách chính xác.
  • Bố Cục Tùy Chỉnh: Điều chỉnh cấu trúc bảng, căn chỉnh ô và kiểu dáng.

Thêm TOC

The Documentize PDF Manager for .NET là một thành phần mạnh mẽ được thiết kế để nâng cao việc tổ chức và điều hướng tài liệu PDF bằng cách tạo động Mục Lục (TOC). Thành phần này đơn giản hoá quá trình thêm TOC vào PDF của bạn, giúp tài liệu dễ dàng điều hướng và quản lý hơn.

Cách tạo TOC cho PDF

Để tạo Mục Lục trong một tệp PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của TocOptions để cấu hình các thiết lập tạo TOC.
  2. Đặt Tiêu đề bằng thuộc tính Title.
  3. Thiết kế Các tiêu đề của TOC bằng phương thức Headings.Add.
  4. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  5. Chỉ định tệp PDF đầu ra có TOC bằng phương thức AddOutput.
  6. Gọi phương thức AddTableOfContents để tạo TOC.
 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Design Headings
 6options.Headings.Add(new TocHeading("Introduction", 2));
 7options.Headings.Add(new TocHeading("Chapter I", 3));
 8options.Headings.Add(new TocHeading("Chapter II", 4));
 9options.Headings.Add(new TocHeading("Chapter III", 5));
10// Add input file path
11options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
12// Set output file path
13options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
14// Perform the process
15PdfManager.AddTableOfContents(options);

Tạo bookmark trong TOC cho PDF

Bạn có thể sử dụng thuộc tính GenerateBookmarks để tạo bookmark.

 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Generate links in bookmarks
 6options.GenerateBookmarks = true;
 7// Design Headings
 8options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 9options.Headings.Add(new TocHeading("Chapter I", 3, true, 1));
10options.Headings.Add(new TocHeading("Chapter II", 4, true, 1));
11options.Headings.Add(new TocHeading("Example A", 4, true, 2));
12options.Headings.Add(new TocHeading("Example B", 4, true, 2));
13options.Headings.Add(new TocHeading("Example C", 4, true, 2));
14options.Headings.Add(new TocHeading("Example D", 4, true, 2));
15options.Headings.Add(new TocHeading("Chapter III", 5, true, 1));
16// Add input file path
17options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
18// Set output file path
19options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
20// Perform the process
21PdfManager.AddTableOfContents(options);

Cách lấy kết quả dưới dạng Stream

 1// Create TocOptions object to set instructions
 2var options = new TocOptions();
 3// Set the Title
 4options.Title = "My Table of Contents";
 5// Design Headings
 6options.Headings.Add(new TocHeading("Introduction", 2, false, 1));
 7// Add input file path
 8options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 9// Set output stream 
10var outputStream = new MemoryStream();
11options.AddOutput(new StreamData(outputStream));
12options.CloseOutputStreams = false;
13// Perform the process
14PdfManager.AddTableOfContents(options);

Tùy chỉnh tiêu đề TOC

Bạn có thể tùy chỉnh tiêu đề Mục Lục bằng cách sửa đổi lớp TocHeading. Ví dụ, bạn có thể sử dụng GenerateNumbering hoặc tự thực hiện. Thuộc tính PageNumber được dùng cho các liên kết trên trang. Ngoài ra bạn cũng có thể sử dụng thuộc tính Level.

 1// Create TocOptions object to set instructions
 2var heading = new TocHeading();
 3heading.Text = "Intro";
 4heading.PageNumber = 5;
 5heading.GenerateNumbering = true;
 6heading.Level = 2;
 7var tocOptions = new TocOptions();
 8options.Headings.Add(heading);
 9// Add input and output files
10tocOptions.AddInput(new FileData("path_to_your_pdf_file.pdf"));
11tocOptions.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
12// Generate the TOC with customized options
13PdfManager.AddTableOfContents(tocOptions);

Các tính năng chính:

  • Tạo TOC động: Tạo TOC cho bất kỳ tệp PDF nào với các mục được tạo tự động dựa trên tiêu đề hoặc bookmark.
  • Tùy chỉnh: Kiểm soát giao diện và cấu trúc của TOC, bao gồm kiểu, định dạng và mức độ sâu.
  • Quy trình làm việc hiệu quả: Giảm thiểu thời gian tạo TOC thủ công, đặc biệt với các tài liệu lớn hoặc phức tạp.

Use ChatGPT

Plugin Documentize PDF Manager for .NET là một công cụ mạnh mẽ được thiết kế để tích hợp API ChatGPT vào các ứng dụng PDF. Plugin này cho phép các nhà phát triển tạo phản hồi trò chuyện dựa trên tin nhắn đầu vào và lưu kết quả dưới dạng PDF, thích hợp cho việc xây dựng giao diện hội thoại hoặc báo cáo phân tích trực tiếp trong tài liệu PDF.

Tạo phản hồi trò chuyện

Để tạo phản hồi trò chuyện và lưu chúng vào tệp PDF bằng plugin ChatGPT, làm theo các bước sau:

  1. Tạo một thể hiện của lớp ChatGptRequestOptions để cấu hình các tùy chọn yêu cầu.
  2. Thêm các tệp PDF đầu vào và đầu ra.
  3. Đặt khóa API và chỉ định các tham số như số token tối đa và truy vấn cho mô hình ChatGPT.
  4. Gọi phương thức CreatePdfByChatGptRequestAsync để tạo phần hoàn chỉnh của cuộc trò chuyện.
 1var options = new ChatGptRequestOptions();
 2// Set output file path
 3options.AddOutput(new FileData("path_to_result_pdf_file.pdf")); 
 4options.ApiKey = "Your API key."; // You need to provide the key to access the API.
 5options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
 6
 7// Add the request messages.
 8options.Messages.Add(new Message
 9{
10    Content = "You are a helpful assistant.",
11    Role = Role.System
12});
13options.Messages.Add(new Message
14{
15    Content = "What is the biggest pizza diameter ever made?",
16    Role = Role.User
17});
18
19// Process the request.
20var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
21
22var fileResultPath = result.ResultCollection[0].Data;
23var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.

Thêm tin nhắn Hệ thống và Người dùng

Để tạo một cuộc trò chuyện tương tác hơn, bạn có thể thêm cả tin nhắn hệ thống và tin nhắn người dùng. Những tin nhắn này giúp định hình ngữ cảnh của cuộc trò chuyện.

  1. Thêm một tin nhắn hệ thống để thiết lập ngữ cảnh cho ChatGPT.
  2. Thêm một tin nhắn người dùng đại diện cho đầu vào của người dùng trong cuộc hội thoại.
 1var options = new ChatGptRequestOptions();
 2// Set output file path
 3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 4
 5// Add the PDF text source.
 6// In case of multiple sources, the text from each document will be added to the request message collection
 7// as a separate message with the role "user".
 8options.AddInput(new FileData("TextSource.pdf"));
 9
10options.ApiKey = "Your API key."; // You need to provide the key to access the API.
11options.MaxTokens = 1000; // The maximum number of tokens to generate in the chat completion.
12
13// Add the request message.
14// In this case, the system message with Content = "You are a helpful assistant." is added by default.
15// The role of the query message is "user" by default.
16options.Query = "How many letters in the provided text?";
17
18// Process the request.
19var result = await PdfManager.CreatePdfByChatGptRequestAsync(options);
20
21var fileResultPath = result.ResultCollection[0].Data;
22var chatCompletionObject = result.ResultCollection[1].Data as ChatCompletion; // The ChatGPT API chat completion object.

Các tính năng chính:

  • Chat Completions: Tạo phản hồi bằng API ChatGPT dựa trên đầu vào tùy chỉnh.
  • System & User Messages: Cung cấp cả ngữ cảnh hệ thống và đầu vào người dùng để tạo các cuộc hội thoại động.
  • PDF Output: Lưu các phần hoàn chỉnh của trò chuyện vào tệp PDF có cấu trúc để sử dụng tiếp theo.
  • Asynchronous Processing: Đảm bảo ứng dụng phản hồi nhanh bằng cách xử lý các phần hoàn chỉnh trò chuyện một cách bất đồng bộ.

PDF Security

Mã hoá

Mã hoá các tệp PDF của bạn bằng công cụ .NET của Documentize để bảo vệ thông tin nhạy cảm.

Giải mã

Giải mã các tệp PDF của bạn bằng công cụ .NET của Documentize để mở tài liệu.

Ký điện tử các tệp PDF bằng các công cụ .NET của Documentize — đảm bảo an ninh, tính xác thực và tuân thủ một cách dễ dàng.

Tiểu mục của PDF Security

Mã hoá

The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để nâng cao bảo mật cho tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký số. Nó đảm bảo rằng thông tin nhạy cảm của bạn luôn được giữ bí mật và được bảo vệ khỏi việc truy cập trái phép.

Cách mã hoá một tệp PDF

Để mã hoá một tài liệu PDF, làm theo các bước sau:

  1. Tạo một thể hiện của EncryptOptions với mật khẩu người dùng và chủ sở hữu mong muốn.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng phương thức AddOutput.
  4. Thực thi việc mã hoá bằng phương thức Encrypt của lớp PdfSecurity.
1// Create EncryptOptions object to set instructions
2var options = new EncryptOptions("123456", "qwerty");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Encrypt(options);

Các tính năng chính:

  • Mã hoá tài liệu PDF: Bảo mật các tệp PDF của bạn bằng cách thêm mật khẩu người dùng và chủ sở hữu.
  • Tự động hoá: Tích hợp việc mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
  • Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.

Giải mã

The Documentize PDF Security for .NET là một công cụ mạnh mẽ được thiết kế để tăng cường bảo mật cho các tài liệu PDF của bạn bằng cách cung cấp các khả năng mã hoá, giải mã và ký điện tử. Nó đảm bảo thông tin nhạy cảm của bạn luôn được giữ bí mật và bảo vệ khỏi truy cập trái phép.

Cách giải mã PDF

Để giải mã một tài liệu PDF, làm theo các bước sau:

  1. Tạo một thể hiện của DecryptionOptions với mật khẩu cần thiết.
  2. Thêm tệp PDF đầu vào bằng phương thức AddInput.
  3. Thêm tệp PDF đầu ra bằng phương thức AddOutput.
  4. Thực hiện việc giải mã bằng phương thức Decrypt của lớp PdfSecurity.
1// Create DecryptOptions object to set instructions
2var options = new DecryptOptions("123456");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Decrypt(options);

Các tính năng chính:

  • Giải mã tài liệu PDF: Loại bỏ mã hoá khỏi các file PDF khi cần.
  • Tự động hoá: Tích hợp mã hoá và giải mã vào các ứng dụng .NET của bạn để tạo quy trình làm việc tự động.
  • Tuân thủ: Đảm bảo tài liệu của bạn đáp ứng các tiêu chuẩn công nghiệp về bảo mật tài liệu.

The Documentize PDF Security for .NET component allows users to digitally sign PDF documents. It offers a streamlined process for adding signatures, ensuring authenticity, and securing PDF content. The component supports both visible and invisible signatures and provides options to customize the signature’s position, reason, contact information, and more.

How to Sign PDF Documents

To sign a PDF document using a PFX file, follow these steps:

  1. Instantiate the SignOptions class with the PFX file path and password.
  2. Add the input PDF and the output file to the options.
  3. Run the Sign method to apply the signature.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfSecurity.Sign(options);

How to Use Stream for PFX File

You can also sign a PDF using a PFX certificate provided as a stream instead of a file path. This allows more flexible handling of certificate storage.

1using var pfxStream = File.OpenRead(@"path_to_your_pfx_file.pfx");
2var options = new SignOptions(pfxStream, "password_of_your_pfx_file");
3options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
4options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
5// Perform the process
6PdfSecurity.Sign(options);

How to Apply Invisible Signatures

To add an invisible signature (one that secures the document without displaying the signature on the document), simply set the Visible property to false.

  1. Create an instance of SignOptions.
  2. Set Visible to false.
  3. Add input and output files.
  4. Call Sign to apply the invisible signature.
1var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
2options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
3options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
4// Configure invisible signature
5signOptions.Visible = false;
6// Perform the process
7PdfSecurity.Sign(options);

How to use extra Options for signature of PDF Documents

You can use extra options during adding signature to a PFX file like Reason, Contact, Location, PageNumber.

  1. Instantiate the SignOptions class with the PFX file path and password.
  2. Add the input PDF and the output file to the options.
  3. Set values for your options.
  4. Run the Sign method to apply the signature.
 1// Create SignOptions object to set instructions
 2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_of_your_pfx_file");
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output file path
 6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 7// Optional parameters
 8options.Reason = "my Reason";
 9options.Contact = "my Contact";
10options.Location = "my Location";
11options.PageNumber = 3;
12// Perform the process
13PdfSecurity.Sign(options);

How to Add a Timestamp to PDF

To add a secure timestamp to a PDF document, follow these steps:

  1. Create an instance of AddTimestampOptions to configure the timestamping process.
  2. Add the input PDF file using the AddInput method.
  3. Set the output file path using AddOutput.
  4. Execute the timestamping using the Sign method.
1// Create SignOptions object to set instructions
2var options = new SignOptions("path_to_your_pfx_file.pfx", "password_for_your_pfx_file");
3options.TimestampOptions = new TimestampOptions("server_url");
4// Add input file path
5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
6// Set output file path
7options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
8// Perform the process
9PdfSecurity.Sign(options);

How to Use Custom Authentication with Timestamp Server

You can provide basic authentication credentials when connecting to the timestamp server. This allows you to authenticate with servers that require a username and password.

1// Configure the timestamping options with authentication
2options.TimestampOptions = new TimestampOptions("timestamp_server_url", "username:password");

Key Features:

  • Digitally Sign PDF Documents: Secure your documents with visible or invisible digital signatures.
  • PFX Support: Sign PDF files using a PFX certificate.
  • Customizable Options: Configure signature settings like reason, location, and contact details.
  • Visible and Invisible Signatures: Choose whether the signature is visible on the document.
  • Customizable Timestamp Servers: Use custom timestamp server URLs and authentication credentials.

Tiểu mục của Mẫu PDF

Làm phẳng các trường biểu mẫu

The Documentize PDF Form for .NET cho phép bạn chuyển đổi các biểu mẫu PDF tương tác thành tài liệu không thể chỉnh sửa, làm cho chúng an toàn trước các sửa đổi trái phép. Công cụ này biến các trường biểu mẫu thành nội dung tĩnh, tăng cường bảo mật cho tài liệu PDF của bạn. Nó đặc biệt hữu ích khi bạn cần bảo vệ các hợp đồng, thỏa thuận hoặc bất kỳ tài liệu nào mà các trường biểu mẫu phải được giữ nguyên.

Cách làm phẳng các trường biểu mẫu trong PDF

Để làm phẳng các trường biểu mẫu trong tài liệu PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của lớp FlattenFieldsOptions.
  2. Thêm các tệp đầu vào và đầu ra vào tùy chọn.
  3. Gọi phương thức Flatten để thực hiện thao tác làm phẳng.
1// Create FlattenFieldsOptions object to set instructions
2var options = new FlattenFieldsOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output file path
6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
7// Perform the process
8PdfForm.Flatten(options);

Cách lấy tất cả các trường trong PDF

Bạn có thể lấy thông tin về số lượng trường mà tài liệu chứa.

1// Get Fields Names
2var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));

Cách làm phẳng mọi thứ ngoại trừ trường đầu tiên trong PDF

Bạn có thể chọn lọc làm phẳng chỉ các trường biểu mẫu nhất định dựa trên tiêu chí như vị trí hoặc tên của trường.

 1// Get Fields Names
 2var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));
 3 // Create FlattenFieldsOptions object to set instructions
 4var options = new FlattenFieldsOptions();
 5options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 6options.AddOutput(new FileData("path_to_result_pdf_file.pdf"));
 7 // Skip 1 field.
 8options.SkipFields.Add(fieldNames[0]);
 9 // Perform the process
10PdfForm.Flatten(options);

Tính năng chính:

  • Flatten All Form Fields: Chuyển đổi các trường biểu mẫu tương tác thành nội dung tĩnh không thể chỉnh sửa.
  • Get Fields Names: Lấy tên các trường trong PDF.
  • Flatten Selected Fields: Tùy chọn làm phẳng các trường nhất định trong PDF trong khi giữ các trường khác có thể chỉnh sửa.

FAQs

Câu hỏi thường gặp này cung cấp thông tin toàn diện về các tính năng và chức năng của Documentize .NET Plugins, bao gồm các khía cạnh như chuyển đổi PDF, xử lý biểu mẫu và tạo mục lục (TOC).


Câu hỏi chung

1. Documentize cho .NET là gì?

Documentize cho .NET là một thư viện mạnh mẽ để quản lý và xử lý tài liệu PDF bằng lập trình. Nó bao gồm các plugin để chuyển đổi PDF sang các định dạng khác nhau, chỉnh sửa biểu mẫu PDF, thêm chữ ký điện tử, tạo TOC và đảm bảo tuân thủ PDF/A cho lưu trữ dài hạn.

2. Làm thế nào để cài đặt các plugin Documentize cho .NET?

Bạn có thể cài đặt các plugin Documentize bằng cách tải xuống các tệp assembly từ trang web chính thức hoặc lấy các gói trực tiếp từ NuGet. Hướng dẫn cài đặt chi tiết có sẵn trong tài liệu của từng plugin.


Các plugin chuyển đổi PDF

3. Làm thế nào để chuyển đổi tài liệu PDF sang tệp Word (DOC/DOCX)?

Để chuyển đổi tài liệu PDF sang định dạng Word bằng Trình chuyển đổi PDF sang DOC:

  1. Khởi tạo lớp PdfDoc.
  2. Tạo một đối tượng PdfToDocOptions để cấu hình các tùy chọn chuyển đổi.
  3. Thêm đường dẫn tệp PDF đầu vào và tệp DOC/DOCX đầu ra.
  4. Gọi phương thức Process để thực hiện chuyển đổi.

4. Làm thế nào để chuyển đổi các trang PDF thành hình ảnh JPEG?

Sử dụng Trình chuyển đổi PDF sang JPEG:

  1. Tạo một thể hiện của lớp Jpeg.
  2. Đặt các tùy chọn chuyển đổi (ví dụ: độ phân giải, phạm vi trang) thông qua JpegOptions.
  3. Thêm đường dẫn tệp đầu vào/đầu ra.
  4. Gọi phương thức Jpeg.Process để thực hiện chuyển đổi.

5. Làm thế nào để chuyển đổi PDF sang PNG?

Để chuyển đổi PDF sang định dạng PNG:

  1. Tạo một thể hiện của lớp Png và một đối tượng PngOptions.
  2. Thêm PDF đầu vào và chỉ định thư mục đầu ra.
  3. Đặt các tùy chọn như độ phân giải (ví dụ: 300 DPI).
  4. Gọi phương thức Process để tạo hình ảnh PNG.

6. Làm thế nào để chuyển đổi PDF sang Excel (XLS/XLSX)?

Để chuyển đổi PDF sang Excel:

  1. Khởi tạo lớp PdfXls.
  2. Sử dụng PdfToXlsOptions để cấu hình đường dẫn đầu vào/đầu ra và các tùy chọn chuyển đổi.
  3. Gọi phương thức Process để bắt đầu chuyển đổi.

7. Làm thế nào để chuyển đổi PDF sang HTML?

Để chuyển đổi tài liệu PDF sang HTML:

  1. Tạo một thể hiện của lớp PdfHtml.
  2. Cấu hình các tùy chọn chuyển đổi với PdfToHtmlOptions hoặc HtmlToPdfOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

Xử lý biểu mẫu PDF

8. Làm thế nào tôi có thể chỉnh sửa biểu mẫu PDF bằng Trình chỉnh sửa Biểu mẫu?

Trình chỉnh sửa Biểu mẫu PDF cung cấp khả năng để:

  • Thêm trường (FormEditorAddOptions).
  • Cập nhật trường (FormEditorSetOptions).
  • Xóa trường (FormRemoveSelectedFieldsOptions). Sau khi cấu hình các trường biểu mẫu, hãy chạy phương thức Process.

9. Làm thế nào để gộp biểu mẫu PDF?

Để gộp các trường biểu mẫu:

  1. Khởi tạo lớp FormFlattener.
  2. Sử dụng FormFlattenAllFieldsOptions để gộp tất cả các trường hoặc FormFlattenSelectedFieldsOptions để nhắm đến các trường cụ thể.
  3. Thêm tệp đầu vào/đầu ra và gọi phương thức Process.

10. Làm thế nào tôi có thể xuất dữ liệu từ các biểu mẫu PDF?

Để xuất dữ liệu biểu mẫu, sử dụng Trình xuất Biểu mẫu PDF. Tạo một đối tượng FormExporterValuesToCsvOptions, chỉ định các điều kiện trường biểu mẫu, và chạy phương thức Process để xuất dữ liệu sang định dạng CSV.


Quản lý PDF/A và TOC

11. Làm thế nào để chuyển đổi PDF sang định dạng PDF/A?

Để chuyển đổi PDF sang PDF/A:

  1. Sử dụng lớp PdfAConverter.
  2. Cấu hình phiên bản PDF/A (ví dụ: PDF/A-3B) trong PdfAConvertOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

12. Làm thế nào để tạo một Mục lục (TOC) trong PDF?

Để tạo một TOC:

  1. Tạo một thể hiện của lớp TocGenerator.
  2. Sử dụng TocOptions để định nghĩa các tham số TOC.
  3. Thêm tệp đầu vào/đầu ra và chạy phương thức Process.

Xử lý chữ ký

13. Làm thế nào để tôi ký kỹ thuật số một tài liệu PDF?

Để thêm một chữ ký kỹ thuật số:

  1. Khởi tạo lớp Signature.
  2. Sử dụng SignOptions để cấu hình tệp PFX, mật khẩu và chi tiết chữ ký (ví dụ: lý do, thông tin liên hệ).
  3. Thêm tệp đầu vào/đầu ra và chạy phương thức Process.

Tính năng bổ sung

14. Tôi có thể tách các tệp PDF bằng Documentize không?

Có, bằng cách sử dụng Trình tách PDF:

  1. Khởi tạo lớp Splitter.
  2. Cấu hình các tùy chọn tách bằng SplitOptions.
  3. Thêm đường dẫn đầu vào/đầu ra và gọi phương thức Process.

15. Làm thế nào để kết hợp nhiều tệp PDF thành một?

Để kết hợp các PDF:

  1. Khởi tạo lớp Merger.
  2. Thêm các PDF đầu vào và chỉ định một tệp đầu ra thông qua MergeOptions.
  3. Chạy phương thức Process để kết hợp các tệp.

16. Documentize có bị giới hạn chỉ làm việc với các tệp PDF không?

Trong khi Documentize chủ yếu tập trung vào thao tác PDF, nó cũng hỗ trợ chuyển đổi tới và từ các định dạng như DOC, XLS, HTML, JPEG và PNG.


Giấy phép và Tương thích

17. Các yêu cầu hệ thống để sử dụng các plugin Documentize là gì?

Documentize hỗ trợ:

  • Hệ điều hành: Windows 7-11, Windows Server 2003-2022, macOS (10.12+), và Linux.
  • Khung làm việc: .NET Framework 4.0 đến 8.0.
  • IDE: Tương thích với nhiều phiên bản của Visual Studio.

18. Làm thế nào để tôi thiết lập các khóa giấy phép cho Documentize?

Để kích hoạt một plugin, tham chiếu Documentize trong dự án của bạn và thiết lập các khóa giấy phép trước khi gọi bất kỳ phương thức nào. Tham khảo tài liệu của từng plugin để biết hướng dẫn chi tiết.

19. Tôi có thể tìm thấy thêm ví dụ và tài liệu cho các plugin Documentize ở đâu?

Tài liệu API hoàn chỉnh và ví dụ có thể được tìm thấy trên trang web Documentize hoặc thông qua các gói NuGet trong môi trường phát triển của bạn.


 Tiếng Việt