Trích xuất hình ảnh

Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ các tài liệu PDF. Nó quét các tệp PDF, xác định các hình ảnh được nhúng và trích xuất chúng đồng thời giữ nguyên chất lượng và định dạng gốc. Công cụ này nâng cao khả năng tiếp cận nội dung hình ảnh và tối ưu hoá quá trình lấy hình ảnh từ PDF.

Cách trích xuất hình ảnh từ PDF

Để trích xuất hình ảnh từ một tệp PDF, thực hiện các bước sau:

  1. Tạo một thể hiện của lớp ExtractImagesOptions.
  2. Thêm đường dẫn tệp đầu vào vào tùy chọn bằng phương thức AddInput.
  3. Đặt đường dẫn thư mục đầu ra cho các hình ảnh bằng phương thức AddOutput.
  4. Thực hiện quá trình trích xuất hình ảnh bằng plugin.
  5. Lấy các hình ảnh đã được trích xuất từ bộ chứa kết quả.
 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Set output Directory path
 6options.AddOutput(new DirectoryData("path_to_results_directory"));
 7// Perform the process
 8var results = PdfExtractor.Extract(options);
 9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();

Trích xuất hình ảnh từ tệp PDF vào Streams mà không cần thư mục

Plugin PdfExtractor hỗ trợ lưu vào streams, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào streams mà không cần tạo thư mục tạm.

 1// Create ExtractImagesOptions to set instructions
 2var options = new ExtractImagesOptions();
 3// Add input file path
 4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
 5// Not set output - it will write results to streams
 6// Perform the process
 7var results = PdfExtractor.Extract(options);
 8// Get Stream
 9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14    ms.CopyTo(fs);
15}

Các tính năng chính:

  • Trích xuất hình ảnh được nhúng: Nhận diện và trích xuất hình ảnh từ tài liệu PDF.
  • Bảo toàn chất lượng hình ảnh: Đảm bảo các hình ảnh đã trích xuất giữ nguyên chất lượng gốc.
  • Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất ở định dạng hoặc vị trí mà bạn ưu tiên.
 Tiếng Việt