Extract Images
Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ tài liệu PDF. Nó quét các tệp PDF của bạn, xác định các hình ảnh nhúng và trích xuất chúng trong khi giữ nguyên chất lượng và định dạng ban đầu. Công cụ này nâng cao khả năng truy cập nội dung trực quan và làm đơn giản hóa quy trình lấy hình ảnh từ các tài liệu PDF.
Cách trích xuất hình ảnh từ PDF
Để trích xuất hình ảnh từ tệp PDF, hãy làm theo các bước sau:
- Tạo một thể hiện của lớp
ExtractImagesOptions
. - Thêm đường dẫn tệp đầu vào vào tùy chọn bằng cách sử dụng phương thức
AddInput
. - Đặt đường dẫn thư mục đầu ra cho hình ảnh bằng phương thức
AddOutput
. - Tiến hành xử lý việc trích xuất hình ảnh bằng plugin.
- Lấy các hình ảnh đã trích xuất từ thùng chứa kết quả.
1// Tạo ExtractImagesOptions để đặt hướng dẫn
2var options = new ExtractImagesOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Đặt đường dẫn thư mục đầu ra
6options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
7// Thực hiện quy trình
8var results = PdfExtractor.ExtractImages(options);
9// Lấy đường dẫn đến kết quả hình ảnh
10var imageExtracted = results.ResultCollection[0].ToFile();
Trích xuất hình ảnh từ tệp PDF vào các luồng mà không cần thư mục
Plugin PdfExtractor hỗ trợ lưu vào các luồng, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào các luồng mà không cần sử dụng thư mục tạm thời.
1// Tạo ExtractImagesOptions để đặt hướng dẫn
2var options = new ExtractImagesOptions();
3// Thêm đường dẫn tệp đầu vào
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Không đặt đầu ra - nó sẽ ghi kết quả vào các luồng
6// Thực hiện quy trình
7var results = PdfExtractor.ExtractImages(options);
8// Lấy luồng
9var ms = results.ResultCollection[0].ToStream();
10// Sao chép dữ liệu vào tệp cho bản demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}
Tính năng chính:
- Trích xuất hình ảnh nhúng: Xác định và trích xuất hình ảnh từ tài liệu PDF.
- Bảo tồn chất lượng hình ảnh: Đảm bảo hình ảnh được trích xuất giữ nguyên chất lượng ban đầu.
- Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất theo định dạng hoặc vị trí bạn ưa thích.