Trích xuất hình ảnh
Plugin Documentize PDF Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ các tài liệu PDF. Nó quét các tệp PDF, xác định các hình ảnh được nhúng và trích xuất chúng đồng thời giữ nguyên chất lượng và định dạng gốc. Công cụ này nâng cao khả năng tiếp cận nội dung hình ảnh và tối ưu hoá quá trình lấy hình ảnh từ PDF.
Cách trích xuất hình ảnh từ PDF
Để trích xuất hình ảnh từ một tệp PDF, thực hiện các bước sau:
- Tạo một thể hiện của lớp
ExtractImagesOptions. - Thêm đường dẫn tệp đầu vào vào tùy chọn bằng phương thức
AddInput. - Đặt đường dẫn thư mục đầu ra cho các hình ảnh bằng phương thức
AddOutput. - Thực hiện quá trình trích xuất hình ảnh bằng plugin.
- Lấy các hình ảnh đã được trích xuất từ bộ chứa kết quả.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Set output Directory path
6options.AddOutput(new DirectoryData("path_to_results_directory"));
7// Perform the process
8var results = PdfExtractor.Extract(options);
9// Get path to image result
10var imageExtracted = results.ResultCollection[0].ToFile();Trích xuất hình ảnh từ tệp PDF vào Streams mà không cần thư mục
Plugin PdfExtractor hỗ trợ lưu vào streams, cho phép bạn trích xuất hình ảnh từ các tệp PDF vào streams mà không cần tạo thư mục tạm.
1// Create ExtractImagesOptions to set instructions
2var options = new ExtractImagesOptions();
3// Add input file path
4options.AddInput(new FileData("path_to_your_pdf_file.pdf"));
5// Not set output - it will write results to streams
6// Perform the process
7var results = PdfExtractor.Extract(options);
8// Get Stream
9var ms = results.ResultCollection[0].ToStream();
10// Copy data to file for demo
11ms.Seek(0, SeekOrigin.Begin);
12using (var fs = File.Create("test_file.png"))
13{
14 ms.CopyTo(fs);
15}Các tính năng chính:
- Trích xuất hình ảnh được nhúng: Nhận diện và trích xuất hình ảnh từ tài liệu PDF.
- Bảo toàn chất lượng hình ảnh: Đảm bảo các hình ảnh đã trích xuất giữ nguyên chất lượng gốc.
- Đầu ra linh hoạt: Lưu hình ảnh đã trích xuất ở định dạng hoặc vị trí mà bạn ưu tiên.