PDF Image Extractor
Plugin Documentize PDF Image Extractor for .NET cho phép bạn dễ dàng trích xuất hình ảnh từ tài liệu PDF. Nó quét các tệp PDF của bạn, xác định các hình ảnh nhúng và trích xuất chúng trong khi vẫn giữ nguyên chất lượng và định dạng ban đầu. Công cụ này cải thiện khả năng tiếp cận nội dung hình ảnh và đơn giản hóa quá trình lấy hình ảnh từ PDF.
Cách Trích Xuất Hình Ảnh Từ Một Tệp PDF
Để trích xuất hình ảnh từ một tệp PDF, hãy thực hiện các bước sau:
- Tạo một thể hiện của lớp
ImageExtractor
. - Tạo một thể hiện của lớp
ImageExtractorOptions
. - Thêm đường dẫn tệp đầu vào vào tùy chọn.
- Xử lý việc trích xuất hình ảnh bằng cách sử dụng plugin.
- Lấy các hình ảnh đã trích xuất từ bộ chứa kết quả.
1using var plugin = new ImageExtractor();
2
3// Tạo một thể hiện của lớp ImageExtractorOptions
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// Thêm đường dẫn tệp đầu vào
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Lấy hình ảnh đã trích xuất và lưu vào tệp
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
Trích Xuất Hình Ảnh Từ Nhiều Tệp PDF
Plugin ImageExtractor hỗ trợ xử lý hàng loạt, cho phép bạn trích xuất hình ảnh từ nhiều PDF cùng một lúc. Tính năng này đặc biệt hữu ích khi bạn có một bộ sưu tập các tệp PDF và cần lấy tất cả hình ảnh trong một lần.
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// Thêm nhiều tệp PDF đầu vào
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// Xử lý việc trích xuất hình ảnh
10var resultContainer = plugin.Process(options);
11
12// Lưu các hình ảnh đã trích xuất từ tất cả các tệp
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
Tính Năng Chính:
- Trích Xuất Hình Ảnh Nhúng: Xác định và trích xuất hình ảnh từ các tài liệu PDF.
- Giữ Nguyên Chất Lượng Hình Ảnh: Đảm bảo hình ảnh đã trích xuất giữ nguyên chất lượng ban đầu.
- Xử Lý Hàng Loạt: Trích xuất hình ảnh từ nhiều tài liệu PDF trong một thao tác duy nhất.
- Đầu Ra Linh Hoạt: Lưu hình ảnh đã trích xuất theo định dạng hoặc vị trí bạn mong muốn.