PDF to XLS Converter
Конвертер PDF в XLS от Documentize для .NET — это универсальный и мощный инструмент для конвертации PDF-документов в электронные таблицы Excel (XLS/XLSX). Используя этот плагин, разработчики могут без проблем преобразовывать статические данные PDF в динамические и редактируемые таблицы, упрощая манипуляцию данными, анализ и обмен ими.
Как конвертировать PDF в Excel
Чтобы конвертировать документ PDF в файл Excel (XLS/XLSX), выполните следующие шаги:
- Создайте экземпляр класса
XlsConverter
. - Настройте параметры конвертации, используя класс
PdfToXlsOptions
. - Добавьте входные PDF-файлы с помощью метода
AddInput
. - Укажите путь к выходному файлу с помощью метода
AddOutput
. - Выполните метод
Process
, чтобы инициировать конвертацию.
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// Добавьте пути для входного и выходного файла
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// Выполните конвертацию
10converter.Process(options);
Настройка конвертации PDF в Excel
Класс PdfToXlsOptions
позволяет вам настроить процесс конвертации. Например, чтобы конвертировать PDF в файл XLSX, задайте имя рабочей таблицы и включите расширенные параметры форматирования:
1
2var options = new PdfToXlsOptions
3{
4 Format = PdfToXlsOptions.ExcelFormat.XLSX, // Укажите формат XLSX
5 WorksheetName = "MySheet", // Назовите рабочую таблицу
6 InsertBlankColumnAtFirst = true // Вставьте пустой столбец в начале
7};
8
9// Добавьте входные и выходные файлы
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
12
13// Обработайте конвертацию
14converter.Process(options);
Пакетная обработка конвертации PDF в XLS
С помощью пакетной обработки вы можете конвертировать несколько PDF-файлов в электронные таблицы Excel за один раз. Вот пример:
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// Добавьте несколько входных файлов
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Укажите пути к выходным файлам
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// Выполните пакетную конвертацию
14converter.Process(options);
Обработка результатов конвертации
После процесса конвертации метод Process
возвращает объект ResultContainer
, который содержит детали операции. Вот как получить путь к сконвертированному файлу:
1
2var resultContainer = converter.Process(options);
3
4// Получите путь к выходному файлу
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine("Путь к сконвертированному файлу: " + result.Data.ToString());
Поддерживаемые выходные форматы
Перечисление PdfToXlsOptions.ExcelFormat
предоставляет различные выходные форматы:
- XLSX: Office Open XML (.xlsx) Формат файла (по умолчанию).
- XLSM: Формат Excel с поддержкой макросов.
- CSV: Значения, разделенные запятыми.
- ODS: Открытая электронная таблица.
- XMLSpreadSheet2003: Формат XML Excel 2003.
Основные характеристики:
- Гибкие параметры конвертации: Конвертируйте PDF-файлы в XLSX, XLS, CSV или другие форматы.
- Сохранение содержимого: Сохраняйте оригинальную структуру, макет и форматирование.
- Настраиваемый вывод: Настраивайте диапазоны страниц, имена рабочих таблиц и выходные форматы.
- Пакетная обработка: Обрабатывайте несколько PDF-файлов одновременно для высокой эффективности.
- Расширенное форматирование: Вставляйте пустые столбцы или минимизируйте количество рабочих таблиц.