Подразделы Руководство для разработчиков
HTML Converter
Конвертер Documentize HTML для .NET предоставляет мощные возможности для преобразования документов между форматами PDF и HTML, идеально подходя для веб-приложений, архивирования и генерации отчетов. С множеством вариантов обработки ресурсов и макетов, конвертер адаптируется к различным требованиям проектов.
Конвертация PDF в HTML
Конвертируйте PDF-файлы в HTML, чтобы сделать документы доступными для просмотра в вебе или интеграции в приложения, где предпочитается HTML-формат.
Конвертация HTML в PDF
Преобразуйте HTML-контент в качественные PDF-файлы, идеально подходящие для генерации печатных отчетов, архивирования веб-контента или создания доступных для обмена документальных форматов.
Конвертация PDF в HTML
Чтобы конвертировать PDF в HTML:
- Настройте параметры: Используйте
PdfToHtmlOptions
для настройки выхода, выбирая либо встроенные, либо внешние ресурсы. - Определите пути ввода и вывода: Установите пути для вашего входного PDF и выходного HTML.
- Выполните конвертацию: Вызовите метод
Process
класса HtmlConverter
для конвертации файла.
Пример: Конвертация PDF в HTML с встроенными ресурсами
1// Шаг 1: Настройка параметров для конвертации PDF в HTML
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Шаг 2: Установка путей к файлам
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.html"));
7
8// Шаг 3: Запуск конвертации
9HtmlConverter.Process(options);
Доступные параметры для конвертации PDF в HTML
- SaveDataType:
FileWithEmbeddedResources
: Генерирует один HTML-файл со всеми встроенными ресурсами.FileWithExternalResources
: Сохраняет ресурсы отдельно, идеально подходит для больших HTML-файлов.
Конвертация HTML в PDF
Чтобы конвертировать HTML-документ в PDF, выполните следующие шаги:
- Настройте параметры: Используйте
HtmlToPdfOptions
для определения настроек макета и медиа. - Укажите пути: Установите пути к входному HTML и выходному PDF-файлам.
- Выполните конвертацию: Запустите метод
Process
класса HtmlConverter
для конвертации файла.
Пример: Конвертация HTML в PDF
1// Шаг 1: Настройка параметров для конвертации HTML в PDF
2var options = new HtmlToPdfOptions();
3
4// Шаг 2: Установка путей к файлам
5options.AddInput(new FileDataSource("input.html"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// Шаг 3: Запуск конвертации
9HtmlConverter.Process(options);
Дополнительные параметры для конвертации HTML в PDF
Тип медиа:
HtmlMediaType.Print
: Идеален для генерации PDF, подходящих для печати.HtmlMediaType.Screen
: Используйте при конвертации контента, разработанного для цифрового просмотра.
Корректировки макета:
PageLayoutOption
: Корректирует, как HTML-контент соответствует макету PDF, например, ScaleToPageWidth
, чтобы обеспечить масштабирование контента в ширину PDF.IsRenderToSinglePage
: Позволяет отрисовывать весь HTML-контент на одной странице PDF, если это необходимо для кратких презентаций.
Этот конвертер универсален для различных приложений, от генерации PDF-отчетов на основе веб-контента до конвертации архивов PDF-документов для веб-доступности. Для более сложных конфигураций обратитесь к полной документации Documentize.
PDF Security
Documentize PDF Security для .NET — это мощный инструмент, разработанный для повышения безопасности ваших PDF-документов, предоставляя возможности шифрования и расшифровки. Он гарантирует, что ваша конфиденциальная информация останется защищенной от несанкционированного доступа.
Как зашифровать PDF
Чтобы зашифровать PDF-документ, выполните следующие шаги:
- Создайте экземпляр
EncryptionOptions
с желаемыми паролями для пользователя и владельца. - Добавьте входящий PDF-файл с помощью метода
AddInput
. - Добавьте выходной PDF-файл с помощью метода
AddOutput
. - Выполните шифрование с помощью метода
Process
класса Security
.
1// Создать объект EncryptionOptions для установки инструкций
2var options = new EncryptionOptions("123456", "qwerty");
3// Добавить путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Установить путь к выходному файлу
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Выполнить процесс
8Security.Process(options);
Как расшифровать PDF
Чтобы расшифровать PDF-документ, выполните следующие шаги:
- Создайте экземпляр
DecryptionOptions
с необходимым паролем. - Добавьте входящий PDF-файл с помощью метода
AddInput
. - Добавьте выходной PDF-файл с помощью метода
AddOutput
. - Выполните шифрование с помощью метода
Process
класса Security
.
1// Создать объект DecryptionOptions для установки инструкций
2var options = new DecryptionOptions("123456");
3// Добавить путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Установить путь к выходному файлу
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Выполнить процесс
8Security.Process(options);
Ключевые особенности:
- Шифрование PDF-документов: Защитите свои PDF-файлы, добавив пароли для пользователя и владельца.
- Расшифровка PDF-документов: Удалите шифрование из PDF-файлов при необходимости.
- Автоматизация: Интегрируйте шифрование и расшифровку в свои .NET-приложения для автоматизированных рабочих процессов.
- Соответствие стандартам: Убедитесь, что ваши документы отвечают требованиям отраслевых стандартов безопасности документов.
PDF Optimizer
Оптимизатор PDF от Documentize — это комплексный плагин, который улучшает PDF-документы с помощью современных методов оптимизации. Он предназначен для уменьшения размеров файлов, поворота страниц, обрезки содержимого и изменения размеров документов. Эти операции улучшают качество и управляемость PDF-файлов, что делает их проще в хранении, обмене и просмотре.
Оптимизация PDF
Следующие шаги демонстрируют, как оптимизировать PDF-документ, уменьшая его размер файла, сохраняя при этом качество.
- Создайте объект OptimizeOptions, чтобы настроить параметры оптимизации.
- Добавьте входные PDF-файлы и укажите место для сохранения оптимизированного файла.
- Запустите метод
Process
у Optimizer
, чтобы выполнить оптимизацию.
1// Создайте объект OptimizeOptions, чтобы задать инструкции
2var options = new OptimizeOptions();
3// Добавьте путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Укажите путь к выходному файлу
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Выполните процесс
8Optimizer.Process(options);
Поворот PDF
Используйте класс RotateOptions, чтобы настроить ориентацию страниц в PDF-файле.
- Создайте объект RotateOptions и настройте угол поворота.
- Добавьте входной PDF-файл и укажите место для сохранения выходного файла.
- Установите угол поворота (например, 90 градусов) с помощью метода SetRotation.
- Запустите метод
Process
у Optimizer
.
1// Создайте объект RotateOptions, чтобы задать инструкции
2var options = new RotateOptions();
3// Установите новый угол поворота
4options.Rotation = Rotation.On90;
5// Добавьте путь к входному файлу
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// Укажите путь к выходному файлу
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// Выполните процесс
10Optimizer.Process(options);
Изменение размера PDF
Чтобы изменить размер PDF-документа, используется класс ResizeOptions, чтобы указать новый размер страницы для документа.
- Создайте объект ResizeOptions, чтобы определить размер страницы.
- Добавьте входной файл и укажите желаемое место для сохранения выходного файла.
- Используйте метод SetPageSize, чтобы указать новый размер (например, A4).
- Запустите метод
Process
у Optimizer
.
1// Создайте объект ResizeOptions, чтобы задать инструкции
2var options = new ResizeOptions();
3// Установите новый размер страницы
4options.PageSize = PageSize.A3;
5// Добавьте путь к входному файлу
6options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
7// Укажите путь к выходному файлу
8options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
9// Выполните процесс
10Optimizer.Process(options);
Сжатие PDF
Сжимайте PDF-документ, когда это возможно, удаляя неиспользуемые ресурсы страниц, объединяя одинаковые элементы и отбрасывая избыточные объекты.
- Создайте объект CompressOptions, чтобы настроить параметры оптимизации.
- Добавьте входной файл и укажите место для сохранения выходного файла.
- Используйте метод SetCropBox, чтобы определить область обрезки.
- Запустите метод
Process
у Optimizer
.
1// Создайте объект CompressOptions, чтобы задать инструкции
2var options = new CompressOptions();
3// Добавьте путь к входному файлу
4options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
5// Укажите путь к выходному файлу
6options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
7// Выполните процесс
8Optimizer.Process(options);
Ключевые особенности:
- Оптимизация: уменьшая размер PDF-файла без потери качества.
- Поворот: настройка ориентации страниц PDF.
- Изменение размера: изменение размеров страниц до определенных габаритов (например, A4, Letter).
- Сжатие: удаление неиспользуемых ресурсов страниц и объектов из документа.
PDF Merger
Documentize PDF Merger для .NET — это универсальный инструмент, разработанный для объединения нескольких PDF-документов в один файл. Он упрощает консолидацию PDF-файлов, гарантируя, что ваши документы будут объединены эффективно и сохранят последовательность содержимого. Плагин обрабатывает внутренние ресурсы, такие как шрифты и изображения, чтобы оптимизировать объединенный документ.
Как объединить PDF
Чтобы объединить несколько PDF-документов в один файл, выполните следующие действия:
- Создайте экземпляр
MergeOptions
, чтобы настроить процесс объединения. - Добавьте входные PDF-файлы, используя метод
AddInput
. - Добавьте выходной PDF-файл, используя метод
AddOutput
. - Выполните объединение с помощью метода
Process
класса Merger
.
1// Создание объекта MergeOptions для установки инструкций
2var options = new MergeOptions();
3// Добавление путей к входным файлам
4options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
5options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
6// Установка пути к выходному файлу
7options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
8// Выполнение процесса
9Merger.Process(options);
Основные особенности:
- Объединение нескольких PDFs: Легко объединяйте несколько PDF-файлов в один.
- Оптимизация ресурсов: Удаляет дубликаты шрифтов и изображений при объединении.
- Пакетная обработка: Объединяйте большие партии PDF-документов за один раз.
PDF Table Generator
Генератор таблиц Documentize для .NET — это универсальный плагин, разработанный для упрощения интеграции таблиц в PDF документы. Независимо от того, организуете ли вы данные, разрабатываете формы или улучшаете читаемость документа, этот плагин упрощает процесс, сохраняя точность и эффективность. Его интуитивно понятный API поддерживает как обработку отдельных документов, так и пакетные рабочие процессы, что делает его незаменимым инструментом для разработчиков, работающих со структурированными данными.
Создание PDF с таблицами
Следуйте этим шагам, чтобы создать структурированные таблицы в PDF с помощью класса TableGenerator
:
- Создайте экземпляр класса
TableGenerator
. - Настройте объект
TableOptions
для определения структуры таблицы, содержимого и входных/выходных файлов. - Добавьте таблицы, строки и ячейки в ваш PDF.
- Завершите процесс генерации таблицы с помощью метода
Process
.
Вот пример:
1var generator = new TableGenerator();
2var options = new TableOptions();
3
4// Укажите входные и выходные PDF файлы
5options.AddInput(new FileDataSource("input.pdf"));
6options.AddOutput(new FileDataSource("output.pdf"));
7
8// Определите таблицу с рядами и ячейками
9options
10 .InsertPageAfter(1) // Добавьте таблицу после первой страницы
11 .AddTable()
12 .AddRow()
13 .AddCell().AddParagraph(new TextFragment("Ячейка 1"))
14 .AddCell().AddParagraph(new TextFragment("Ячейка 2"))
15 .AddCell().AddParagraph(new TextFragment("Ячейка 3"));
16
17// Сгенерируйте таблицу в документе
18generator.Process(options);
Добавление насыщенного содержимого в таблицы
Таблицы в PDF документах могут включать различные типы содержимого, чтобы улучшить их функциональность и внешний вид. Ниже приведен пример добавления HTML содержимого в ячейки таблицы:
1options
2 .AddTable()
3 .AddRow()
4 .AddCell().AddParagraph(new HtmlFragment("<h1>Заголовок 1</h1>"))
5 .AddCell().AddParagraph(new HtmlFragment("<h2>Заголовок 2</h2>"))
6 .AddCell().AddParagraph(new HtmlFragment("<h3>Заголовок 3</h3>"));
Поддерживаемые типы содержимого в таблицах
Генератор таблиц PDF поддерживает различные типы содержимого, позволяя разработчикам настраивать таблицы под широкий спектр случаев использования:
- HtmlFragment: Добавьте содержимое на основе HTML, такое как заголовки, списки и отформатированный текст.
- TeXFragment: Включите содержимое на основе LaTeX для математических уравнений и научной нотации.
- TextFragment: Вставьте обычный или отформатированный текст.
- Image: Встраивайте изображения непосредственно в ячейки таблиц.
Настройка макета и структуры таблицы
Плагин предоставляет гибкость для настройки структуры таблицы, включая высоту строк, ширину столбцов и выравнивание ячеек. Эти параметры настройки позволяют вам разрабатывать таблицы, которые соответствуют макету и стилю вашего документа.
Обработка генерации таблицы
После добавления всего содержимого и настройки структуры таблицы завершите процесс, вызвав метод Process
. Этот метод генерирует таблицы и обновляет PDF документ. Вот как справляться с результатами:
1var resultContainer = generator.Process(options);
2
3// Вывод количества сгенерированных результатов
4Console.WriteLine("Количество результатов: " + resultContainer.ResultCollection.Count);
Сценарии использования для генератора таблиц PDF
- Отчетность по данным: Представьте аналитику, финансовые отчеты или результаты опросов в ясном и организованном формате.
- Дизайн форм: Создайте интерактивные формы со структурированными макетами таблиц.
- Улучшение документа: Улучшите читаемость и удобство использования пользовательских руководств, инструкций или информационных материалов.
- Пакетная обработка: Автоматизируйте генерацию таблиц для нескольких PDF документов.
Ключевые особенности:
- Динамическое создание таблиц: Легко создавайте структурированные таблицы в PDF документах.
- Поддержка насыщенного содержимого: Заполняйте таблицы текстом, HTML, изображениями и содержимым LaTeX.
- Размещение на страницах: Вставляйте таблицы в определенные места внутри PDF с точностью.
- Настраиваемый макет: Регулируйте структуру таблицы, выравнивание ячеек и стили.
- Пакетная обработка: Обрабатывайте несколько документов одновременно для максимальной эффективности.
PDF TOC Generator
Documentize PDF TOC Generator для .NET — это мощный плагин, разработанный для улучшения организации и навигации PDF-документов путем динамического создания оглавления (TOC). Этот плагин упрощает процесс добавления оглавлений в ваши PDF-файлы, делая документы более удобными для навигации и управления.
Как создать оглавление для PDF
Чтобы создать оглавление в PDF-файле, выполните следующие шаги:
- Создайте экземпляр класса
TocGenerator
. - Создайте экземпляр
TocOptions
для настройки параметров генерации TOC. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Укажите выходной PDF-файл с оглавлением с помощью метода
AddOutput
. - Вызовите метод
Process
, чтобы сгенерировать оглавление.
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// Добавление входных и выходных файлов
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
7
8// Генерация оглавления
9tocGenerator.Process(tocOptions);
Настройка оглавления
Вы можете настроить оглавление, изменив класс TocOptions
. Например, вы можете контролировать уровень глубины для записей TOC, установить специфические параметры форматирования и многое другое:
1var tocOptions = new TocOptions
2{
3 Depth = 3, // Установить уровень глубины TOC на 3
4 FontSize = 12, // Установить размер шрифта для записей TOC
5 Title = "Оглавление" // Настроить заголовок TOC
6};
7
8// Добавление входных и выходных файлов
9tocOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output_with_toc.pdf"));
11
12// Генерация оглавления с настроенными параметрами
13tocGenerator.Process(tocOptions);
Как обрабатывать результаты
После обработки метод Process
возвращает объект ResultContainer
, который содержит детали о генерации TOC. Вы можете извлечь и напечатать детали вывода:
1var resultContainer = tocGenerator.Process(tocOptions);
2
3// Получение коллекции результатов и печать пути к выходному файлу
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine(result);
Пакетная обработка для нескольких PDF
Плагин PDF TOC Generator поддерживает пакетную обработку, позволяя добавлять оглавия в несколько PDF-документов одновременно.
1var tocGenerator = new TocGenerator();
2var tocOptions = new TocOptions();
3
4// Добавление нескольких входных PDF
5tocOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6tocOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Добавление выходных PDF с оглавлением
9tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output1_with_toc.pdf"));
10tocOptions.AddOutput(new FileDataSource(@"C:\Samples\output2_with_toc.pdf"));
11
12// Обработка пакетной генерации оглавления
13tocGenerator.Process(tocOptions);
Ключевые особенности:
- Динамическая генерация TOC: Создайте TOC для любого PDF-файла с автоматически генерируемыми записями на основе заголовков или закладок.
- Пакетная обработка: Генерируйте TOC для нескольких PDF-документов сразу.
- Настройка: Контролируйте внешний вид и структуру TOC, включая стили, форматирование и уровни глубины.
- Эффективный рабочий процесс: Минимизируйте время, затрачиваемое на ручное создание TOC, особенно для больших или сложных документов.
PDF Подпись
Плагин Documentize PDF Подпись для .NET позволяет пользователям цифровым образом подписывать PDF-документы. Он предлагает упрощенный процесс добавления подписей, обеспечивая подлинность и безопасность содержимого PDF. Плагин поддерживает как видимые, так и невидимые подписи и предоставляет варианты настройки положения подписи, причины, контактной информации и многое другое.
Как подписать PDF-документы
Чтобы подписать PDF-документ с помощью файла PFX, выполните следующие шаги:
- Создайте экземпляр класса
Signature
. - Создайте экземпляр класса
SignOptions
с путем к файлу PFX и паролем. - Добавьте входной PDF и выходной файл в параметры.
- Запустите метод
Process
, чтобы применить подпись.
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// Добавьте входной PDF и укажите выходной файл
5signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
7
8// Настройте параметры подписи
9signOptions.Reason = "Договор";
10signOptions.Contact = "johndoe@example.com";
11signOptions.Location = "Нью-Йорк";
12signOptions.PageNumber = 1;
13signOptions.Visible = true;
14signOptions.Rectangle = new Rectangle(100, 100, 200, 150);
15
16// Примените подпись к документу
17signature.Process(signOptions);
Как использовать поток для файла PFX
Вы также можете подписать PDF, используя PFX-сертификат, предоставленный в виде потока, а не по пути к файлу. Это позволяет более гибко обрабатывать хранение сертификатов.
- Создайте экземпляр класса
Signature
. - Создайте
SignOptions
с потоком, содержащим PFX и пароль. - Добавьте входные и выходные файлы.
- Запустите метод
Process
, чтобы применить подпись.
1using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");
2var signature = new Signature();
3var signOptions = new SignOptions(pfxStream, "pfxPassword");
4
5// Добавьте входные и выходные файлы
6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));
8
9// Примените подпись
10signature.Process(signOptions);
Как применить невидимые подписи
Чтобы добавить невидимую подпись (такую, которая защищает документ без отображения подписи на документе), просто установите свойство Visible
в false
.
- Создайте экземпляр
SignOptions
. - Установите
Visible
в false
. - Добавьте входные и выходные файлы.
- Вызовите
Process
, чтобы применить невидимую подпись.
1var signature = new Signature();
2var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");
3
4// Настройте невидимую подпись
5signOptions.Visible = false;
6
7// Добавьте входные и выходные файлы
8signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));
10
11// Обработайте подпись
12signature.Process(signOptions);
Ключевые особенности:
- Цифровая подпись PDF-документов: Обеспечьте безопасность своих документов с видимыми или невидимыми цифровыми подписями.
- Поддержка PFX: Подписывайте PDF-файлы с использованием PFX-сертификата.
- Настраиваемые параметры: Настройте параметры подписи, такие как причина, местоположение и контактные данные.
- Видимые и невидимые подписи: Выберите, должна ли подпись быть видимой на документе.
PDF Splitter
PDF Splitter для .NET от Documentize — это мощный инструмент, упрощающий процесс разделения больших PDF-документов на меньшие, более управляемые файлы. Независимо от того, нужно ли вам извлечь отдельные страницы или разделить документ на конкретные разделы, этот плагин позволяет делать это эффективно и с минимальными усилиями.
Как разделить PDF
Чтобы разделить PDF-документ на отдельные страницы, выполните следующие шаги:
- Создайте экземпляр
SplitOptions
, чтобы настроить параметры разделения. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Добавьте выходные файлы для каждой разделенной страницы с помощью метода
AddOutput
. - Запустите метод
Process
в классе Splitter
, чтобы разделить документ.
1var splitOptions = new SplitOptions();
2
3// Добавьте входной PDF-файл
4splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
5
6// Укажите выходные файлы для каждой страницы
7splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));
8splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));
9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));
10
11// Обработать операцию разделения
12Splitter.Process(splitOptions);
Основные функции:
- Разделение PDF по страницам: Разделите PDF-документ на отдельные страницы.
- Пакетная обработка: Разделите большие партии PDF-документов за один раз.
- Пользовательские параметры разделения: Настройте процесс разделения в соответствии с вашими требованиями.
- Упорядоченный вывод: Легко управляйте выходными файлами для каждой разделенной страницы или раздела.
PDF ChatGPT
Плагин Documentize ChatGPT для .NET — это мощный инструмент, предназначенный для интеграции API ChatGPT с PDF-приложениями. Этот плагин позволяет разработчикам генерировать ответы в чате на основе входящих сообщений и сохранять вывод в формате PDF, что делает его подходящим для создания разговорных интерфейсов или отчетов по анализу непосредственно в PDF-документах.
Генерация ответов в чате
Чтобы сгенерировать ответы в чате и сохранить их в PDF-файл с помощью плагина ChatGPT, выполните следующие шаги:
- Создайте экземпляр класса
PdfChatGptRequestOptions
, чтобы настроить параметры запроса. - Добавьте входные и выходные PDF-файлы.
- Установите ключ API и укажите параметры, такие как максимальное количество токенов и запрос для модели ChatGPT.
- Запустите метод
ProcessAsync
, чтобы сгенерировать завершение чата.
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // Установите ваш ключ API
3options.MaxTokens = 1000; // Установите максимальное количество токенов
4options.Query = "Проанализируйте этот текст на наличие ключевых тем.";
5
6// Добавьте входной PDF файл
7options.AddInput(new FileDataSource("input.pdf"));
8
9// Укажите, куда сохранить выходной PDF с ответами чата
10options.AddOutput(new FileDataSource("output.pdf"));
11
12// Создайте экземпляр плагина PdfChatGpt
13var plugin = new PdfChatGpt();
14
15// Запустите процесс асинхронно
16var result = await plugin.ProcessAsync(options);
Ключевые особенности:
- Завершения чата: Генерируйте ответы, используя API ChatGPT на основе пользовательского ввода.
- Сообщения системы и пользователя: Предоставьте как системный контекст, так и пользовательский ввод для создания динамических разговоров.
- Вывод в PDF: Сохраняйте сгенерированные завершения чата в структурированном PDF-файле для дальнейшего использования.
- Асинхронная обработка: Обеспечьте отзывчивые приложения, обрабатывая завершения чата асинхронно.
Добавление системных и пользовательских сообщений
Чтобы создать более интерактивный разговор, вы можете добавить как системные, так и пользовательские сообщения. Эти сообщения помогают формировать контекст беседы.
- Добавьте системное сообщение, которое задает контекст для ChatGPT.
- Добавьте пользовательское сообщение, которое представляет ввод пользователя для беседы.
1var options = new PdfChatGptRequestOptions();
2options.ApiKey = "sk-******"; // Установите ваш ключ API
3
4// Добавьте системное сообщение для контекста
5options.AddSystemMessage("Вы — ИИ, обученный суммировать текст.");
6
7// Добавьте пользовательское сообщение для обращения к модели ChatGPT
8options.AddUserMessage("Пожалуйста, суммируйте приложенный документ.");
9
10// Добавьте входные и выходные PDF
11options.AddInput(new FileDataSource("input.pdf"));
12options.AddOutput(new FileDataSource("output.pdf"));
13
14// Обработайте запрос асинхронно
15var plugin = new PdfChatGpt();
16var result = await plugin.ProcessAsync(options);
Плагин Documentize PDF Image Extractor для .NET позволяет вам легко извлекать изображения из PDF-документов. Он сканирует ваши PDF-файлы, определяет встроенные изображения и извлекает их, сохраняя оригинальное качество и формат. Этот инструмент улучшает доступность визуального контента и упрощает процесс извлечения изображений из PDF.
Как извлечь изображения из PDF
Чтобы извлечь изображения из PDF-файла, выполните следующие шаги:
- Создайте экземпляр класса
ImageExtractor
. - Создайте экземпляр класса
ImageExtractorOptions
. - Добавьте путь к входному файлу в параметры.
- Обработайте извлечение изображения с помощью плагина.
- Извлеките изображения из контейнера результата.
1using var plugin = new ImageExtractor();
2
3// Создайте экземпляр класса ImageExtractorOptions
4var imageExtractorOptions = new ImageExtractorOptions();
5
6// Добавьте путь к входному файлу
7imageExtractorOptions.AddInput(new FileDataSource(Path.Combine(@"C:\Samples\", "sample.pdf")));
8
9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(imageExtractorOptions);
11
12// Получите извлеченное изображение и сохраните его в файл
13var extractedImage = resultContainer.ResultCollection[0].ToStream();
14var outputStream = File.OpenWrite(@"C:\Samples\tmp.jpg");
15extractedImage.CopyTo(outputStream);
Извлечение изображений из нескольких PDF-файлов
Плагин ImageExtractor поддерживает пакетную обработку, позволяя извлекать изображения из нескольких PDF-файлов одновременно. Эта функция особенно полезна, когда у вас есть коллекция PDF-файлов, и необходимо извлечь все изображения за один раз.
1using var plugin = new ImageExtractor();
2var options = new ImageExtractorOptions();
3
4// Добавьте несколько входных PDF-файлов
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));
8
9// Обработайте извлечение изображения
10var resultContainer = plugin.Process(options);
11
12// Сохраните извлеченные изображения из всех файлов
13for (int i = 0; i < resultContainer.ResultCollection.Count; i++)
14{
15 var extractedImage = resultContainer.ResultCollection[i].ToStream();
16 using var outputStream = File.OpenWrite($@"C:\Samples\image_{i + 1}.jpg");
17 extractedImage.CopyTo(outputStream);
18}
Ключевые особенности:
- Извлечение встроенных изображений: Определяйте и извлекайте изображения из PDF-документов.
- Сохранение качества изображения: Обеспечивает сохранение оригинального качества извлеченных изображений.
- Пакетная обработка: Извлекайте изображения из нескольких PDF-документов за одну операцию.
- Гибкий вывод: Сохраняйте извлеченные изображения в вашем предпочтительном формате или месте.
Documentize PDF Text Extractor для .NET упрощает извлечение текста из PDF-документов. Независимо от того, нужен ли вам чистый, необработанный или простой текст, этот плагин позволяет эффективно извлекать текст, сохраняя форматирование или опуская его в зависимости от ваших потребностей.
Как извлечь текст из PDF
Чтобы извлечь текст из PDF-документа, выполните следующие шаги:
- Создайте экземпляр класса
TextExtractor
. - Создайте экземпляр
TextExtractorOptions
для настройки параметров извлечения. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Запустите метод
Process
для извлечения текста. - Получите извлеченный текст с помощью
ResultContainer.ResultCollection
.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Добавить входной PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Обработать извлечение текста
8var resultContainer = extractor.Process(textExtractorOptions);
9
10// Вывод извлеченного текста
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);
Извлечение текста из нескольких PDF
Плагин позволяет извлекать текст из нескольких PDF одновременно, обеспечивая быструю и эффективную обработку.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Добавить несколько входных PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
7
8// Обработать извлечение
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Вывод извлеченного текста
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Режимы извлечения текста
Плагин TextExtractor предлагает три режима извлечения, обеспечивая гибкость в зависимости от ваших потребностей.
- Чистый режим: Сохраняет оригинальное форматирование, включая пробелы и выравнивание.
- Сырой режим: Извлекает текст без форматирования, полезен для обработки необработанных данных.
- Простой режим: Извлекает текст без специальных символов или дополнительного форматирования.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Установить режим Чистый
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Обработать и вывести
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);
Как обрабатывать пакетную обработку
Для больших наборов документов вы можете использовать пакетную обработку, что позволяет извлекать текст из нескольких PDF одновременно.
1using var extractor = new TextExtractor();
2var textExtractorOptions = new TextExtractorOptions();
3
4// Добавить несколько входных PDF
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
7
8// Определить вывод для каждого файла
9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Обработать извлеченный текст
12foreach (var result in resultContainer.ResultCollection)
13{
14 Console.WriteLine(result);
15}
Ключевые особенности:
- Чистый режим: Извлекайте текст, сохраняя его оригинальное форматирование.
- Сырой режим: Извлекайте текст без какого-либо форматирования.
- Простой режим: Извлекайте текст без специальных символов или форматирования.
- Пакетная обработка: Извлекайте текст из нескольких PDF одновременно.
PDF Timestamp Adder
Documentize PDF Timestamp Adder for .NET — это мощный инструмент, предназначенный для добавления защищенных временных меток к вашим PDF-документам. Он повышает целостность и подлинность ваших документов, предоставляя надежную временную ссылку, что обеспечивает соответствие стандартам цифровой подписи.
Как добавить временную метку к PDF
Чтобы добавить защищенную временную метку к PDF-документу, выполните следующие шаги:
- Создайте экземпляр класса
Timestamp
. - Создайте экземпляр
AddTimestampOptions
для настройки процесса временной метки. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Укажите путь к выходному файлу с помощью
AddOutput
. - Выполните процесс временной метки с помощью метода
Process
.
1// Создайте экземпляр плагина Timestamp
2var plugin = new Timestamp();
3
4// Настройте параметры временной метки
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");
6
7// Добавьте входной PDF-файл
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// Укажите выходной PDF-файл
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Выполните процесс временной метки
14plugin.Process(opt);
Как использовать пользовательскую аутентификацию с сервером временных меток
Вы можете предоставить учетные данные базовой аутентификации при подключении к серверу временных меток. Это позволяет вам аутентифицироваться на серверах, требующих имя пользователя и пароль.
- Создайте экземпляр класса
Timestamp
. - Создайте экземпляр
AddTimestampOptions
, включая serverBasicAuthCredentials
. - Добавьте пути к входным и выходным файлам.
- Вызовите метод
Process
.
1// Создайте экземпляр плагина Timestamp
2var plugin = new Timestamp();
3
4// Настройте параметры временной метки с аутентификацией
5var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");
6
7// Добавьте входной PDF-файл
8opt.AddInput(new FileDataSource("path_to_pdf"));
9
10// Укажите выходной PDF-файл
11opt.AddOutput(new FileDataSource("path_to_result_pdf"));
12
13// Выполните процесс временной метки
14plugin.Process(opt);
Работа с PFX-файлами и паролями
Класс AddTimestampOptions
позволяет вам использовать PFX-файл для цифровой подписи вместе с паролем.
- Поток или путь к PFX-файлу: Вы можете предоставить поток или путь к PFX-файлу.
- Защита паролем: Убедитесь, что вы надежно управляете паролем для PFX-файла.
Основные функции:
- Добавление защищенных временных меток: Легко добавляйте защищенные временные метки к вашим PDF-документам.
- Настраиваемые серверы временных меток: Используйте настраиваемые URL-адреса серверов временных меток и учетные данные для аутентификации.
- Автоматизация: Интегрируйте добавление временных меток в ваши .NET-приложения для автоматизированных рабочих процессов.
- Соответствие: Обеспечьте соответствие ваших документов отраслевым стандартам для цифровых подписей и временных меток.
PDF/A Converter
Documentize PDF/A Converter for .NET — мощный инструмент, предназначенный для преобразования PDF-документов в формат PDF/A, обеспечивая соответствие вашим материалам стандартам долгосрочного архивирования. Этот плагин также поддерживает валидацию существующих PDF-документов на соответствие PDF/A, предлагая функции конверсии и валидации в одном решении.
Как преобразовать PDF в PDF/A
Чтобы преобразовать документ PDF в формат PDF/A, выполните следующие шаги:
- Создайте экземпляр класса
PdfAConverter
. - Создайте экземпляр
PdfAConvertOptions
для настройки конверсии. - Укажите желаемую версию PDF/A (например, PDF/A-3B).
- Добавьте входной PDF-файл с помощью метода
AddInput
. - Добавьте выходной файл для полученного PDF/A с помощью метода
AddOutput
. - Вызовите метод
Process
для выполнения конверсии.
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// Добавьте входной PDF-файл
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Укажите выходной PDF/A файл
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));
13
14// Обработайте конверсию
15pdfAConverter.Process(pdfAOptions);
Валидация соответствия PDF/A
Вы можете валидировать существующие PDF-файлы на соответствие PDF/A, используя класс PdfAValidateOptions
.
1
2var pdfAConverter = new PdfAConverter();
3var validationOptions = new PdfAValidateOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_1A
6};
7
8// Добавьте PDF-файл для валидации
9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10
11// Запустите процесс валидации
12var resultContainer = pdfAConverter.Process(validationOptions);
13
14// Проверьте результат валидации
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;
16Console.WriteLine("PDF/A Validation Passed: " + validationResult.IsValid);
П批处理 для конверсии PDF/A
Этот плагин поддерживает пакетную обработку, позволяя вам конвертировать или валидировать несколько PDF-файлов на соответствие PDF/A одновременно.
1
2var pdfAConverter = new PdfAConverter();
3var pdfAOptions = new PdfAConvertOptions
4{
5 PdfAVersion = PdfAStandardVersion.PDF_A_3B
6};
7
8// Добавьте несколько входных PDF-файлов
9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// Укажите выходные файлы для конвертированных PDF/A
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));
15
16// Обработайте пакетную конверсию
17pdfAConverter.Process(pdfAOptions);
Ключевые функции:
- Конвертация в PDF/A: Плавно преобразуйте PDF-файлы в формат PDF/A (такие как PDF/A-1a, PDF/A-2b, PDF/A-3b) для обеспечения соответствия стандартам архивирования.
- Валидация соответствия PDF/A: Проверьте существующие PDF-документы на соответствие стандартам PDF/A и выявите проблемы, если они не соответствуют.
- Пакетная обработка: Обрабатывайте несколько файлов одновременно для конверсии или валидации.
- Эффективный рабочий процесс: Минимизируйте время и усилия с помощью быстрого и надежного процесса конверсии.
PDF to XLS Converter
Конвертер PDF в XLS от Documentize для .NET — это универсальный и мощный инструмент для конвертации PDF-документов в электронные таблицы Excel (XLS/XLSX). Используя этот плагин, разработчики могут без проблем преобразовывать статические данные PDF в динамические и редактируемые таблицы, упрощая манипуляцию данными, анализ и обмен ими.
Как конвертировать PDF в Excel
Чтобы конвертировать документ PDF в файл Excel (XLS/XLSX), выполните следующие шаги:
- Создайте экземпляр класса
XlsConverter
. - Настройте параметры конвертации, используя класс
PdfToXlsOptions
. - Добавьте входные PDF-файлы с помощью метода
AddInput
. - Укажите путь к выходному файлу с помощью метода
AddOutput
. - Выполните метод
Process
, чтобы инициировать конвертацию.
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// Добавьте пути для входного и выходного файла
6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
8
9// Выполните конвертацию
10converter.Process(options);
Настройка конвертации PDF в Excel
Класс PdfToXlsOptions
позволяет вам настроить процесс конвертации. Например, чтобы конвертировать PDF в файл XLSX, задайте имя рабочей таблицы и включите расширенные параметры форматирования:
1
2var options = new PdfToXlsOptions
3{
4 Format = PdfToXlsOptions.ExcelFormat.XLSX, // Укажите формат XLSX
5 WorksheetName = "MySheet", // Назовите рабочую таблицу
6 InsertBlankColumnAtFirst = true // Вставьте пустой столбец в начале
7};
8
9// Добавьте входные и выходные файлы
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
12
13// Обработайте конвертацию
14converter.Process(options);
Пакетная обработка конвертации PDF в XLS
С помощью пакетной обработки вы можете конвертировать несколько PDF-файлов в электронные таблицы Excel за один раз. Вот пример:
1
2var converter = new XlsConverter();
3var options = new PdfToXlsOptions();
4
5// Добавьте несколько входных файлов
6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
8
9// Укажите пути к выходным файлам
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
12
13// Выполните пакетную конвертацию
14converter.Process(options);
Обработка результатов конвертации
После процесса конвертации метод Process
возвращает объект ResultContainer
, который содержит детали операции. Вот как получить путь к сконвертированному файлу:
1
2var resultContainer = converter.Process(options);
3
4// Получите путь к выходному файлу
5var result = resultContainer.ResultCollection[0];
6Console.WriteLine("Путь к сконвертированному файлу: " + result.Data.ToString());
Поддерживаемые выходные форматы
Перечисление PdfToXlsOptions.ExcelFormat
предоставляет различные выходные форматы:
- XLSX: Office Open XML (.xlsx) Формат файла (по умолчанию).
- XLSM: Формат Excel с поддержкой макросов.
- CSV: Значения, разделенные запятыми.
- ODS: Открытая электронная таблица.
- XMLSpreadSheet2003: Формат XML Excel 2003.
Основные характеристики:
- Гибкие параметры конвертации: Конвертируйте PDF-файлы в XLSX, XLS, CSV или другие форматы.
- Сохранение содержимого: Сохраняйте оригинальную структуру, макет и форматирование.
- Настраиваемый вывод: Настраивайте диапазоны страниц, имена рабочих таблиц и выходные форматы.
- Пакетная обработка: Обрабатывайте несколько PDF-файлов одновременно для высокой эффективности.
- Расширенное форматирование: Вставляйте пустые столбцы или минимизируйте количество рабочих таблиц.
PDF to DOC Converter
Конвертер PDF в DOC от Documentize для .NET — это мощный инструмент, предназначенный для преобразования PDF-документов в форматы DOC или DOCX. Этот плагин бесшовно преобразует PDF-страницы в редактируемые документы Microsoft Word, облегчая повторное использование, редактирование и обмен контентом на нескольких платформах.
Как конвертировать PDF в DOC/DOCX
Чтобы конвертировать PDF-документ в формат DOC/DOCX, выполните следующие шаги:
- Создайте экземпляр класса
DocConverter
. - Создайте экземпляр
DocConversionOptions
для настройки процесса конвертации. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Добавьте путь к выходному файлу для результирующего файла DOC/DOCX с помощью метода
AddOutput
. - Выполните метод
Process
, чтобы запустить конвертацию.
1
2var docConverter = new DocConverter();
3var options = new DocConversionOptions()
4{
5 SaveFormat = SaveFormat.DocX, // Формат выходных данных как DOCX
6 ConversionMode = ConversionMode.EnhancedFlow // Оптимизируйте макет и форматирование
7};
8
9// Добавьте входной PDF-файл
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Добавьте путь к документу Word на выходе
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));
14
15// Процесс конвертации
16docConverter.Process(options);
Конвертация PDF в DOC с пользовательскими параметрами
Плагин Конвертер PDF в DOC предоставляет несколько параметров для настройки вашего процесса конвертации. Вы можете выбрать между различными режимами, чтобы контролировать, как макет и структура PDF обрабатываются во время конвертации.
1
2var docConverter = new DocConverter();
3var options = new DocConversionOptions()
4{
5 SaveFormat = SaveFormat.Doc, // Формат выходных данных как DOC
6 ConversionMode = ConversionMode.Precise // Сохранять оригинальный макет PDF как можно ближе
7};
8
9// Добавьте входной PDF-файл
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
11
12// Добавьте путь к документу Word на выходе
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));
14
15// Процесс конвертации
16docConverter.Process(options);
Пакетная обработка конвертации PDF в DOC/DOCX
Плагин Конвертер PDF в DOC поддерживает пакетную обработку, позволяя вам конвертировать несколько PDF-файлов за раз. Вот пример пакетной конвертации:
1
2var docConverter = new DocConverter();
3var options = new DocConversionOptions()
4{
5 SaveFormat = SaveFormat.DocX
6};
7
8// Добавьте несколько входных PDF-файлов
9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
11
12// Добавьте пути к выходным файлам для результирующих DOCX-файлов
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));
15
16// Процесс пакетной конвертации
17docConverter.Process(options);
Ключевые особенности:
- Конвертация DOC/DOCX: Конвертируйте PDF-документы в редактируемые форматы Microsoft Word (DOC или DOCX).
- Сохранение форматирования: Сохраняйте оригинальный макет, текст и форматирование во время процесса конвертации.
- Пакетная обработка: Конвертируйте несколько PDF-файлов сразу.
- Пользовательские параметры конвертации: Настраивайте процесс конвертации с помощью различных режимов, таких как Enhanced Flow, для лучшего макета.
PDF to HTML Converter
Documentize PDF to HTML Converter for .NET — это динамический инструмент, который упрощает конвертацию PDF-документов в формат HTML. Этот плагин предназначен не только для простых изменений формата файла, но и для повышения доступности, что делает документы более удобными для пользователей и адаптированными к веб-средам.
Как конвертировать PDF в HTML
Чтобы конвертировать PDF-документ в HTML, выполните следующие шаги:
- Создайте экземпляр класса
PdfHtml
. - Создайте экземпляр класса
PdfToHtmlOptions
, чтобы настроить параметры конвертации. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Добавьте путь к выходному HTML-файлу с помощью метода
AddOutput
. - Вызовите метод
Process
, чтобы конвертировать PDF в HTML.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Установите пути к входным и выходным файлам
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
7
8// Выполните конвертацию PDF в HTML
9pdfHtml.Process(options);
Как конвертировать HTML в PDF
PDF to HTML Converter также поддерживает конвертацию HTML-файлов обратно в формат PDF, позволяя осуществлять полную двустороннюю конвертацию.
1var pdfHtml = new PdfHtml();
2var options = new HtmlToPdfOptions();
3
4// Установите пути к входным и выходным файлам
5options.AddInput(new FileDataSource(@"C:\Samples\input.html"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.pdf"));
7
8// Выполните конвертацию HTML в PDF
9pdfHtml.Process(options);
Настройка конвертации PDF в HTML
Вы можете настроить процесс конвертации, указав кодировку, шрифты или другие параметры. Вот пример установки кодировки UTF-8 и шрифта Arial для конвертации:
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Установите кодировку и шрифт
5options.Encoding = Encoding.UTF8;
6options.Font = "Arial";
7
8// Добавьте входные и выходные файлы
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.html"));
11
12// Выполните конвертацию
13pdfHtml.Process(options);
Пакетная конвертация из PDF в HTML
Этот плагин также поддерживает пакетную обработку, позволяя вам конвертировать несколько PDF в HTML-файлы за один раз.
1var pdfHtml = new PdfHtml();
2var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
3
4// Добавьте несколько входных PDF-файлов
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// Установите пути к выходным файлам для каждой конвертации
9options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.html"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.html"));
11
12// Выполните пакетную конвертацию
13pdfHtml.Process(options);
Ключевые особенности:
- Конвертация PDF в HTML: Безупречно конвертируйте PDF-документы в полностью функциональные HTML-файлы.
- Встроенные ресурсы: Выбирайте, встраивать ли ресурсы (такие как изображения и шрифты) непосредственно в HTML или ссылаться на них изначально.
- Двусторонняя конвертация: Конвертируйте PDF в HTML и наоборот с полной поддержкой обоих направлений.
- Сохранение макета: Убедитесь, что оригинальный макет и форматирование сохраняются во время конвертации.
- Пользовательская кодировка: Укажите формат кодировки, такой как UTF-8, для точного отображения текста в сконвертированном HTML.
PDF to JPEG Converter
Конвертер PDF в JPEG от Documentize для .NET — это мощный инструмент, который упрощает преобразование PDF-документов в изображения JPEG высокого качества. Этот плагин предназначен для того, чтобы сделать ваш контент более доступным на различных платформах, преобразовывая страницы PDF в широко используемые форматы изображений.
Как преобразовать страницы PDF в JPEG
Чтобы преобразовать PDF-документ в изображения JPEG, выполните следующие шаги:
- Создайте экземпляр класса
Jpeg
. - Создайте экземпляр
JpegOptions
, чтобы настроить процесс конвертации. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Укажите путь для выходного файла JPEG с помощью метода
AddOutput
. - Запустите метод
Process
, чтобы преобразовать страницы PDF в изображения JPEG.
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// Добавьте входной PDF-файл
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Укажите выходной каталог для изображений JPEG
8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
9
10// Обработайте преобразование PDF в JPEG
11converter.Process(options);
Настройка конвертации PDF в JPEG
Вы можете настроить процесс конвертации, изменив разрешение, выбрав диапазоны страниц или установив качество изображения. Вот как преобразовать первую страницу PDF с разрешением 300 dpi:
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// Установите выходное разрешение на 300 dpi и преобразуйте только первую страницу
5options.OutputResolution = 300;
6options.PageRange = new PageRange(1);
7
8// Добавьте входные и выходные пути
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
11
12// Обработайте преобразование
13converter.Process(options);
Пакетная обработка для конвертации PDF в JPEG
Плагин Конвертер PDF в JPEG поддерживает пакетную обработку, позволяя вам преобразовывать несколько страниц из PDF в отдельные файлы JPEG.
1var converter = new Jpeg();
2var options = new JpegOptions();
3
4// Добавьте входной PDF-файл
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Установите выходные пути для каждой страницы
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.jpg"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.jpg"));
10
11// Обработайте пакетное преобразование
12converter.Process(options);
Как обрабатывать результаты преобразования
Метод Process возвращает объект ResultContainer
, который содержит информацию о результатах преобразования. Вы можете напечатать пути к преобразованным JPEG-файлам, как показано ниже:
1ResultContainer resultContainer = converter.Process(options);
2
3// Распечатайте выходные пути изображений JPEG
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
Основные функции:
- Преобразование PDF в JPEG: Легко преобразуйте целые PDF-документы или конкретные страницы в изображения JPEG.
- Пользовательское разрешение: Настройте разрешение (например, 300 dpi) для вывода высокого качества.
- Диапазон страниц: Выберите конкретные страницы или диапазоны для конвертации.
- Пакетная обработка: Преобразуйте несколько страниц PDF или целые документы сразу.
- Быстрое преобразование: Быстрый и эффективный процесс с минимальными усилиями.
PDF to PNG Converter
Конвертер PDF в PNG от Documentize для .NET — это продвинутый инструмент, который позволяет вам конвертировать PDF-документы в качественные изображения PNG. Этот плагин разработан для того, чтобы сделать ваш контент более универсальным, доступным и простым для обмена, преобразуя страницы PDF в широко поддерживаемые форматы изображений.
Как конвертировать PDF в PNG
Чтобы конвертировать PDF-документ в изображения PNG, выполните следующие шаги:
- Создайте экземпляр класса
Png
. - Создайте экземпляр
PngOptions
, чтобы настроить процесс конвертации. - Добавьте входной PDF файл с помощью метода
AddInput
. - Укажите выходной каталог для изображений PNG с помощью метода
AddOutput
. - Запустите метод
Process
, чтобы конвертировать страницы PDF в изображения PNG.
1var converter = new Png();
2var options = new PngOptions();
3
4// Добавьте входной PDF файл
5options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
6
7// Укажите выходной каталог для изображений PNG
8options.AddOutput(new FileDataSource(@"C:\Samples\images"));
9
10// Процесс конвертации PDF в PNG
11converter.Process(options);
Настройка конвертации PDF в PNG
Вы можете настроить конвертацию, изменяя разрешение и выбирая конкретные страницы. Например, чтобы конвертировать только первую страницу PDF с разрешением 300 DPI:
1var converter = new Png();
2var options = new PngOptions();
3
4// Установите разрешение на вывод 300 DPI
5options.OutputResolution = 300;
6
7// Конвертировать только первую страницу
8options.PageRange = new PageRange(1);
9
10// Добавьте пути для ввода и вывода
11options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));
12options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
13
14// Процесс конвертации
15converter.Process(options);
П批овая обработка для конвертации PDF в PNG
Плагин PDF в PNG Converter также поддерживает пакетную обработку, позволяя вам конвертировать несколько страниц или даже целые PDF-документы в отдельные файлы PNG.
1var converter = new Png();
2var options = new PngOptions();
3
4// Добавьте входной PDF файл
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Установите пути для вывода для каждой страницы
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.png"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.png"));
10
11// Процесс пакетной конвертации
12converter.Process(options);
Обработка результатов конвертации
После обработки конвертации метод Process возвращает объект ResultContainer
, содержащий результаты конвертации. Вы можете распечатать выходные пути изображений PNG следующим образом:
1ResultContainer resultContainer = converter.Process(options);
2
3// Распечатать выходные пути изображений PNG
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
Ключевые особенности:
- Конвертировать PDF в PNG: Быстро и эффективно конвертируйте целые PDF-документы или конкретные страницы в изображения PNG.
- Настраиваемое разрешение: Установите желаемое DPI (например, 300 DPI) для качественного изображения на выходе.
- Пакетная обработка: Конвертируйте несколько страниц PDF или целые документы за один раз.
- Легкое управление выходом: Укажите выходные каталоги для каждого преобразованного файла PNG.
- Быстрая конвертация: Быстро, эффективно и требует минимальных усилий для настройки.
PDF to TIFF Converter
Documentize PDF to TIFF Converter для .NET — это мощный инструмент, разработанный для преобразования PDF-документов в высококачественные изображения TIFF. Этот плагин обеспечивает доступность вашего контента на различных платформах, сохраняя отличную точность и универсальность.
Как преобразовать PDF в TIFF
Чтобы преобразовать PDF-документ в изображения TIFF, выполните следующие действия:
- Создайте экземпляр класса
TiffConverter
. - Создайте экземпляр
PdfToTiffOptions
, чтобы настроить процесс преобразования. - Добавьте входной PDF-файл с помощью метода
AddInput
. - Укажите путь к выходному файлу для изображений TIFF с помощью метода
AddOutput
. - Запустите метод
Process
, чтобы преобразовать страницы PDF в изображения TIFF.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Добавьте входной PDF-файл
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Укажите выходной файл для изображений TIFF
8options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
9
10// Обработайте преобразование PDF в TIFF
11converter.Process(options);
Настройка преобразования PDF в TIFF
Вы можете настроить процесс преобразования, изменив разрешение, включив многопоточную обработку или выбрав диапазоны страниц. Вот как преобразовать первую страницу PDF с разрешением 300 dpi в файл TIFF:
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Установите разрешение на выходе 300 dpi и преобразуйте только первую страницу
5options.OutputResolution = 300;
6options.PageList = new List<int> { 1 };
7
8// Добавьте пути к входным и выходным файлам
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
11
12// Обработайте преобразование
13converter.Process(options);
Создание многопоточных TIFF
Плагин PDF to TIFF Converter поддерживает генерацию многопоточных TIFF, позволяя вам объединить несколько страниц PDF в один файл TIFF для эффективного архивирования или печати.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions
3{
4 MultiPage = true // Включить многопоточную обработку TIFF на выходе
5};
6
7// Добавьте входной PDF-файл
8options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
9
10// Укажите выходной файл для многопоточного TIFF
11options.AddOutput(new FileDataSource(@"C:\Samples\output.tiff"));
12
13// Обработайте преобразование
14converter.Process(options);
Пакетная обработка для преобразования PDF в TIFF
Плагин PDF to TIFF Converter также поддерживает пакетную обработку, позволяя вам одновременно преобразовывать несколько страниц PDF или целые документы в отдельные файлы TIFF.
1var converter = new TiffConverter();
2var options = new PdfToTiffOptions();
3
4// Добавьте входной PDF-файл
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Установите выходные пути для отдельных страниц
8options.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.tiff"));
9options.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.tiff"));
10
11// Обработайте пакетное преобразование
12converter.Process(options);
Как обрабатывать результаты преобразования
Метод Process возвращает объект ResultContainer
, который предоставляет информацию о результатах преобразования. Вы можете распечатать пути к преобразованным файлам TIFF, как показано ниже:
1ResultContainer resultContainer = converter.Process(options);
2
3// Распечатайте выходные пути изображений TIFF
4foreach (FileResult result in resultContainer.ResultCollection)
5{
6 Console.WriteLine(result.Data.ToString());
7}
Основные функции:
- Преобразование PDF в TIFF: Легко преобразуйте целые PDF-документы или конкретные страницы в изображения TIFF.
- Пользовательское разрешение: Настройте разрешение (например, 300 dpi) для получения качественных выходных данных.
- Многопоточный TIFF: Объедините несколько страниц PDF в один файл многопоточного TIFF.
- Диапазон страниц: Преобразуйте конкретные страницы или диапазоны для точных результатов.
- Пакетная обработка: Одновременно преобразуйте несколько документов или страниц PDF.
- Быстрое преобразование: Быстрый и эффективный процесс с минимальными усилиями.
Плагин Documentize PDF Form Flattener for .NET предназначен для преобразования интерактивных PDF-форм в необрабатываемые документы, обеспечивая их защиту от несанкционированных изменений. Этот инструмент преобразует поля формы в статическое содержимое, повышая безопасность ваших PDF-документов. Он особенно полезен, когда необходимо защитить контракты, соглашения или любые документы, поля формы в которых должны оставаться неизменными.
Как сделать поля формы в PDF необрабатываемыми
Чтобы сделать поля формы в PDF-документе необрабатываемыми, выполните следующие шаги:
- Создайте экземпляр класса
FormFlattener
. - Создайте экземпляр класса
FormFlattenAllFieldsOptions
или FormFlattenSelectedFieldsOptions
. - Добавьте входные и выходные файлы в параметры.
- Вызовите метод
Process
, чтобы выполнить операцию флаттинга.
1var formFlattener = new FormFlattener();
2
3// Создайте параметры для обработки всех полей
4var flattenOptions = new FormFlattenAllFieldsOptions();
5
6// Добавьте входные и выходные файлы
7flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
8flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
9
10// Выполните операцию флаттинга формы
11var resultContainer = formFlattener.Process(flattenOptions);
Флаттинг выбранных полей
Вы можете избирательно сделать необрабатываемыми только определенные поля формы на основе таких критериев, как положение поля или его тип.
- Создайте экземпляр класса
FormFlattener
. - Определите критерии для флаттинга конкретных полей, используя
FormFlattenSelectedFieldsOptions
. - Добавьте входные и выходные файлы в параметры.
- Вызовите метод
Process
, чтобы применить изменения.
1var formFlattener = new FormFlattener();
2
3// Создайте параметры для флаттинга выбранных полей (например, поля с координатой x в левом нижнем углу > 300)
4var flattenOptions = new FormFlattenSelectedFieldsOptions(
5 (field) => field.Rect.LLX > 300
6);
7
8// Добавьте входные и выходные файлы
9flattenOptions.Inputs.Add(new FileDataSource("input.pdf"));
10flattenOptions.Outputs.Add(new FileDataSource("output-flat.pdf"));
11
12// Выполните операцию флаттинга формы
13var resultContainer = formFlattener.Process(flattenOptions);
Ключевые функции:
- Флаттинг всех полей формы: Преобразует интерактивные поля формы в необрабатываемое статичное содержимое.
- Флаттинг выбранных полей: Опционально делать необработанными определенные поля в PDF, оставляя другие редактируемыми.
- Защита документов: Обеспечивает защиту от дальнейших изменений для флаттированных полей.
- Пакетная обработка: Способен делать необрабатываемыми несколько PDF-форм за один процесс.
Часто задаваемые вопросы
Этот раздел часто задаваемых вопросов предоставляет исчерпывающую информацию о функциях и возможностях Documentize .NET Plugins, охватывающую такие аспекты, как конвертация PDF, обработка форм и генерация оглавлений (TOC).
Общие вопросы
1. Что такое Documentize для .NET?
Documentize для .NET — это мощная библиотека для программного управления и обработки PDF-документов. Она включает плагины для конвертации PDF в различные форматы, редактирования PDF-форм, добавления цифровых подписей, генерации оглавлений и обеспечения совместимости PDF/A для долгосрочного архивирования.
2. Как установить плагины Documentize для .NET?
Вы можете установить плагины Documentize, загрузив файлы сборок с официального сайта или получив пакеты напрямую из NuGet. Подробные инструкции по установке доступны в документации к каждому плагину.
Плагины конвертации PDF
3. Как я могу конвертировать PDF-документ в файл Word (DOC/DOCX)?
Чтобы конвертировать PDF-документ в формат Word с помощью PDF to DOC Converter:
- Создайте объект класса
PdfDoc
. - Создайте объект
PdfToDocOptions
, чтобы настроить параметры конвертации. - Добавьте пути к входному PDF и выходному файлу DOC/DOCX.
- Вызовите метод
Process
, чтобы выполнить конвертацию.
4. Как я могу конвертировать страницы PDF в изображения JPEG?
Используя PDF to JPEG Converter:
- Создайте экземпляр класса
Jpeg
. - Установите параметры конвертации (например, разрешение, диапазон страниц) через
JpegOptions
. - Добавьте пути к входным/выходным файлам.
- Вызовите метод
Jpeg.Process
, чтобы выполнить конвертацию.
5. Как я могу конвертировать PDF в PNG?
Чтобы конвертировать PDF в формат PNG:
- Создайте экземпляр класса
Png
и объект PngOptions
. - Добавьте входной PDF и укажите выходную папку.
- Установите такие параметры, как разрешение (например, 300 DPI).
- Вызовите метод
Process
, чтобы сгенерировать изображения PNG.
6. Как я могу конвертировать PDF в Excel (XLS/XLSX)?
Для конвертации PDF в Excel:
- Создайте объект класса
PdfXls
. - Используйте
PdfToXlsOptions
, чтобы настроить пути входа/выхода и параметры конвертации. - Вызовите метод
Process
, чтобы начать конвертацию.
7. Как я могу конвертировать PDF в HTML?
Чтобы конвертировать PDF-документы в HTML:
- Создайте экземпляр класса
PdfHtml
. - Настройте параметры конвертации с помощью
PdfToHtmlOptions
или HtmlToPdfOptions
. - Добавьте пути входа/выхода и вызовите метод
Process
.
Обработка PDF-форм
8. Как я могу редактировать PDF-формы с помощью редактора форм?
Редактор PDF-форм предоставляет возможности для:
- Добавления полей (
FormEditorAddOptions
). - Обновления полей (
FormEditorSetOptions
). - Удаления полей (
FormRemoveSelectedFieldsOptions
).
После настройки полей формы выполните метод Process
.
9. Как я могу упрощать PDF-формы?
Чтобы упростить поля формы:
- Создайте экземпляр класса
FormFlattener
. - Используйте
FormFlattenAllFieldsOptions
, чтобы упростить все поля, или FormFlattenSelectedFieldsOptions
, чтобы нацелиться на определенные поля. - Добавьте входные/выходные файлы и вызовите метод
Process
.
10. Как я могу экспортировать данные из PDF-форм?
Чтобы экспортировать данные формы, используйте Экспортер PDF-форм. Создайте объект FormExporterValuesToCsvOptions
, укажите условия для полей формы и вызовите метод Process
, чтобы экспортировать данные в формат CSV.
PDF/A и Управление Оглавлением
11. Как я могу конвертировать PDF в формат PDF/A?
Для конвертации PDF в PDF/A:
- Используйте класс
PdfAConverter
. - Настройте версию PDF/A (например, PDF/A-3B) в
PdfAConvertOptions
. - Добавьте пути входа/выхода и вызовите метод
Process
.
12. Как я могу создать оглавление (TOC) в PDF?
Чтобы создать оглавление:
- Создайте экземпляр класса
TocGenerator
. - Используйте
TocOptions
, чтобы определить параметры TOC. - Добавьте входные/выходные файлы и выполните метод
Process
.
Обработка Подписей
13. Как я могу цифровым образом подписать PDF-документ?
Чтобы добавить цифровую подпись:
- Создайте экземпляр класса
Signature
. - Используйте
SignOptions
, чтобы настроить файл PFX, пароль и детали подписи (например, причина, контактная информация). - Добавьте входные/выходные файлы и выполните метод
Process
.
Дополнительные функции
14. Могу ли я разделить PDF-файлы с помощью Documentize?
Да, с использованием PDF Splitter:
- Создайте экземпляр класса
Splitter
. - Настройте параметры разделения с помощью
SplitOptions
. - Добавьте пути входа/выхода и вызовите метод
Process
.
15. Как я могу объединить несколько PDF-файлов в один?
Чтобы объединить PDF:
- Создайте экземпляр класса
Merger
. - Добавьте входные PDF и укажите выходной файл через
MergeOptions
. - Запустите метод
Process
, чтобы объединить файлы.
16. Ограничивается ли Documentize работой только с PDF?
Хотя Documentize в основном фокусируется на манипуляциях с PDF, он также поддерживает конверсии в и из форматов, таких как DOC, XLS, HTML, JPEG и PNG.
Лицензирование и Совместимость
17. Каковы системные требования для использования плагинов Documentize?
Documentize поддерживает:
- Операционные системы: Windows 7-11, Windows Server 2003-2022, macOS (10.12+) и Linux.
- Фреймворки: .NET Framework 4.0 до 8.0.
- IDE: Совместимо с различными версиями Visual Studio.
18. Как я могу установить лицензионные ключи для Documentize?
Чтобы активировать плагин, сослитесь на Documentize в вашем проекте и установите лицензионные ключи перед вызовом каких-либо методов. Обратитесь к документации конкретного плагина для получения подробных инструкций.
19. Где я могу найти дополнительные примеры и документацию для плагинов Documentize?
Полная документация по API и примеры могут быть найдены на сайте Documentize или через пакеты NuGet в вашей среде разработки.