Обзор

Documentize — это всеобъемлющая платформа, предоставляющая SDK для управления PDF-документами в приложениях .NET. Эти SDK упрощают сложные задачи, связанные с обработкой PDF, улучшая рабочие процессы с документами и делая их более интуитивно понятными и эффективными для пользователей. Ниже представлено общее представление о его ключевых возможностях:

Основные возможности

  • Конвертация PDF:

    • Конвертируйте PDF в различные форматы, такие как Microsoft Word (DOC/DOCX), Excel (XLS/XLSX), HTML, JPEG и PNG.
    • Поддержка конвертации PDF в формат PDF/A, идеальный для долгосрочного архивирования и соблюдения стандартов хранения.
  • Манипуляция с документами:

    • Слияние и разделение PDF: Легко объединяйте несколько PDF-файлов или делите большие документы на меньшие, более управляемые части.
    • Оптимизация PDF: Сжимайте и улучшайте PDF-документы, чтобы уменьшить размер файла без ущерба для качества содержимого.
  • Извлечение текста:

    • Извлекайте текст с точностью, поддерживая как структурированные, так и неструктурированные форматы данных.
  • Цифровые подписи:

    • Цифровые подписи PDF документов для обеспечения их подлинности и целостности, предоставляя безопасность и доверие для конфиденциальных файлов.

Специализированные SDK

  • Конвертер PDF в DOC: Точно конвертирует содержимое PDF в редактируемые Word документы, сохраняя форматирование и макет.
  • Конвертер PDF в Excel: Извлекает табличные данные из PDF и конвертирует их в электронные таблицы Excel для дальнейшего анализа данных.
  • Интеграция ChatGPT: Позволяет взаимодействовать с ChatGPT, встраивая ответы разговорного ИИ в PDF для уникального улучшения документов.

Использование и совместимость

SDK Documentize разработаны для бесшовной интеграции в приложения .NET, поддерживая несколько платформ, включая Windows, macOS и Linux. SDK предлагают гибкие и мощные API, которые удовлетворяют разнообразным требованиям обработки документов при гарантии высокой производительности и надежности.

Для получения более подробной информации о SDK и их интеграции в ваши проекты посетите официальный сайт.

Подразделы Обзор

Установка

SDK Documentize можно установить несколькими способами, каждый из которых подходит для различных сред разработки и предпочтений. Ниже приведены рекомендуемые способы установки Documentize:

1. NuGet (Предпочтительный Метод)

NuGet — это самый простой и предпочтительный метод установки Documentize, который гарантирует, что у вас всегда будет самая последняя версия и обновления прямо в вашей среде разработки. Узнайте больше об этом методе установки на Как установить SDK Documentize с помощью NuGet.

2. MSI Установщик

MSI установщик — это удобный вариант, если вы предпочитаете установить библиотеки DLL Documentize непосредственно на вашу систему. Этот метод идеально подходит для разработчиков, которые хотят использовать Documentize в нескольких проектах, не управляя вручную файлами DLL. Узнайте больше об этом методе установки на Как установить SDK Documentize с помощью MSI.

3. ZIP Архив

Для разработчиков, предпочитающих ручной подход, ZIP-архив содержит библиотеки DLL Documentize, которые можно извлечь и добавить в ваш проект напрямую. Узнайте больше об этом методе установки на Как установить SDK Documentize с помощью ZIP.

10 окт. 2024 г.

Подразделы Установка

Системные требования

SDK Documentize разработаны для интеграции с приложениями .NET и поддерживают различные операционные системы и среды разработки. Ниже представлены ключевые системные требования:

Поддерживаемые операционные системы

Windows

  • Windows 7 (x64, x86)
  • Windows 8, 8.1 (x64, x86)
  • Windows 10 (x64, x86)
  • Windows 11 (x64, x86)
  • Windows Server 2003 до Windows Server 2022 (x64, x86)
  • Облако: Microsoft Azure

macOS

  • macOS 10.12 (Sierra) и выше

Linux

  • Совместимость с несколькими дистрибутивами Linux:
    • Ubuntu (16.04, 18.04, 20.04, 22.04)
    • CentOS (7, 8)
    • Debian (9, 10)
    • OpenSUSE (Leap 15+, SLES 12+)

Android

  • Поддержка Android 8.0 (Oreo) и выше.

Среды разработки

  • Microsoft Visual Studio:
    • Visual Studio 2010 и выше (включая 2019 и 2022)
  • Поддержка любой среды разработки, ориентированной на платформы .NET.

Поддерживаемые версии .NET Framework

  • .NET Framework 4.0 и выше
  • .NET Standard 2.0 (.NET Core 3.1+)
  • .NET 6.0, .NET 7.0, .NET 8.0

Дополнительные заметки

  • Adobe Acrobat не требуется для работы SDK Documentize, но рекомендуется для просмотра PDF-файлов.
10 окт. 2024 г.

Декларация

SDK Documentize.com требует установки разрешений Полное доверие при использовании в приложениях .NET. Этот уровень разрешений необходим для выполнения определенных действий на системном уровне, таких как доступ к настройкам реестра, системным файлам и разбор шрифтов.

Зачем требуется Полное доверие

SDK Documentize используют основные классы системы .NET, которые часто требуют повышенных разрешений по следующим причинам:

  • Доступ к реестру: Некоторые операции могут требовать чтения или записи в системный реестр.
  • Системные файлы: Доступ к системным файлам за пределами виртуального каталога приложения может быть необходим для выполнения определенных задач, таких как работа с шрифтами или выполнение операций с файлами.

Ограничения среды среднего доверия

В средах хостинга, где применяется безопасность Среднее доверие, несколько важных разрешений ограничиваются или недоступны. Это может помешать корректной работе SDK в таких средах. Следующие ограничения применяются в условиях Среднего доверия:

  • OleDbPermission: Нельзя использовать управляемый провайдер данных OLE DB ADO.NET для доступа к базам данных.
  • EventLogPermission: Доступ к журналу событий Windows запрещен.
  • ReflectionPermission: Запрещает использование рефлексии, что может повлиять на определенные динамические операции.
  • RegistryPermission: Доступ к системному реестру запрещен.
  • WebPermission: Связь ограничена заранее определенными адресами или диапазонами, как настроено в элементе <trust>.
  • FileIOPermission: Доступ к файлам ограничен файлами внутри виртуального каталога приложения.
10 окт. 2024 г.

Не-Windows Среда

SDK Documentize поддерживают .NET Standard 2.0, что позволяет использовать их в приложениях .NET Core, работающих на Linux или других не-Windows средах. Для обеспечения оптимальной производительности и корректной отрисовки текста выполните следующие шаги:

Рекомендуемая настройка для Linux

1. Установите пакет libgdiplus

Этот пакет предоставляет необходимые функции GDI+, которые критически важны для рендеринга и обработки PDF. Вы можете установить его, выполнив следующую команду в терминале:

sudo apt-get install libgdiplus

2. Установите совместимые шрифты Microsoft

Для корректной отрисовки текста установите шрифты TrueType от Microsoft, используя команду:

sudo apt-get install ttf-mscorefonts-installer

Эти шрифты должны быть размещены в директории /usr/share/fonts/truetype/msttcorefonts. Если ваша система хранит шрифты в другой директории, обновите путь в вашем коде перед выполнением любых операций с SDK Documentize:

Documentize.Text.FontRepository.Sources.Add(new FolderFontSource("<path to ms fonts>"));

Совет

Убедившись, что эти установки завершены и правильно настроен путь к шрифтам, вы сможете максимизировать производительность SDK Documentize на Linux или других не-Windows системах.

10 окт. 2024 г.

Оценка

Вы можете легко загрузить SDK Documentize для целей оценки. Оценочная версия идентична купленной версии, единственное отличие - это способ применения лицензии.

Ограничения Оценочной Версии

Хотя оценочная версия предоставляет полный доступ ко всем функциям, она включает следующие ограничения до применения лицензии:

  • В все выходные документы вставляется водяной знак оценки.
  • Можно просмотреть или отредактировать только первые четыре страницы любого PDF-документа.

Чтобы убрать эти ограничения и разблокировать полную версию, просто примените лицензию, добавив несколько строк кода в ваш проект.

10 окт. 2024 г.

Руководство для разработчиков

PDF ChatGPT

Интеграция API ChatGPT с приложениями PDF на .NET

PDF Разделитель

.NET инструмент, который упрощает процесс деления больших PDF документов на меньшие, более управляемые файлы

Безопасность PDF

Шифрование и расшифровка PDF документов с помощью C# .NET

Добавление временных меток в PDF

Добавьте безопасные временные метки к вашим PDF-документам с помощью C# .NET

Извлекатель текста из PDF

.NET плагин, который позволяет эффективно извлекать текст, сохраняя его форматирование или опуская его в зависимости от ваших потребностей

Конвертер PDF в DOC

.NET инструмент для конвертации PDF документов в форматы DOC или DOCX

Конвертер PDF в XLS

.NET плагин позволяет бесшовно конвертировать PDF-документы в Excel-таблицы (XLS/XLSX)

Конвертер PDF/A

.NET плагин конвертирует PDF документы в формат PDF/A, обеспечивая соответствие вашего контента стандартам долгосрочного архивирования

Оптимизатор PDF

Сократите размер файлов, поворачивайте страницы, обрезайте содержимое и изменяйте размер документов

Подпись PDF

.NET плагин предлагает упрощённый процесс добавления подписей, обеспечивая подлинность и безопасность содержания PDF

Слияние PDF

Объедините несколько PDF-документов в один файл с использованием C# .NET

10 окт. 2024 г.

Подразделы Руководство для разработчиков

PDF ChatGPT

Плагин Documentize ChatGPT для .NET — это мощный инструмент, разработанный для интеграции API ChatGPT с PDF-приложениями. Этот плагин позволяет разработчикам генерировать ответы чата на основе входящих сообщений и сохранять вывод в формате PDF, что делает его подходящим для создания разговорных интерфейсов или аналитических отчетов прямо внутри PDF-документов.

Ключевые особенности:

  • Завершения чата: Генерация ответов с использованием API ChatGPT на основе пользовательского ввода.
  • Системные и пользовательские сообщения: Предоставление как системного контекста, так и пользовательского ввода для создания динамичных разговоров.
  • Вывод в формате PDF: Сохранение сгенерированных завершений чата в структурированном PDF-файле для дальнейшего использования.
  • Асинхронная обработка: Обеспечение отзывчивости приложений за счет асинхронной обработки завершений чата.

Генерация ответов чата

Чтобы сгенерировать ответы чата и сохранить их в PDF-файл с использованием плагина ChatGPT, выполните следующие шаги:

  1. Создайте экземпляр класса PdfChatGptRequestOptions для настройки параметров запроса.
  2. Добавьте входные и выходные PDF-файлы.
  3. Установите API-ключ и укажите параметры, такие как максимальное количество токенов и запрос для модели ChatGPT.
  4. Запустите метод ProcessAsync для генерации завершения чата.
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // Установите ваш API-ключ  
 4options.MaxTokens = 1000;  // Установите максимальное количество токенов  
 5options.Query = "Анализируйте этот текст на ключевые темы.";  
 6
 7// Добавьте входной PDF-файл  
 8options.AddInput(new FileDataSource("input.pdf"));  
 9
10// Укажите, где сохранить выходной PDF с ответами чата  
11options.AddOutput(new FileDataSource("output.pdf"));  
12
13// Создайте экземпляр плагина PdfChatGpt  
14var plugin = new PdfChatGpt();  
15
16// Запустите процесс асинхронно  
17var result = await plugin.ProcessAsync(options);  

Добавление системных и пользовательских сообщений

Чтобы создать более интерактивный разговор, вы можете добавить как системные, так и пользовательские сообщения. Эти сообщения помогают формировать контекст разговора.

  1. Добавьте системное сообщение, которое задает контекст для ChatGPT.
  2. Добавьте пользовательское сообщение, которое представляет ввод пользователя для разговора.
 1  
 2var options = new PdfChatGptRequestOptions();  
 3options.ApiKey = "sk-******";  // Установите ваш API-ключ  
 4
 5// Добавьте системное сообщение для контекста  
 6options.AddSystemMessage("Вы - ИИ, обученный для краткого изложения текста.");  
 7
 8// Добавьте пользовательское сообщение для запроса к модели ChatGPT  
 9options.AddUserMessage("Пожалуйста, подведите итог приложенному документу.");  
10
11// Добавьте входные и выходные PDF  
12options.AddInput(new FileDataSource("input.pdf"));  
13options.AddOutput(new FileDataSource("output.pdf"));  
14
15// Обработайте запрос асинхронно  
16var plugin = new PdfChatGpt();  
17var result = await plugin.ProcessAsync(options);  

PDF Разделитель

Документный PDF Разделитель для .NET — это мощный инструмент, который упрощает процесс деления больших PDF документов на меньшие, более управляемые файлы. Неважно, нужно ли вам извлечь отдельные страницы или разделить документ на конкретные секции, этот плагин позволяет достичь этого эффективно и с минимальными усилиями.

Ключевые функции:

  • Разделение PDF по страницам: Разделите PDF документ на отдельные страницы.
  • Пакетная обработка: Разделяйте большие партии PDF сразу.
  • Настраиваемые параметры разделения: Настраивайте процесс разделения в соответствии с вашими требованиями.
  • Организованный вывод: Легко управляйте выходными файлами для каждой разделенной страницы или секции.

Как разделить PDF документы

Чтобы разделить PDF документ на отдельные страницы, выполните следующие шаги:

  1. Создайте экземпляр класса Splitter.
  2. Создайте экземпляр SplitOptions, чтобы настроить параметры разделения.
  3. Добавьте входной PDF файл с помощью метода AddInput.
  4. Добавьте выходные файлы для каждой разделенной страницы с помощью метода AddOutput.
  5. Запустите метод Process, чтобы разделить документ.
 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Добавьте входной PDF файл  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Укажите выходные файлы для каждой страницы  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_1.pdf"));  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_2.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_page_3.pdf"));  
12
13// Обработайте операцию разделения  
14splitter.Process(splitOptions);  

Разделение PDF по диапазонам страниц

Вы также можете разделить PDF, указав диапазоны страниц. Это позволяет извлекать специфические секции или несколько страниц из PDF в отдельные документы.

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Добавьте входной PDF  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7
 8// Определите выходные файлы для диапазонов страниц (например, страницы 1-3)  
 9splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pages_1_to_3.pdf"));  
10
11// Обработайте разделение  
12splitter.Process(splitOptions);  

Как работать с пакетным разделением

Плагин PDF Разделитель оптимизирован для обработки больших партий PDF документов. Вы можете разделить сотни PDF на отдельные страницы или секции, используя пакетную обработку.

 1  
 2var splitter = new Splitter();  
 3var splitOptions = new SplitOptions();  
 4
 5// Добавьте входные PDF файлы в пакете  
 6splitOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7splitOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// Определите выходные файлы для каждого файла  
10splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file1_page1.pdf"));  
11splitOptions.AddOutput(new FileDataSource(@"C:\Samples\output_file2_page1.pdf"));  
12
13// Обработайте пакетное разделение  
14splitter.Process(splitOptions);  

Безопасность PDF

Documentize PDF Security для .NET — это мощный инструмент, предназначенный для повышения безопасности ваших PDF документов, предоставляя возможности шифрования и расшифровки. Он гарантирует, что ваша конфиденциальная информация остается защищенной от несанкционированного доступа.

Ключевые особенности:

  • Шифрование PDF документов: Защитите свои PDF файлы, добавив пароли для пользователя и владельца.
  • Расшифровка PDF документов: Удалите шифрование с PDF файлов при необходимости.
  • Установка разрешений: Контролируйте разрешения, такие как печать, копирование и изменение содержания.
  • Автоматизация: Интегрируйте шифрование и расшифровку в свои .NET приложения для автоматизированных рабочих процессов.
  • Соответствие стандартам: Убедитесь, что ваши документы соответствуют отраслевым стандартам безопасности документов.

Как зашифровать PDF документ

Чтобы зашифровать PDF документ, выполните следующие шаги:

  1. Создайте экземпляр класса Security.
  2. Создайте экземпляр EncryptionOptions с желаемыми паролями для пользователя и владельца.
  3. Добавьте входной PDF файл с помощью метода AddInput.
  4. Установите путь к выходному файлу с помощью AddOutput.
  5. Выполните шифрование с помощью метода Process.
 1// Создаем плагин безопасности
 2var plugin = new Security();
 3
 4// Настраиваем параметры шифрования
 5var opt = new EncryptionOptions("user_password", "owner_password");
 6
 7// Добавляем входной PDF файл
 8opt.AddInput(new FileDataSource("path_to_pdf"));
 9
10// Указываем выходной зашифрованный PDF файл
11opt.AddOutput(new FileDataSource("path_to_encrypted_pdf"));
12
13// Выполняем процесс шифрования
14plugin.Process(opt);

Как расшифровать PDF документ

Чтобы расшифровать PDF документ, выполните следующие шаги:

  1. Создайте экземпляр класса Security.
  2. Создайте экземпляр DecryptionOptions с необходимым паролем.
  3. Добавьте зашифрованный PDF файл с помощью метода AddInput.
  4. Установите путь к выходному файлу с помощью AddOutput.
  5. Выполните расшифровку с помощью метода Process.
 1// Создаем плагин безопасности
 2var plugin = new Security();
 3
 4// Настраиваем параметры расшифровки
 5var opt = new DecryptionOptions("user_password");
 6
 7// Добавляем входной зашифрованный PDF файл
 8opt.AddInput(new FileDataSource("path_to_encrypted_pdf"));
 9
10// Указываем выходной расшифрованный PDF файл
11opt.AddOutput(new FileDataSource("path_to_decrypted_pdf"));
12
13// Выполняем процесс расшифровки
14plugin.Process(opt);

Установка разрешений на PDF документы

При шифровании PDF вы можете установить различные разрешения, чтобы контролировать, как документ может быть использован.

  • Печать: Разрешить или запретить печать документа.
  • Копирование: Разрешить или запретить копирование содержания.
  • Изменение: Разрешить или запретить изменения в документе.

Чтобы установить разрешения, вы можете настроить параметры EncryptionOptions соответствующим образом.

Добавление временных меток в PDF

Документированное добавление временных меток в PDF для .NET — это мощный инструмент, предназначенный для добавления безопасных временных меток к вашим PDF-документам. Он повышает целостность и подлинность ваших документов, предоставляя надежную временную ссылку, что гарантирует соблюдение стандартов цифровой подписи.

Ключевые особенности:

  • Добавление безопасных временных меток: Легко добавляйте безопасные временные метки к вашим PDF-документам.
  • Настраиваемые серверы временных меток: Используйте пользовательские URL-адреса серверов временных меток и учетные данные для аутентификации.
  • Автоматизация: Интегрируйте временные метки в ваши .NET-приложения для автоматизированных рабочих процессов.
  • Соответствие требованиям: Убедитесь, что ваши документы соответствуют отраслевым стандартам для цифровых подписей и временных меток.

Как добавить временную метку к PDF-документам

Чтобы добавить безопасную временную метку к PDF-документу, выполните следующие шаги:

  1. Создайте экземпляр класса Timestamp.
  2. Создайте экземпляр AddTimestampOptions для настройки процесса добавления временной метки.
  3. Добавьте входной PDF-файл с помощью метода AddInput.
  4. Установите путь к выходному файлу с помощью AddOutput.
  5. Выполните процесс добавления временной метки с помощью метода Process.
 1  
 2// Создание экземпляра плагина Timestamp  
 3var plugin = new Timestamp();  
 4
 5// Настройка параметров добавления временной метки  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url");  
 7
 8// Добавление входного PDF файла  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// Указание выходного PDF файла  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// Выполнение процесса добавления временной метки  
15plugin.Process(opt);  

Как использовать пользовательскую аутентификацию с сервером временных меток

Вы можете предоставить учетные данные базовой аутентификации при подключении к серверу временных меток. Это позволяет вам аутентифицироваться на серверах, которые требуют имя пользователя и пароль.

  1. Создайте экземпляр класса Timestamp.
  2. Создайте экземпляр AddTimestampOptions, включая serverBasicAuthCredentials.
  3. Добавьте пути к входному и выходному файлам.
  4. Вызовите метод Process.
 1  
 2// Создание экземпляра плагина Timestamp  
 3var plugin = new Timestamp();  
 4
 5// Настройка параметров добавления временной метки с аутентификацией  
 6var opt = new AddTimestampOptions("path_to_pfx", "password_for_pfx", "timestamp_server_url", "username:password");  
 7
 8// Добавление входного PDF файла  
 9opt.AddInput(new FileDataSource("path_to_pdf"));  
10
11// Указание выходного PDF файла  
12opt.AddOutput(new FileDataSource("path_to_result_pdf"));  
13
14// Выполнение процесса добавления временной метки  
15plugin.Process(opt);  

Работа с PFX-файлами и паролями

Класс AddTimestampOptions позволяет вам использовать PFX-файл для цифровой подписи вместе с паролем.

  • Путь к PFX-стриму или файлу: Вы можете предоставить поток или путь к файлу PFX.
  • Защита паролем: Убедитесь, что вы надежно управляете паролем для PFX-файла.

Извлекатель текста из PDF

Documentize PDF Text Extractor для .NET упрощает извлечение текста из PDF-документов. Независимо от того, нужен ли вам чистый, сырой или простой текст, этот плагин позволяет эффективно извлекать текст, сохраняя его форматирование или опуская его в зависимости от ваших потребностей.

Основные характеристики:

  • Чистый режим: Извлечение текста с сохранением его оригинального форматирования.
  • Сырой режим: Извлечение текста без какого-либо форматирования.
  • Простой режим: Извлечение текста без специальных символов или форматирования.
  • Пакетная обработка: Извлечение текста из нескольких PDF одновременно.

Как извлечь текст из PDF-документов

Чтобы извлечь текст из PDF-документа, выполните следующие шаги:

  1. Создайте экземпляр класса TextExtractor.
  2. Создайте экземпляр TextExtractorOptions, чтобы настроить параметры извлечения.
  3. Добавьте входной PDF-файл, используя метод AddInput.
  4. Запустите метод Process для извлечения текста.
  5. Получите извлечённый текст, используя ResultContainer.ResultCollection.
 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Добавьте входной PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
 6
 7// Процесс извлечения текста
 8var resultContainer = extractor.Process(textExtractorOptions);
 9
10// Вывод извлечённого текста
11var extractedText = resultContainer.ResultCollection[0];
12Console.WriteLine(extractedText);

Извлечение текста из нескольких PDF

Плагин позволяет извлекать текст из нескольких PDF одновременно, обеспечивая быструю и эффективную обработку.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Добавьте несколько входных PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input2.pdf"));
 7
 8// Процесс извлечения
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Вывод извлечённого текста
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Режимы извлечения текста

Плагин TextExtractor предлагает три режима извлечения, обеспечивая гибкость в зависимости от ваших потребностей.

  1. Чистый режим: Сохраняет оригинальное форматирование, включая пробелы и выравнивание.
  2. Сырой режим: Извлекает текст без форматирования, полезен для обработки сырых данных.
  3. Простой режим: Извлекает текст без специальных символов или дополнительного форматирования.
1var textExtractorOptions = new TextExtractorOptions();
2
3// Установите в чистый режим
4textExtractorOptions.Mode = ExtractionMode.Pure;
5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6
7// Обработка и вывод
8var resultContainer = extractor.Process(textExtractorOptions);
9Console.WriteLine(resultContainer.ResultCollection[0]);

Как обрабатывать пакетную обработку

Для больших наборов документов вы можете воспользоваться пакетной обработкой, что позволяет извлекать текст из нескольких PDF одновременно.

 1using var extractor = new TextExtractor();
 2var textExtractorOptions = new TextExtractorOptions();
 3
 4// Добавьте несколько входных PDF
 5textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch1.pdf"));
 6textExtractorOptions.AddInput(new FileDataSource(@"C:\Samples\batch2.pdf"));
 7
 8// Определите вывод для каждого файла
 9var resultContainer = extractor.Process(textExtractorOptions);
10
11// Обработка извлечённого текста
12foreach (var result in resultContainer.ResultCollection)
13{
14    Console.WriteLine(result);
15}

Конвертер PDF в DOC

Конвертер PDF в DOC для .NET — это мощный инструмент, предназначенный для конвертации PDF документов в форматы DOC или DOCX. Этот плагин без усилий преобразует PDF страницы в редактируемые документы Microsoft Word, упрощая повторное использование, редактирование и обмен контентом через несколько платформ.

Ключевые особенности:

  • Конверсия DOC/DOCX: Конвертируйте PDF документы в редактируемые форматы Microsoft Word (DOC или DOCX).
  • Сохранение форматирования: Сохраняйте оригинальную компоновку, текст и форматирование в процессе конверсии.
  • Пакетная обработка: Конвертируйте несколько PDF файлов одновременно.
  • Настраиваемые параметры конверсии: Тонкая настройка процесса конверсии с помощью различных режимов, таких как Улучшенный поток, для лучшего оформления.

Как конвертировать PDF в DOC/DOCX

Чтобы конвертировать PDF документ в формат DOC/DOCX, выполните следующие шаги:

  1. Создайте экземпляр класса PdfDoc.
  2. Создайте экземпляр PdfToDocOptions, чтобы настроить процесс конверсии.
  3. Добавьте входной PDF файл с помощью метода AddInput.
  4. Укажите путь к выходному файлу для результирующего DOC/DOCX файла с помощью метода AddOutput.
  5. Выполните метод Process для выполнения конверсии.
 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX,       // Выходной формат — DOCX  
 6    ConversionMode = ConversionMode.EnhancedFlow // Оптимизация компоновки и форматирования  
 7};  
 8
 9// Добавьте входной PDF файл  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// Добавьте путь к выходному документу Word  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.docx"));  
14
15// Выполните конверсию  
16pdfToWord.Process(options);  

Конвертация PDF в DOC с пользовательскими опциями

Плагин Конвертер PDF в DOC предоставляет несколько опций для настройки процесса конверсии. Вы можете выбирать между различными режимами, чтобы контролировать, как будет обрабатываться компоновка и структура PDF в процессе конверсии.

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.Doc,        // Выходной формат — DOC  
 6    ConversionMode = ConversionMode.Precise // Сохранение оригинальной компоновки PDF по возможности близко  
 7};  
 8
 9// Добавьте входной PDF файл  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11
12// Добавьте путь к выходному документу Word  
13options.AddOutput(new FileDataSource(@"C:\Samples\output.doc"));  
14
15// Выполните конверсию  
16pdfToWord.Process(options);  

Пакетная обработка конверсии PDF в DOC/DOCX

Конвертер PDF в DOC поддерживает пакетную обработку, позволяя вам конвертировать несколько PDF файлов одновременно. Вот пример пакетной конверсии:

 1  
 2var pdfToWord = new PdfDoc();  
 3var options = new PdfToDocOptions()  
 4{  
 5    SaveFormat = SaveFormat.DocX  
 6};  
 7
 8// Добавьте несколько входных PDF файлов  
 9options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// Добавьте пути к выходным файлам для результирующих DOCX файлов  
13options.AddOutput(new FileDataSource(@"C:\Samples\output_file1.docx"));  
14options.AddOutput(new FileDataSource(@"C:\Samples\output_file2.docx"));  
15
16// Выполните пакетную конверсию  
17pdfToWord.Process(options);  

Конвертер PDF в XLS

Конвертер PDF в XLS для .NET - это мощный инструмент, который позволяет бесшовно конвертировать PDF-документы в Excel-таблицы (XLS/XLSX). Этот плагин улучшает доступность и удобство использования вашего PDF-контента, что делает его простым для манипуляции и анализа данных в табличном формате.

Основные характеристики:

  • Конвертировать PDF в Excel: Преобразуйте PDF-файлы в XLS/XLSX таблицы для удобного управления данными.
  • Настраиваемые параметры вывода: Настройте формат вывода, диапазон страниц, имя листа и многое другое.
  • Высококачественная конверсия: Сохраните макет, форматирование и точность содержимого во время конверсии.
  • Пакетная обработка: Конвертируйте несколько PDF-файлов за один раз для масштабных операций.

Как конвертировать PDF в XLS

Чтобы конвертировать PDF-документ в файл Excel (XLS/XLSX), выполните следующие шаги:

  1. Создайте экземпляр класса PdfXls.
  2. Создайте экземпляр PdfToXlsOptions, чтобы настроить параметры конверсии.
  3. Добавьте входной PDF-файл с помощью метода AddInput.
  4. Укажите выходной Excel-файл с помощью метода AddOutput.
  5. Запустите метод Process, чтобы инициировать конверсию.
 1  
 2var pdfXlsConverter = new PdfXls();  
 3var options = new PdfToXlsOptions();  
 4
 5// Добавьте пути к входным и выходным файлам  
 6options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// Запустите процесс конверсии  
10pdfXlsConverter.Process(options);  

Настройка конверсии PDF в Excel

Вы можете настроить параметры конверсии, изменив класс PdfToXlsOptions. Например, чтобы конвертировать PDF в формат XLSX, вставить пустой столбец и задать имя листа, вы можете использовать следующий код:

 1  
 2var options = new PdfToXlsOptions();  
 3
 4// Установите формат вывода на XLSX  
 5options.Format = PdfToXlsOptions.ExcelFormat.XLSX;  
 6
 7// Вставьте пустой столбец на первую позицию  
 8options.InsertBlankColumnAtFirst = true;  
 9
10// Задайте имя листа  
11options.WorksheetName = "MySheet";  
12
13// Добавьте входные и выходные файлы  
14options.AddInput(new FileDataSource(@"C:\Samples\sample.pdf"));  
15options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
16
17// Обработайте конверсию  
18pdfXlsConverter.Process(options);  

Обработка результатов конверсии

После обработки метод Process возвращает объект ResultContainer, который содержит результат конверсии. Вы можете получить путь кConverted файлу или другие детали вывода:

1  
2var resultContainer = pdfXlsConverter.Process(options);  
3
4// Получите доступ и выведите путь к результату  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine(result);  

Пакетная обработка для конверсии PDF в XLS

Плагин Конвертер PDF в XLS также поддерживает пакетную обработку, что позволяет конвертировать несколько PDF-файлов одновременно.

 1  
 2var pdfXlsConverter = new PdfXls();  
 3var options = new PdfToXlsOptions();  
 4
 5// Добавьте несколько входных PDF  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// Добавьте выходные Excel-файлы  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// Обработайте пакетную конверсию  
14pdfXlsConverter.Process(options);  

Конвертер PDF/A

Конвертер PDF/A для .NET — это мощный инструмент, предназначенный для преобразования PDF-документов в формат PDF/A, который обеспечивает соответствие вашего контента стандартам долгосрочного архивирования. Этот плагин также поддерживает валидацию существующих PDF-документов на соответствие PDF/A, предлагая как функции конвертации, так и валидации в одном решении.

Ключевые функции:

  • Преобразование в PDF/A: Бесшовно преобразуйте PDF-файлы в формат PDF/A (например, PDF/A-1a, PDF/A-2b, PDF/A-3b) для обеспечения соответствия стандартам архивирования.
  • Проверка на соответствие PDF/A: Проверяйте существующие PDF-документы на соответствие стандартам PDF/A и выявляйте проблемы в случае несоответствия.
  • Пакетная обработка: Обрабатывайте несколько файлов одновременно для конвертации или валидации.
  • Эффективный рабочий процесс: Минимизируйте время и усилия с помощью быстрых и надежных процессов конвертации.

Как конвертировать PDF в PDF/A

Чтобы преобразовать PDF-документ в формат PDF/A, выполните следующие шаги:

  1. Создайте экземпляр класса PdfAConverter.
  2. Создайте экземпляр PdfAConvertOptions для настройки конвертации.
  3. Укажите желаемую версию PDF/A (например, PDF/A-3B).
  4. Добавьте входной PDF-файл с помощью метода AddInput.
  5. Добавьте выходной файл для результирующего PDF/A с помощью метода AddOutput.
  6. Вызовите метод Process для выполнения конвертации.
 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// Добавьте входной PDF файл  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// Укажите выходной PDF/A файл  
12pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\output_pdfa.pdf"));  
13
14// Обработайте конвертацию  
15pdfAConverter.Process(pdfAOptions);  

Проверка на соответствие PDF/A

Вы можете проверять существующие PDF-файлы на соответствие PDF/A с использованием класса PdfAValidateOptions.

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var validationOptions = new PdfAValidateOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_1A  
 6};  
 7
 8// Добавьте PDF файл для проверки  
 9validationOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10
11// Запустите процесс валидации  
12var resultContainer = pdfAConverter.Process(validationOptions);  
13
14// Проверьте результат валидации  
15var validationResult = (PdfAValidationResult)resultContainer.ResultCollection[0].Data;  
16Console.WriteLine("PDF/A валидация прошла успешно: " + validationResult.IsValid);  

Пакетная обработка для конвертации PDF/A

Этот плагин поддерживает пакетную обработку, позволяя вам конвертировать или проверять несколько PDF-файлов на соответствие PDF/A одновременно.

 1  
 2var pdfAConverter = new PdfAConverter();  
 3var pdfAOptions = new PdfAConvertOptions  
 4{  
 5    PdfAVersion = PdfAStandardVersion.PDF_A_3B  
 6};  
 7
 8// Добавьте несколько входных PDF  
 9pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
10pdfAOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
11
12// Укажите выходные файлы для преобразованных PDF/A  
13pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file1_pdfa.pdf"));  
14pdfAOptions.AddOutput(new FileDataSource(@"C:\Samples\file2_pdfa.pdf"));  
15
16// Обработайте пакетную конвертацию  
17pdfAConverter.Process(pdfAOptions);  

Оптимизатор PDF

Оптимизатор PDF Documentize — это комплексный плагин, который улучшает PDF-документы с помощью передовых методов оптимизации. Он предназначен для того, чтобы помочь сократить размер файлов, поворачивать страницы, обрезать содержимое и изменять размер документов. Эти операции улучшают качество и управляемость PDF-файлов, облегчая их хранение, обмен и просмотр.

Ключевые особенности:

  • Оптимизация: Сократите размер PDF-файла без потери качества.
  • Поворот: Настройте ориентацию страниц PDF.
  • Обрезка: Удалите ненужные поля или содержимое из документа.
  • Изменение размера: Измените размеры страниц на конкретные размеры (например, A4, Letter).

Оптимизация PDF-документа

Следующие шаги демонстрируют, как оптимизировать PDF-документ, сокращая его размер, при этом сохраняя качество.

  1. Создайте экземпляр класса Optimizer.
  2. Создайте объект OptimizeOptions для настройки параметров оптимизации.
  3. Добавьте входной PDF-файл(ы) и установите место для выходного файла.
  4. Запустите метод Process для выполнения оптимизации.
1var optimizer = new Optimizer();
2var optimizeOptions = new OptimizeOptions();
3optimizeOptions.AddInput(new FileDataSource("input.pdf"));
4optimizeOptions.AddOutput(new FileDataSource("output.pdf"));
5optimizer.Process(optimizeOptions);

Изменение размера PDF-документа

Для изменения размера PDF-документа используется класс ResizeOptions, который задает новый размер страницы для документа.

  1. Создайте экземпляр класса Optimizer.
  2. Создайте объект ResizeOptions, чтобы определить размер страницы.
  3. Добавьте входной файл и установите желаемое выходное место.
  4. Используйте метод SetPageSize, чтобы указать новый размер (например, A4).
  5. Вызовите метод Process для применения изменений.
1var optimizer = new Optimizer();
2var resizeOptions = new ResizeOptions();
3resizeOptions.AddInput(new FileDataSource("input.pdf"));
4resizeOptions.SetPageSize(PageSize.A4);
5resizeOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(resizeOptions);

Поворот страниц PDF

Используйте класс RotateOptions для настройки ориентации страниц в PDF-файле.

  1. Создайте экземпляр класса Optimizer.
  2. Создайте объект RotateOptions и настройте угол поворота.
  3. Добавьте входной PDF-файл и укажите место для выходного файла.
  4. Установите угол поворота (например, 90 градусов) с помощью метода SetRotation.
  5. Выполните поворот с помощью метода Process.
1var optimizer = new Optimizer();
2var rotateOptions = new RotateOptions();
3rotateOptions.AddInput(new FileDataSource("input.pdf"));
4rotateOptions.SetRotation(90);
5rotateOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(rotateOptions);

Обрезка PDF-документа

Обрезка удаляет нежелательное содержимое или поля из PDF-документа. Класс CropOptions можно использовать для определения области обрезки.

  1. Создайте экземпляр класса Optimizer.
  2. Определите область обрезки с помощью объекта CropOptions.
  3. Добавьте входной файл и укажите место для выходного файла.
  4. Используйте метод SetCropBox для определения области обрезки.
  5. Выполните обрезку с помощью метода Process.
1var optimizer = new Optimizer();
2var cropOptions = new CropOptions();
3cropOptions.AddInput(new FileDataSource("input.pdf"));
4cropOptions.SetCropBox(new Rectangle(50, 50, 500, 700)); // Определяет область обрезки
5cropOptions.AddOutput(new FileDataSource("output.pdf"));
6optimizer.Process(cropOptions);

Подпись PDF

Плагин Documentize PDF Signature для .NET позволяет пользователям цифровым образом подписывать PDF-документы. Он предлагает упрощённый процесс добавления подписей, обеспечивая подлинность и безопасность содержания PDF. Плагин поддерживает как видимые, так и невидимые подписи и предоставляет возможности для настройки положения подписи, причины, контактной информации и многого другого.

Ключевые функции:

  • Цифровая подпись PDF-документов: Защищайте ваши документы видимыми или невидимыми цифровыми подписями.
  • Поддержка PFX: Подписывайте PDF-файлы с использованием PFX-сертификата.
  • Настраиваемые параметры: Настраивайте настройки подписи, такие как причина, местоположение и контактные данные.
  • Видимые и невидимые подписи: Выбирайте, будет ли подпись видима на документе.

Как подписать PDF-документы

Чтобы подписать PDF-документ с использованием файла PFX, выполните следующие шаги:

  1. Создайте экземпляр класса Signature.
  2. Создайте экземпляр класса SignOptions с путем к файлу PFX и паролем.
  3. Добавьте входной PDF и выходной файл в параметры.
  4. Запустите метод Process, чтобы применить подпись.
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4  
 5// Добавьте входной PDF и укажите выходной файл  
 6signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 8  
 9// Настройте параметры подписи  
10signOptions.Reason = "Договор";  
11signOptions.Contact = "johndoe@example.com";  
12signOptions.Location = "Нью-Йорк";  
13signOptions.PageNumber = 1;  
14signOptions.Visible = true;  
15signOptions.Rectangle = new Rectangle(100, 100, 200, 150);  
16  
17// Примените подпись к документу  
18signature.Process(signOptions);  

Как использовать поток для PFX-файла

Вы также можете подписать PDF, используя PFX-сертификат, предоставленный в виде потока вместо пути к файлу. Это позволяет более гибко управлять хранением сертификатов.

  1. Создайте экземпляр класса Signature.
  2. Создайте SignOptions с потоком, содержащим PFX, и паролем.
  3. Добавьте входные и выходные файлы.
  4. Запустите метод Process, чтобы применить подпись.
 1  
 2using var pfxStream = File.OpenRead(@"C:\certificates\myCertificate.pfx");  
 3var signature = new Signature();  
 4var signOptions = new SignOptions(pfxStream, "pfxPassword");  
 5  
 6// Добавьте входные и выходные файлы  
 7signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 8signOptions.AddOutput(new FileDataSource(@"C:\Samples\signedOutput.pdf"));  
 9  
10// Примените подпись  
11signature.Process(signOptions);  

Как применять невидимые подписи

Чтобы добавить невидимую подпись (которая защищает документ без отображения подписи на документе), просто установите свойство Visible в false.

  1. Создайте экземпляр SignOptions.
  2. Установите Visible в false.
  3. Добавьте входные и выходные файлы.
  4. Вызовите Process, чтобы применить невидимую подпись.
 1  
 2var signature = new Signature();  
 3var signOptions = new SignOptions(@"C:\certificates\myCertificate.pfx", "pfxPassword");  
 4  
 5// Настройте невидимую подпись  
 6signOptions.Visible = false;  
 7  
 8// Добавьте входные и выходные файлы  
 9signOptions.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
10signOptions.AddOutput(new FileDataSource(@"C:\Samples\invisiblySigned.pdf"));  
11  
12// Обработайте подпись  
13signature.Process(signOptions);  

Слияние PDF

Documentize PDF Merger для .NET – это универсальный инструмент, предназначенный для объединения нескольких PDF-документов в один файл. Он упрощает консолидацию PDF-файлов, обеспечивая их эффективное слияние и сохранение一致ности содержимого. Плагин обрабатывает внутренние ресурсы, такие как шрифты и изображения, для оптимизации объединенного документа.

Ключевые функции:

  • Объединение нескольких PDF: Легко объединяйте несколько PDF-файлов в один.
  • Оптимизация ресурсов: Убирает дублирующиеся шрифты и изображения во время слияния.
  • Пакетная обработка: Объединяйте большие партии PDF-документов за один раз.
  • Безопасное слияние: Обеспечьте целостность документа без потери данных или повреждения содержимого.

Как объединить PDF-документы

Чтобы объединить несколько PDF-документов в один файл, следуйте этим шагам:

  1. Создайте экземпляр класса Merger.
  2. Создайте экземпляр MergeOptions, чтобы настроить процесс слияния.
  3. Добавьте входные PDF-файлы, используя метод AddInput.
  4. Установите путь к выходному файлу, используя AddOutput.
  5. Выполните слияние, используя метод Process.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Добавьте входные PDF-файлы для слияния  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file3.pdf"));  
 9
10// Укажите путь к выходному файлу  
11mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\mergedOutput.pdf"));  
12
13// Объедините PDF  
14merger.Process(mergeOptions);  

Как объединить PDF с диапазоном страниц

Вы также можете объединить определенные диапазоны страниц из входных PDF-файлов, используя класс MergeOptions. Это позволяет вам комбинировать выбранные страницы в окончательном выходном документе.

  1. Создайте экземпляр класса Merger.
  2. Настройте диапазоны страниц с помощью MergeOptions.
  3. Добавьте входные файлы с указанными диапазонами страниц.
  4. Установите выходной путь.
  5. Вызовите метод Process.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Объедините определенные страницы из входных PDF  
 6mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"), new PageRange(1, 3));  
 7mergeOptions.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"), new PageRange(2, 5));  
 8
 9// Укажите путь к выходному файлу  
10mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\outputWithSpecificPages.pdf"));  
11
12// Объедините PDF  
13merger.Process(mergeOptions);  

Как обрабатывать пакетное слияние

Плагин PDF Merger оптимизирован для обработки крупных партий PDF-документов. Используя функцию пакетной обработки, вы можете объединять сотни PDF в одной операции, обеспечивая эффективное и быстрое управление документами.

  1. Создайте экземпляр класса Merger.
  2. Добавьте все входные PDF-файлы в класс MergeOptions.
  3. Укажите выходной путь.
  4. Вызовите метод Process, чтобы объединить все файлы в пакете.
 1  
 2var merger = new Merger();  
 3var mergeOptions = new MergeOptions();  
 4
 5// Добавьте большую партию PDF для слияния  
 6for (int i = 1; i <= 100; i++)  
 7{  
 8    mergeOptions.AddInput(new FileDataSource($@"C:\Samples\file{i}.pdf"));  
 9}  
10
11// Укажите путь к выходному файлу  
12mergeOptions.AddOutput(new FileDataSource(@"C:\Samples\batchMergedOutput.pdf"));  
13
14// Процесс пакетного слияния  
15merger.Process(mergeOptions);  

Часто задаваемые вопросы

Этот раздел содержит полную информацию о характеристиках и функциональных возможностях Documentize .NET Plugins, охватывая такие аспекты, как конверсия PDF, обработка форм и генерация оглавления (TOC).


Общие вопросы

1. Что такое Documentize для .NET?

Documentize для .NET — это мощная библиотека для управления и обработки PDF-документов программным способом. Она включает плагины для преобразования PDF в различные форматы, редактирования PDF-форм, добавления цифровых подписей, создания оглавлений и обеспечения соответствия PDF/A для долговременного архивирования.

2. Как установить плагины Documentize для .NET?

Вы можете установить плагины Documentize, загрузив файлы сборки с официального сайта или получив пакеты напрямую из NuGet. Подробные инструкции по установке доступны в документации каждого плагина.


Плагины для конвертации PDF

3. Как я могу конвертировать PDF-документ в файл Word (DOC/DOCX)?

Для преобразования PDF-документа в формат Word с помощью PDF to DOC Converter:

  1. Создайте экземпляр класса PdfDoc.
  2. Создайте объект PdfToDocOptions для настройки параметров конверсии.
  3. Добавьте пути к входному PDF и выходному файлу DOC/DOCX.
  4. Вызовите метод Process, чтобы выполнить конвертацию.

4. Как конвертировать страницы PDF в изображения JPEG?

Используя PDF to JPEG Converter:

  1. Создайте экземпляр класса Jpeg.
  2. Установите параметры конверсии (например, разрешение, диапазон страниц) через JpegOptions.
  3. Добавьте пути к входным/выходным файлам.
  4. Вызовите метод Jpeg.Process для выполнения конвертации.

5. Как конвертировать PDF в PNG?

Для преобразования PDF в формат PNG:

  1. Создайте экземпляр класса Png и объекта PngOptions.
  2. Добавьте входной PDF и укажите выходную папку.
  3. Установите такие параметры, как разрешение (например, 300 DPI).
  4. Вызовите метод Process, чтобы сгенерировать изображения PNG.

6. Как конвертировать PDF в Excel (XLS/XLSX)?

Для конвертации PDF в Excel:

  1. Создайте экземпляр класса PdfXls.
  2. Используйте PdfToXlsOptions для настройки входных/выходных путей и параметров конверсии.
  3. Вызовите метод Process, чтобы начать конвертацию.

7. Как конвертировать PDF в HTML?

Для преобразования PDF-документов в HTML:

  1. Создайте экземпляр класса PdfHtml.
  2. Настройте параметры конверсии с помощью PdfToHtmlOptions или HtmlToPdfOptions.
  3. Добавьте входные/выходные пути и вызовите метод Process.

Обработка PDF-форм

8. Как я могу редактировать PDF-формы с помощью редактора форм?

PDF Form Editor предоставляет возможности для:

  • Добавления полей (FormEditorAddOptions).
  • Обновления полей (FormEditorSetOptions).
  • Удаления полей (FormRemoveSelectedFieldsOptions).
    После настройки полей формы запустите метод Process.

9. Как упростить PDF-формы?

Чтобы упростить поля формы:

  1. Создайте экземпляр класса FormFlattener.
  2. Используйте FormFlattenAllFieldsOptions, чтобы упростить все поля, или FormFlattenSelectedFieldsOptions, чтобы нацелиться на конкретные поля.
  3. Добавьте входные/выходные файлы и вызовите метод Process.

10. Как я могу экспортировать данные из PDF-форм?

Для экспорта данных формы используйте PDF Form Exporter. Создайте объект FormExporterValuesToCsvOptions, укажите условия полей формы и запустите метод Process, чтобы экспортировать данные в формате CSV.


Управление PDF/A и оглавлением

11. Как конвертировать PDF в формат PDF/A?

Для преобразования PDF в PDF/A:

  1. Используйте класс PdfAConverter.
  2. Настройте версию PDF/A (например, PDF/A-3B) в PdfAConvertOptions.
  3. Добавьте входные/выходные пути и вызовите метод Process.

12. Как генерировать оглавление (TOC) в PDF?

Чтобы создать TOC:

  1. Создайте экземпляр класса TocGenerator.
  2. Используйте TocOptions для определения параметров TOC.
  3. Добавьте входные/выходные файлы и запустите метод Process.

Обработка подписей

13. Как я могу цифровым образом подписать PDF-документ?

Чтобы добавить цифровую подпись:

  1. Создайте экземпляр класса Signature.
  2. Используйте SignOptions для настройки файла PFX, пароля и деталей подписи (например, причины, контактной информации).
  3. Добавьте входные/выходные файлы и запустите метод Process.

Дополнительные функции

14. Могу ли я разделить PDF-файлы с помощью Documentize?

Да, с помощью PDF Splitter:

  1. Создайте экземпляр класса Splitter.
  2. Настройте параметры разделения с помощью SplitOptions.
  3. Добавьте входные/выходные пути и вызовите метод Process.

15. Как объединить несколько PDF-файлов в один?

Чтобы объединить PDF:

  1. Создайте экземпляр класса Merger.
  2. Добавьте входные PDF и укажите выходной файл через MergeOptions.
  3. Запустите метод Process, чтобы объединить файлы.

16. Ограничен ли Documentize работой только с PDF?

Хотя Documentize в основном сосредоточен на манипуляциях с PDF, он также поддерживает конверсии в и из таких форматов, как DOC, XLS, HTML, JPEG и PNG.


Лицензирование и совместимость

17. Каковы системные требования для использования плагинов Documentize?

Documentize поддерживает:

  • Операционные системы: Windows 7-11, Windows Server 2003-2022, macOS (10.12+) и Linux.
  • Фреймворки: .NET Framework 4.0 до 8.0.
  • IDE: Совместимость с различными версиями Visual Studio.

18. Как задать лицензионные ключи для Documentize?

Чтобы активировать плагин, ссылаться на Documentize в вашем проекте и установить лицензионные ключи перед вызовом любых методов. Смотрите документацию конкретного плагина для подробных инструкций.

19. Где я могу найти больше примеров и документации для плагинов Documentize?

Полная документация API и примеры доступны на сайте Documentize или через пакеты NuGet в вашей среде разработки.


 Русский