Convertidor de PDF a XLS

El Convertidor de PDF a XLS de Documentize para .NET es una herramienta versátil y poderosa para convertir documentos PDF en hojas de cálculo de Excel (XLS/XLSX). Al aprovechar este complemento, los desarrolladores pueden transformar sin problemas los datos estáticos de PDF en hojas de cálculo dinámicas y editables, simplificando la manipulación, análisis y compartición de datos.

Características Clave:

  • Opciones de Conversión Flexibles: Convierte archivos PDF en XLSX, XLS, CSV u otros formatos.
  • Preservación del Contenido: Mantiene la estructura, diseño y formato originales.
  • Salida Personalizable: Configura rangos de páginas, nombres de hojas de trabajo y formatos de salida.
  • Procesamiento por Lotes: Maneja múltiples archivos PDF simultáneamente para alta eficiencia.
  • Formato Avanzado: Inserta columnas en blanco o minimiza el número de hojas de trabajo.

Cómo Convertir PDF a Excel

Para convertir un documento PDF en un archivo de Excel (XLS/XLSX), sigue estos pasos:

  1. Crea una instancia de la clase XlsConverter.
  2. Configura los ajustes de conversión usando la clase PdfToXlsOptions.
  3. Agrega archivos PDF de entrada usando el método AddInput.
  4. Especifica la ruta del archivo de salida usando el método AddOutput.
  5. Ejecuta el método Process para iniciar la conversión.
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// Agregar rutas de archivos de entrada y salida
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// Realizar la conversión
9converter.Process(options);

Personalizando la Conversión de PDF a Excel

La clase PdfToXlsOptions te permite personalizar el proceso de conversión. Por ejemplo, para convertir el PDF a un archivo XLSX, establece un nombre para la hoja de trabajo y habilita opciones de formato avanzadas:

 1var options = new PdfToXlsOptions
 2{
 3    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // Especificar formato XLSX
 4    WorksheetName = "MySheet",                    // Nombrar la hoja de trabajo
 5    InsertBlankColumnAtFirst = true               // Insertar una columna en blanco al inicio
 6};
 7
 8// Agregar archivos de entrada y salida
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// Procesar la conversión
13converter.Process(options);

Procesamiento por Lotes de PDF a XLS

Con el procesamiento por lotes, puedes convertir múltiples archivos PDF en hojas de cálculo de Excel de una sola vez. Aquí tienes un ejemplo:

 1var converter = new XlsConverter();
 2var options = new PdfToXlsOptions();
 3
 4// Agregar múltiples archivos de entrada
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// Especificar rutas de archivos de salida
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// Realizar la conversión por lotes
13converter.Process(options);

Manejo de Resultados de Conversión

Después del proceso de conversión, el método Process devuelve un objeto ResultContainer que contiene los detalles de la operación. Así es como puedes recuperar la ruta del archivo convertido:

1var resultContainer = converter.Process(options);
2
3// Acceder a la ruta del archivo de salida
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("Ruta del archivo convertido: " + result.Data.ToString());

Formatos de Salida Soportados

El enum PdfToXlsOptions.ExcelFormat proporciona una variedad de formatos de salida:

  • XLSX: Formato de archivo Office Open XML (.xlsx) (por defecto).
  • XLSM: Formato de Excel habilitado para macros.
  • CSV: Valores separados por comas.
  • ODS: Hoja de cálculo de documento abierto.
  • XMLSpreadSheet2003: Formato XML de Excel 2003.
 Español