PDF to XLS Converter

El Documentize PDF to XLS Converter para .NET es una herramienta versátil y poderosa para convertir documentos PDF en hojas de cálculo de Excel (XLS/XLSX). Al aprovechar este complemento, los desarrolladores pueden transformar sin problemas datos estáticos de PDF en hojas de cálculo dinámicas y editables, simplificando la manipulación, el análisis y el intercambio de datos.

Cómo convertir PDF a Excel

Para convertir un documento PDF en un archivo de Excel (XLS/XLSX), sigue estos pasos:

  1. Crea una instancia de la clase XlsConverter.
  2. Configura la configuración de conversión usando la clase PdfToXlsOptions.
  3. Agrega archivos PDF de entrada usando el método AddInput.
  4. Especifica la ruta del archivo de salida usando el método AddOutput.
  5. Ejecuta el método Process para iniciar la conversión.
 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// Agregar rutas de archivos de entrada y salida  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// Realizar la conversión  
10converter.Process(options);  

Personalizando la conversión de PDF a Excel

La clase PdfToXlsOptions te permite personalizar el proceso de conversión. Por ejemplo, para convertir el PDF a un archivo XLSX, establece un nombre de hoja de trabajo y activa las opciones de formato avanzadas:

 1  
 2var options = new PdfToXlsOptions  
 3{  
 4    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // Especificar el formato XLSX  
 5    WorksheetName = "MySheet",                    // Nombrar la hoja de trabajo  
 6    InsertBlankColumnAtFirst = true               // Insertar una columna en blanco al inicio  
 7};  
 8
 9// Agregar archivos de entrada y salida  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
12
13// Procesar la conversión  
14converter.Process(options);  

Procesamiento por lotes de conversión de PDF a XLS

Con el procesamiento por lotes, puedes convertir múltiples archivos PDF en hojas de cálculo de Excel de una sola vez. Aquí hay un ejemplo:

 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// Agregar múltiples archivos de entrada  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// Especificar rutas de archivos de salida  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// Realizar la conversión por lotes  
14converter.Process(options);  

Manejo de resultados de conversión

Después del proceso de conversión, el método Process devuelve un objeto ResultContainer que contiene los detalles de la operación. Así es como puedes recuperar la ruta del archivo convertido:

1  
2var resultContainer = converter.Process(options);  
3
4// Acceder a la ruta del archivo de salida  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine("Ruta del archivo convertido: " + result.Data.ToString());  

Formatos de salida soportados

El enum PdfToXlsOptions.ExcelFormat proporciona una variedad de formatos de salida:

  • XLSX: Formato de archivo Office Open XML (.xlsx) (predeterminado).
  • XLSM: Formato de Excel habilitado para macros.
  • CSV: Valores separados por comas.
  • ODS: Hoja de cálculo de documento abierto.
  • XMLSpreadSheet2003: Formato XML de Excel 2003.

Características clave:

  • Opciones de conversión flexibles: Convierte archivos PDF en XLSX, XLS, CSV u otros formatos.
  • Preservación del contenido: Mantiene la estructura, el diseño y el formato originales.
  • Salida personalizable: Configura rangos de páginas, nombres de hojas de trabajo y formatos de salida.
  • Procesamiento por lotes: Maneja múltiples archivos PDF simultáneamente para alta eficiencia.
  • Formateo avanzado: Inserta columnas en blanco o minimiza el número de hojas de trabajo.
 Español