PDF to XLS Converter

Documentize PDF to XLS Converter for .NETは、PDFドキュメントをExcelスプレッドシート(XLS/XLSX)に変換するための多用途で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的で編集可能なスプレッドシートにシームレスに変換し、データ操作、分析、共有を簡素化できます。

PDFをExcelに変換する方法

PDFドキュメントをExcelファイル(XLS/XLSX)に変換するには、以下の手順に従います:

  1. XlsConverterクラスのインスタンスを作成します。
  2. PdfToXlsOptionsクラスを使用して変換設定を構成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して出力ファイルパスを指定します。
  5. Processメソッドを実行して変換を開始します。
 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 入力および出力ファイルパスを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
 7options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
 8
 9// 変換を実行  
10converter.Process(options);  

PDFをExcelへの変換をカスタマイズする

PdfToXlsOptionsクラスを使用すると、変換プロセスをカスタマイズできます。たとえば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度な書式設定オプションを有効にするには次のようにします:

 1  
 2var options = new PdfToXlsOptions  
 3{  
 4    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // XLSXフォーマットを指定  
 5    WorksheetName = "MySheet",                    // ワークシートに名前を付ける  
 6    InsertBlankColumnAtFirst = true               // 最初に空白の列を挿入  
 7};  
 8
 9// 入力および出力ファイルを追加  
10options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));  
12
13// 変換を処理  
14converter.Process(options);  

PDFをXLSへのバッチ処理

バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその例です:

 1  
 2var converter = new XlsConverter();  
 3var options = new PdfToXlsOptions();  
 4
 5// 複数の入力ファイルを追加  
 6options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));  
 7options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));  
 8
 9// 出力ファイルパスを指定  
10options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));  
11options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));  
12
13// バッチ変換を実行  
14converter.Process(options);  

変換結果の処理

変換プロセス後、Processメソッドは操作の詳細を含むResultContainerオブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです:

1  
2var resultContainer = converter.Process(options);  
3
4// 出力ファイルパスにアクセス  
5var result = resultContainer.ResultCollection[0];  
6Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());  

サポートされている出力形式

PdfToXlsOptions.ExcelFormat enumは、さまざまな出力形式を提供します:

  • XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
  • XLSM: マクロ対応のExcelフォーマット。
  • CSV: カンマ区切りの値。
  • ODS: オープンドキュメントスプレッドシート。
  • XMLSpreadSheet2003: Excel 2003 XMLフォーマット。

主な機能:

  • 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換。
  • コンテンツの保持: 元の構造、レイアウト、および書式設定を維持。
  • カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定。
  • バッチ処理: 複数のPDFファイルを同時に処理して高効率を実現。
  • 高度な書式設定: 空白の列を挿入したり、ワークシートの数を最小限に抑えたり。
 日本語