PDFからXLSへの変換ツール

Documentize PDFからXLSへの変換ツール .NET は、PDF文書をExcelスプレッドシート(XLS/XLSX)に変換するための多目的で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的かつ編集可能なスプレッドシートにシームレスに変換でき、データの操作、分析、および共有を簡素化します。

主な機能:

  • 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換します。
  • コンテンツの保持: 元の構造、レイアウト、およびフォーマットを維持します。
  • カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定できます。
  • バッチ処理: 複数のPDFファイルを同時に処理して高い効率を実現します。
  • 高度なフォーマット: 空の列を挿入したり、ワークシートの数を最小限に抑えたりします。

PDFからExcelへの変換方法

PDF文書をExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。

  1. XlsConverterクラスのインスタンスを作成します。
  2. PdfToXlsOptionsクラスを使用して変換設定を構成します。
  3. AddInputメソッドを使用して入力PDFファイルを追加します。
  4. AddOutputメソッドを使用して出力ファイルパスを指定します。
  5. Processメソッドを実行して変換を開始します。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換を実行
9converter.Process(options);

PDFからExcelへの変換をカスタマイズする

PdfToXlsOptionsクラスを使用すると、変換プロセスをカスタマイズできます。例えば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度なフォーマットオプションを有効にするには:

 1var options = new PdfToXlsOptions
 2{
 3    Format = PdfToXlsOptions.ExcelFormat.XLSX,    // XLSX形式を指定
 4    WorksheetName = "MySheet",                    // ワークシートに名前を付ける
 5    InsertBlankColumnAtFirst = true               // 最初に空の列を挿入
 6};
 7
 8// 入力および出力ファイルを追加
 9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// 変換を処理
13converter.Process(options);

PDFからXLSへのバッチ処理

バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその一例です。

 1var converter = new XlsConverter();
 2var options = new PdfToXlsOptions();
 3
 4// 複数の入力ファイルを追加
 5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
 6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
 7
 8// 出力ファイルパスを指定
 9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を実行
13converter.Process(options);

変換結果の処理

変換プロセスの後、Processメソッドは操作の詳細を含むResultContainerオブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです。

1var resultContainer = converter.Process(options);
2
3// 出力ファイルパスにアクセス
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());

サポートされている出力形式

PdfToXlsOptions.ExcelFormat列挙型は、さまざまな出力形式を提供します。

  • XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
  • XLSM: マクロ対応のExcel形式。
  • CSV: カンマ区切りの値。
  • ODS: Open Document Spreadsheet。
  • XMLSpreadSheet2003: Excel 2003 XML形式。
 日本語