PDFからXLSへの変換ツール
Documentize PDFからXLSへの変換ツール .NET は、PDF文書をExcelスプレッドシート(XLS/XLSX)に変換するための多目的で強力なツールです。このプラグインを活用することで、開発者は静的なPDFデータを動的かつ編集可能なスプレッドシートにシームレスに変換でき、データの操作、分析、および共有を簡素化します。
主な機能:
- 柔軟な変換オプション: PDFファイルをXLSX、XLS、CSV、または他の形式に変換します。
- コンテンツの保持: 元の構造、レイアウト、およびフォーマットを維持します。
- カスタマイズ可能な出力: ページ範囲、ワークシート名、および出力形式を設定できます。
- バッチ処理: 複数のPDFファイルを同時に処理して高い効率を実現します。
- 高度なフォーマット: 空の列を挿入したり、ワークシートの数を最小限に抑えたりします。
PDFからExcelへの変換方法
PDF文書をExcelファイル(XLS/XLSX)に変換するには、以下の手順に従ってください。
XlsConverter
クラスのインスタンスを作成します。PdfToXlsOptions
クラスを使用して変換設定を構成します。AddInput
メソッドを使用して入力PDFファイルを追加します。AddOutput
メソッドを使用して出力ファイルパスを指定します。Process
メソッドを実行して変換を開始します。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 入力および出力ファイルパスを追加
5options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
6options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
7
8// 変換を実行
9converter.Process(options);
PDFからExcelへの変換をカスタマイズする
PdfToXlsOptions
クラスを使用すると、変換プロセスをカスタマイズできます。例えば、PDFをXLSXファイルに変換し、ワークシート名を設定し、高度なフォーマットオプションを有効にするには:
1var options = new PdfToXlsOptions
2{
3 Format = PdfToXlsOptions.ExcelFormat.XLSX, // XLSX形式を指定
4 WorksheetName = "MySheet", // ワークシートに名前を付ける
5 InsertBlankColumnAtFirst = true // 最初に空の列を挿入
6};
7
8// 入力および出力ファイルを追加
9options.AddInput(new FileDataSource(@"C:\Samples\input.pdf"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output.xlsx"));
11
12// 変換を処理
13converter.Process(options);
PDFからXLSへのバッチ処理
バッチ処理を使用すると、複数のPDFファイルを一度にExcelスプレッドシートに変換できます。以下はその一例です。
1var converter = new XlsConverter();
2var options = new PdfToXlsOptions();
3
4// 複数の入力ファイルを追加
5options.AddInput(new FileDataSource(@"C:\Samples\file1.pdf"));
6options.AddInput(new FileDataSource(@"C:\Samples\file2.pdf"));
7
8// 出力ファイルパスを指定
9options.AddOutput(new FileDataSource(@"C:\Samples\output1.xlsx"));
10options.AddOutput(new FileDataSource(@"C:\Samples\output2.xlsx"));
11
12// バッチ変換を実行
13converter.Process(options);
変換結果の処理
変換プロセスの後、Process
メソッドは操作の詳細を含むResultContainer
オブジェクトを返します。変換されたファイルパスを取得する方法は以下の通りです。
1var resultContainer = converter.Process(options);
2
3// 出力ファイルパスにアクセス
4var result = resultContainer.ResultCollection[0];
5Console.WriteLine("変換されたファイルパス: " + result.Data.ToString());
サポートされている出力形式
PdfToXlsOptions.ExcelFormat
列挙型は、さまざまな出力形式を提供します。
- XLSX: Office Open XML (.xlsx)ファイル形式(デフォルト)。
- XLSM: マクロ対応のExcel形式。
- CSV: カンマ区切りの値。
- ODS: Open Document Spreadsheet。
- XMLSpreadSheet2003: Excel 2003 XML形式。