プロパティの抽出 / メタデータ

Documentize PDF Extractor for .NET は、PDF 文書からメタデータを抽出する作業を簡素化します。
利用可能なプロパティの例: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。

PDF ファイルからメタデータを抽出する方法

この例では、PDF ファイルからプロパティ (Title、Author、Subject、Keywords、Number of Pages) を抽出する手順を示します。
PDF 文書からメタデータを抽出するには、次の手順を実行します。

ExtractPropertiesOptions のインスタンスを作成し、抽出オプションと入力 PDF ファイルを設定します。
PdfExtractor の Extract メソッドを実行してメタデータを抽出します。
PdfProperties を使用して抽出されたプロパティにアクセスします。

 1// Create ExtractPropertiesOptions object to set input file
 2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
 3// Perform the process and get Properties
 4var pdfProperties = PdfExtractor.Extract(options);
 5var filename = pdfProperties.FileName;
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

PDF ストリームからメタデータを抽出する方法

ストリームは任意のタイミングで開くことができます。

 1// Create ExtractPropertiesOptions object to set input stream
 2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
 3var options = new ExtractPropertiesOptions(stream);
 4// Perform the process and get Properties
 5var pdfProperties = PdfExtractor.Extract(options);
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

最も簡潔なスタイルで PDF ファイルからメタデータを抽出する方法

1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

主な機能:

利用可能なメタデータ: FileName、Title、Author、Subject、Keywords、Created、Modified、Application、PDF Producer、Number of Pages。