Extraire les propriétés / métadonnées
Le Documentize PDF Extractor pour .NET simplifie l’extraction des métadonnées des documents PDF.
Propriétés disponibles qui pourraient vous intéresser : Titre, Auteur, Sujet, Mots‑clés, Nombre de pages.
Comment extraire les métadonnées d’un fichier PDF
L’exemple montre comment extraire les propriétés (Titre, Auteur, Sujet, Mots‑clés, Nombre de pages) d’un fichier PDF.
Pour extraire les métadonnées d’un document PDF, suivez ces étapes :
- Créez une instance de
ExtractPropertiesOptionspour configurer les options d’extraction et le fichier PDF d’entrée. - Exécutez la méthode
ExtractdePdfExtractorpour extraire les métadonnées. - Accédez aux propriétés extraites via le
PdfProperties.
1// Create ExtractPropertiesOptions object to set input file
2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
3// Perform the process and get Properties
4var pdfProperties = PdfExtractor.Extract(options);
5var title = pdfProperties.Title;
6var author = pdfProperties.Author;
7var subject = pdfProperties.Subject;
8var keywords = pdfProperties.Keywords;
9var numberOfPages = pdfProperties.NumberOfPages;Comment extraire les métadonnées d’un flux PDF
Vous pouvez ouvrir le flux à votre convenance.
1// Create ExtractPropertiesOptions object to set input stream
2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
3var options = new ExtractPropertiesOptions(stream);
4// Perform the process and get Properties
5var pdfProperties = PdfExtractor.Extract(options);
6var title = pdfProperties.Title;
7var author = pdfProperties.Author;
8var subject = pdfProperties.Subject;
9var keywords = pdfProperties.Keywords;
10var numberOfPages = pdfProperties.NumberOfPages;Comment extraire les métadonnées d’un fichier PDF de la manière la plus concise possible
1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));Principales fonctionnalités :
- Métadonnées disponibles : Titre, Auteur, Sujet, Mots‑clés, Nombre de pages.