Extraer Propiedades / Metadatos

El Documentize PDF Extractor for .NET simplifica la extracción de metadatos de documentos PDF.
Propiedades disponibles que pueden interesarte: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.

Cómo extraer metadatos de un archivo PDF

El ejemplo muestra cómo extraer propiedades (Title, Author, Subject, Keywords, Number of Pages) de un archivo PDF.
Para extraer metadatos de un documento PDF, sigue estos pasos:

  1. Crea una instancia de ExtractPropertiesOptions para configurar las opciones de extracción y el archivo PDF de entrada.
  2. Ejecuta el método Extract de PdfExtractor para obtener los metadatos.
  3. Accede a las propiedades extraídas mediante PdfProperties.
 1// Create ExtractPropertiesOptions object to set input file
 2var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
 3// Perform the process and get Properties
 4var pdfProperties = PdfExtractor.Extract(options);
 5var filename = pdfProperties.FileName;
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cómo extraer metadatos de un flujo (stream) PDF

Puedes abrir el flujo a tu discreción.

 1// Create ExtractPropertiesOptions object to set input stream
 2var stream = File.OpenRead("path_to_your_pdf_file.pdf");
 3var options = new ExtractPropertiesOptions(stream);
 4// Perform the process and get Properties
 5var pdfProperties = PdfExtractor.Extract(options);
 6var title = pdfProperties.Title;
 7var author = pdfProperties.Author;
 8var subject = pdfProperties.Subject;
 9var keywords = pdfProperties.Keywords;
10var created = pdfProperties.Created;
11var modified = pdfProperties.Modified;
12var application = pdfProperties.Application;
13var pdfProducer = pdfProperties.PdfProducer;
14var numberOfPages = pdfProperties.NumberOfPages;

Cómo extraer metadatos de un archivo PDF en el estilo más corto posible

1// Perform the process and get Properties
2var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Características clave:

  • Metadatos disponibles: FileName, Title, Author, Subject, Keywords, Created, Modified, Application, PDF Producer, Number of Pages.
 Español