Ir al contenido

PDF Activities

Versión: 1.0.0  ·  ID: zoan-packages-pdf  ·  Autor: Zoan Software

El paquete PDF lee y manipula archivos PDF: extraer texto, buscar contenido, leer metadatos, y combinar, dividir, extraer páginas, rotar o marcar de agua. Es muy usado en procesos documentales: leer facturas en PDF, separar un lote de documentos, consolidar reportes.

  • Sin sesión: cada actividad recibe la ruta (path) del archivo y trabaja sobre él. No hay que “abrir” ni “cerrar” el PDF.
  • No modifican el original: las actividades de manipulación (combinar, rotar, marca de agua…) crean un archivo nuevo en la ruta output que indiques, y devuelven esa ruta. El PDF de entrada queda intacto.

Varias actividades aceptan especificar páginas con un rango en texto: combinas números sueltos y rangos con guion, separados por comas. Las páginas se numeran desde 1.

"1-3,5,7-9" → páginas 1, 2, 3, 5, 7, 8 y 9
"all" → todas (en Rotate)
ActividadTipoSalidaQué hace
PDF Get Textpdf-get-textstringExtrae todo el texto del PDF
PDF Get Text (Page)pdf-get-text-pagestringExtrae el texto de una página
PDF Get Page Countpdf-get-page-countintNúmero de páginas
PDF Get Metadatapdf-get-metadataDictionaryMetadatos (título, autor, fechas…)
ActividadTipoSalidaQué hace
PDF Contains Textpdf-contains-textboolean¿Contiene el texto?
PDF Search Textpdf-search-textListEn qué páginas aparece el texto
ActividadTipoSalidaQué hace
PDF Mergepdf-mergestringCombina varios PDF en uno
PDF Splitpdf-splitListSepara cada página en un archivo
PDF Extract Pagespdf-extract-pagesstringExtrae páginas concretas a un PDF nuevo
PDF Rotatepdf-rotatestringRota páginas (90/180/270°)
ActividadTipoSalidaQué hace
PDF Createpdf-createstringCrea un PDF nuevo a partir de texto
PDF Add Watermarkpdf-add-watermarkstringAñade una marca de agua a cada página

Leer una factura en PDF y extraer su número con una expresión regular:

PDF Get Text path = = rutaFactura → output: texto
Set Variable name = numero value = = regexFind(texto, "FAC-\d+")
Log message = = "Factura: " + numero