PDF Activities
Versión: 1.0.0 · ID: zoan-packages-pdf · Autor: Zoan Software
El paquete PDF lee y manipula archivos PDF: extraer texto, buscar contenido, leer metadatos, y combinar, dividir, extraer páginas, rotar o marcar de agua. Es muy usado en procesos documentales: leer facturas en PDF, separar un lote de documentos, consolidar reportes.
Cómo funciona este paquete
Sección titulada «Cómo funciona este paquete»- Sin sesión: cada actividad recibe la ruta (
path) del archivo y trabaja sobre él. No hay que “abrir” ni “cerrar” el PDF. - No modifican el original: las actividades de manipulación (combinar, rotar, marca de agua…) crean un archivo nuevo en la ruta
outputque indiques, y devuelven esa ruta. El PDF de entrada queda intacto.
Rangos de páginas
Sección titulada «Rangos de páginas»Varias actividades aceptan especificar páginas con un rango en texto: combinas números sueltos y rangos con guion, separados por comas. Las páginas se numeran desde 1.
"1-3,5,7-9" → páginas 1, 2, 3, 5, 7, 8 y 9"all" → todas (en Rotate)Actividades
Sección titulada «Actividades»Leer y extraer
Sección titulada «Leer y extraer»| Actividad | Tipo | Salida | Qué hace |
|---|---|---|---|
| PDF Get Text | pdf-get-text | string | Extrae todo el texto del PDF |
| PDF Get Text (Page) | pdf-get-text-page | string | Extrae el texto de una página |
| PDF Get Page Count | pdf-get-page-count | int | Número de páginas |
| PDF Get Metadata | pdf-get-metadata | Dictionary | Metadatos (título, autor, fechas…) |
| Actividad | Tipo | Salida | Qué hace |
|---|---|---|---|
| PDF Contains Text | pdf-contains-text | boolean | ¿Contiene el texto? |
| PDF Search Text | pdf-search-text | List | En qué páginas aparece el texto |
Manipular páginas
Sección titulada «Manipular páginas»| Actividad | Tipo | Salida | Qué hace |
|---|---|---|---|
| PDF Merge | pdf-merge | string | Combina varios PDF en uno |
| PDF Split | pdf-split | List | Separa cada página en un archivo |
| PDF Extract Pages | pdf-extract-pages | string | Extrae páginas concretas a un PDF nuevo |
| PDF Rotate | pdf-rotate | string | Rota páginas (90/180/270°) |
Crear y marcar
Sección titulada «Crear y marcar»| Actividad | Tipo | Salida | Qué hace |
|---|---|---|---|
| PDF Create | pdf-create | string | Crea un PDF nuevo a partir de texto |
| PDF Add Watermark | pdf-add-watermark | string | Añade una marca de agua a cada página |
Un flujo típico
Sección titulada «Un flujo típico»Leer una factura en PDF y extraer su número con una expresión regular:
PDF Get Text path = = rutaFactura → output: textoSet Variable name = numero value = = regexFind(texto, "FAC-\d+")Log message = = "Factura: " + numeroSiguientes pasos
Sección titulada «Siguientes pasos»- PDF Get Text — extraer texto (lo más común).
- OCR — para PDF escaneados (imágenes sin texto).
- Expresiones › Regex — extraer datos del texto.