PDF Get Text
PDF Get Text
Sección titulada «PDF Get Text»Tipo: pdf-get-text · Paquete: PDF Activities v1.0.0 · Salida: string
Extrae todo el texto de un PDF, juntando el contenido de todas sus páginas en una sola cadena. Es la actividad central para leer documentos: facturas, contratos, reportes — y luego extraer datos concretos con expresiones regulares.
Cómo funciona
Sección titulada «Cómo funciona»Lee el texto de cada página del PDF y lo concatena, separando las páginas con separator (por defecto, dos saltos de línea). Devuelve el resultado como un string.
Parámetros requeridos
Sección titulada «Parámetros requeridos»| Parámetro | Editor | Descripción |
|---|---|---|
path | expresión | Ruta del archivo PDF. |
Parámetros opcionales
Sección titulada «Parámetros opcionales»| Parámetro | Editor | Descripción |
|---|---|---|
separator | expresión | Separador entre páginas. Por defecto, dos saltos de línea. |
Devuelve un string con todo el texto del PDF.
Ejemplo
Sección titulada «Ejemplo»Extraer el total y el número de una factura:
PDF Get Text path = = rutaFactura → output: textoSet Variable name = numero value = = regexFind(texto, "FAC-\d+")Set Variable name = total value = = regexFind(texto, "Total:\s*\$?([\d.,]+)")Actividades relacionadas
Sección titulada «Actividades relacionadas»- PDF Get Text (Page) — extraer solo una página.
- PDF Search Text — encontrar en qué página está un texto.
- OCR Recognize — para PDF escaneados.