Ir al contenido

PDF Get Text

Tipo: pdf-get-text  ·  Paquete: PDF Activities v1.0.0  ·  Salida: string

Extrae todo el texto de un PDF, juntando el contenido de todas sus páginas en una sola cadena. Es la actividad central para leer documentos: facturas, contratos, reportes — y luego extraer datos concretos con expresiones regulares.

Lee el texto de cada página del PDF y lo concatena, separando las páginas con separator (por defecto, dos saltos de línea). Devuelve el resultado como un string.

ParámetroEditorDescripción
pathexpresiónRuta del archivo PDF.
ParámetroEditorDescripción
separatorexpresiónSeparador entre páginas. Por defecto, dos saltos de línea.

Devuelve un string con todo el texto del PDF.

Extraer el total y el número de una factura:

PDF Get Text path = = rutaFactura → output: texto
Set Variable name = numero value = = regexFind(texto, "FAC-\d+")
Set Variable name = total value = = regexFind(texto, "Total:\s*\$?([\d.,]+)")