Ir al contenido

OCR Activities

Versión: 1.0.0  ·  ID: zoan-packages-ocr  ·  Autor: Zoan Software

El paquete OCR (Optical Character Recognition, reconocimiento óptico de caracteres) lee el texto que aparece dentro de una imagen: un PDF escaneado, una foto de un documento, una captura de pantalla. Es el complemento del paquete PDF: cuando un documento es una imagen (no tiene texto seleccionable), las actividades de PDF no pueden leerlo — pero OCR sí.

Usa el motor Tesseract, un reconocedor de texto de código abierto ampliamente usado.

Casi todas las actividades aceptan un parámetro language con el código del idioma del texto a reconocer:

ValorIdioma
engInglés (por defecto)
spaEspañol
eng+spaVarios idiomas a la vez

Indicar el idioma correcto mejora mucho la precisión (por los acentos, la ñ, etc.). Para texto en español, usa siempre language = "spa". Para ver qué idiomas están disponibles, usa OCR Get Available Languages.

El parámetro preprocess aplica una limpieza a la imagen antes de reconocerla, lo que mejora el resultado en escaneos de mala calidad:

ValorQué hace
noneSin preprocesado (por defecto en la mayoría)
autoLimpieza completa: quita ruido, binariza y endereza
deskewSolo endereza una imagen torcida
binarizeConvierte a blanco y negro (mejora el contraste)
ActividadTipoSalidaQué hace
OCR Recognize Fileocr-recognizestringLee el texto de un archivo de imagen
OCR Recognize Screen Regionocr-recognize-regionstringLee el texto de un área de la pantalla
OCR Screenshotocr-screenshotstringLee todo el texto de la pantalla
ActividadTipoSalidaQué hace
OCR Find Textocr-find-textobjectEncuentra la posición de un texto
OCR Get Linesocr-get-linesListLista estructurada de líneas y coordenadas
ActividadTipoSalidaQué hace
OCR Extract Patternocr-extract-patternDictionaryExtrae campos con expresiones regulares
OCR Extract Form Fieldsocr-extract-formDictionaryExtrae texto de regiones nombradas
OCR Extract Tableocr-extract-tableDataTableDetecta una tabla en la imagen
ActividadTipoSalidaQué hace
OCR Get Available Languagesocr-get-languagesListIdiomas disponibles

Leer una factura escaneada y extraer su número:

OCR Recognize File path = = rutaImagen language = "spa" preprocess = "auto" → output: texto
Set Variable name = numero value = = regexFind(texto, "FAC-\d+")