Ir al contenido

Extract Table

Tipo: page-extract-table  ·  Paquete: Browser v1.0.0  ·  Salida: DataTable

Extrae una tabla HTML completa de la página y la convierte en una DataTable, lista para recorrer, filtrar o volcar a Excel. Reconoce automáticamente los encabezados como nombres de columna. Si la tabla está paginada, puede recorrer todas las páginas por ti.

Es muchísimo más eficiente que leer celda por celda con Get Text: una sola actividad te trae toda la tabla.

Localiza el <table> (o un contenedor con una tabla) por su selector y lo transforma en una DataTable. Si indicas nextPage (el selector del botón “siguiente”), la actividad hace clic en él y sigue extrayendo hasta que no haya más páginas o se alcance maxPages, consolidando todo en una sola tabla.

ParámetroEditorDescripción
selectorselectorEl elemento <table> (o un contenedor que lo contenga).
ParámetroEditorDescripción
pagesesiónLa sesión de página. Omítela dentro de un body; fuera, pasa = page.
nextPageselectorBotón de “página siguiente”. Si se indica, extrae todas las páginas.
maxPagesnúmeroMáximo de páginas a extraer. Por defecto 100.
timeoutnúmeroTiempo máximo por elemento en ms. Por defecto 30000.

Devuelve un DataTable con una fila por fila de la tabla y columnas nombradas según los encabezados.

Extraer un listado paginado de movimientos y recorrerlo:

Extract Table selector = (#tablaMovimientos) nextPage = (.btn-siguiente) maxPages = 10 → output: movimientos
Log message = = "Filas extraídas: " + rowCount(movimientos)
For Each items = = movimientos itemVariable = fila
└─ activities:
Log message = = str(fila["Fecha"]) + " — " + str(fila["Valor"])
  • Get Text — leer un dato suelto en vez de una tabla completa.
  • Scroll — para listados de “scroll infinito” (no paginados por botón).
  • For Each — recorrer las filas extraídas.