Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Cómo manejar la paginación con números de página?

Friday, April 17, 2020

 

El botón "Siguiente" para la paginación no siempre está disponible y la paginación en algunos sitios web puede hacerse por números de página.

(Consulte el tutorial de extracción de varias páginas haciendo clic en  “Next” )

 

 

 

 

Entonces, en este caso, para extraer varias páginas de datos, necesitaremos modificar el XPath del paso "Hacer clic para paginar" y hacer que siempre ubique el siguiente número.

(por ejemplo, está en la página #1 y tendría que ubicar la página #2 para que siempre pueda hacer clic en la página siguiente para fines de paginación).

(Consulte el tutorial completo de extracción de varias páginas por enlaces de número de página )

 

 

 

Después de hacer clic en la página 1 y crear un bucle de paginación, cree un nuevo XPath para la acción "Hacer clic para paginar". La sintaxis XPath "following-sibling" se usa con mayor frecuencia para este caso para seleccionar todos los hermanos después del nodo actual. (Obtenga más información sobre la ubicación de elementos con XPath )

Aquí hay un ejemplo de XPath:

 

 

A continuación, reemplace la XPath generada automáticamente del bucle de paginación con una nueva XPath.

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse