Resource
Tutoriales paso a paso para ayudarlo a comenzar con el web scraping
Descargar Octoparse
El botón "Siguiente" para la paginación no siempre está disponible y la paginación en algunos sitios web puede hacerse por números de página.
(Consulte el tutorial de extracción de varias páginas haciendo clic en “Next” )
Entonces, en este caso, para extraer varias páginas de datos, necesitaremos modificar el XPath del paso "Hacer clic para paginar" y hacer que siempre ubique el siguiente número.
(por ejemplo, está en la página #1 y tendría que ubicar la página #2 para que siempre pueda hacer clic en la página siguiente para fines de paginación).
(Consulte el tutorial completo de extracción de varias páginas por enlaces de número de página )
Después de hacer clic en la página 1 y crear un bucle de paginación, cree un nuevo XPath para la acción "Hacer clic para paginar". La sintaxis XPath "following-sibling" se usa con mayor frecuencia para este caso para seleccionar todos los hermanos después del nodo actual. (Obtenga más información sobre la ubicación de elementos con XPath )
Aquí hay un ejemplo de XPath:
A continuación, reemplace la XPath generada automáticamente del bucle de paginación con una nueva XPath.
¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!
Company
Producto
Recurso
Company
Product
Recurso