Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Por qué Octoparse solo hace clic en el primer elemento en un bucle y se detiene?

Tuesday, March 31, 2020

A veces, puede encontrar el problema con una tarea en la que Octoparse extrae solo el primer elemento y se detiene para recorrer otros elementos. De hecho, se puede considerar que Octoparse no puede volver a la página de la lista después de extraer datos de la página de detalles. Este problema podría dividirse en dos situaciones diferentes.

 

1. La página de detalles no está configurada para abrirse en una pestaña nueva.


Haga clic en "Click Item" y encontrará una opción avanzada llamada "Nueva pestaña". Debe hacer clic en la "Nueva pestaña" y volver a crear los siguientes pasos.

 

 

 ¡Consejos!

Recuerde volver a crear los pasos que siguen al "Elemento de clic" porque Octoparse necesita identificar una nueva página para extraer y los pasos anteriores no funcionarían.

 

 

2. El sitio web aplica AJAX para actualizar la información o no es compatible con Octoparse.


Si Octoparse aún no puede funcionar aunque haga clic en "Nueva pestaña", el sitio web aplica AJAX o es incompatible con Octoparse. La página cargada con AJAX cubrirá la anterior, por lo que Octoparse no puede acceder al siguiente elemento para raspar. El problema de compatibilidad se relaciona con la compatibilidad de aplicaciones y la adaptabilidad entre Octoparse y los sitios web que desea raspar. En este caso, debe dividir su tarea en dos pasos. Extraiga las URL de la página de detalles con Octoparse en primer lugar y luego scrape los datos que desee con la lista de URL. Si es nuevo en la extracción de listas de URL, siga este video tutorial para obtener más información. [Haga clic aquí]

 

 

Puede seguir estos pasos para verificar manualmente si Octoparse puede regresar a la página de lista una vez que ingresa a la página de detalles.

1. Haga clic en "Ir a la página web" para abrir el sitio web.

2. Haga clic en el cuadro "Elemento de bucle" en su flujo de trabajo.

3. Haga clic en "Haga clic en Elemento" para abrir la página de detalles.

4. Haga clic en "Elemento de bucle" nuevamente y vea si Octoparse puede regresar a la página de la lista. De lo contrario, debe seguir los pasos anteriores para revisar su flujo de trabajo.

 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse