Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Por qué el "Loop Item" solo funcionó para el primer elemento?

Monday, April 20, 2020

Pregunta:

Creé un "Loop Item" para scrape la lista, pero solo el primer elemento se scraped al ejecutar la extracción local. ¿Por qué el "Elemento de bucle" solo funcionó para el primer elemento?

 

Responder:

La razón es que la página de listado aplica técnicas de Ajax. Hay dos métodos para resolver este tipo de problema:

  1. Agregue un paso "Go To Web Page" como el último paso en el "Loop Item" para volver a abrir la página de listado.
    Aquí hay un ejemplo de flujo de trabajo:


mceclip0.png

 

  1. Si hay un botón en las páginas de detalles para volver a la página de listado, debe hacer clic en el botón, es decir, agregar un paso "Click Item" como el último paso en el "Elemento de bucle" para volver a la página de listado.

      Aquí hay un ejemplo de workflow:
mceclip1.png

  1. Si está extrayendo una lista de datos en un "Loop Item" y no marca la casilla "Use Loop" en Opciones avanzadas, Octoparse no extraerá los datos uno por uno en el "Loop Item", sino que solo extraerá el primer articulo. Por lo tanto, debe marcar la casilla "Use Loop" para extraer todos los datos.mceclip0.png 
¡Consejos!

Más aplicaciones para usar "Loop Item", consulte:

Cuándo seleccionar "Use Loop"!


 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse
Utilizamos cookies con el fin de mejorar tu experiencia de navegación. Lee sobre cómo utilizamos cookies y cómo puedes administrarlas mediante hacer clic en configuración de cookies. Si continúas navegando en este sitio web, significa que aceptas nuestro uso de cookies.
Aceptar Rechazar