A veces, puede encontrarse con una situación tal que primero debe hacer clic en algunos elementos para mostrar la información oculta detrás. ¿Cómo scrape este tipo de datos?

Tomemos este sitio web como ejemplo: https://www.nastygal.com/black-croc-structured-mini-backpack/AGG77323.html

 

En este sitio web, si desea ver los datos en los campos "Detalles y cuidado" y "Envíos y devoluciones", debe hacer clic en las etiquetas respectivamente.

mceclip4.png

 

En este caso, si queremos extraer datos en "Detalles y cuidados", ¿cómo lo vamos a lograr?

Aquí hay dos formas de ayudarlo a lograrlo:

  1. Haga clic en la etiqueta para mostrar primero los datos y luego extraiga los datos que desee
  2. Si los datos se pueden encontrar en el código fuente de la página web, puede extraer datos directamente

 

1. Haga clic en la etiqueta para mostrar primero los datos y luego extraiga los datos que desee

  • Haga clic en la etiqueta "Detalles"
  • Seleccione "Elemento de clic" en el panel "Consejos de acción"
  • Desmarque "Reintento automático" para el elemento "Hacer clic" y haga clic en "Guardar"
    Octoparse ha detectado AJAX automáticamente. Puede ingresar el tiempo de espera de AJAX según su condición de red.
  • Luego, seleccione los datos y haga clic en "Extraer texto del elemento seleccionado" en el panel "Consejos de acción"
  • Haga clic en "Aceptar" para guardar

 

click_button.gif

¡Consejos!

Si desea obtener más información sobre AJAX, estos son los tutoriales relacionados que puede necesitar:

Si la nueva opción de pestaña se selecciona automáticamente, desactívela.

mceclip0.png

 

 

2. Si los datos se pueden encontrar en el código fuente de la página web, puede extraer datos directamente

  • Abra la página web con su navegador y luego haga clic derecho para seleccionar la opción "Inspeccionar elemento" para ver el código fuente

mceclip6.png

 

Del código fuente, podemos encontrar que aunque no hagamos clic en la etiqueta "Details and Care", aún podemos encontrar los datos correspondientes debajo de la etiqueta.

mceclip7.png

 

Ahora, podemos volver a Octoparse y continuar scraping.

  • Haga clic en el botón de cambio switch_browser.PNG en la esquina superior derecha del navegador incorporado para cambiar al modo de navegador
  • Haga clic en "Details and Care" para mostrar el contenido.
  • Haga clic en el botón de cambio nuevamente switch_browser.PNG para volver al modo de edición
  • Luego, puede seleccionar los datos y hacer clic en "Extraer texto del elemento seleccionado" en el panel "Consejos de acción"
  • Haga clic en "Aceptar" para guardar.

 

switch_browser_to_display.gif

 

¿Te resultó útil este artículo ¡ Contáctenos  en cualquier momento si necesita nuestra ayuda!