Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Cómo seleccionar una opción específica de la lista desplegable?

Thursday, April 23, 2020

Sucede con bastante frecuencia para extraer datos de una lista desplegable. A veces estás contento de obtener todas las opciones en la lista. A veces, es posible que solo necesite una o varias opciones específicas. Este artículo le mostrará cómo seleccionar cualquiera de las opciones de la lista o especificar opciones.

En pocas palabras, XPath lo cambia todo. Escribir una XPath correcta es la forma más rápida de localizar la opción correcta.

 

Consejos.

Puedes comenzar a aprender desde aquí:

Herramienta Octoparse Xpath

Localizar elementos con XPath

Elementos de video-localización con XPath

  

Aquí hay algunos ejemplos de cómo modificamos el XPath para seleccionar lo que queremos.

Tome la siguiente URL como ejemplo: 

https://www.zazo.de/eliquids/zazo/493/zazo-5-1-gratis-paket-10ml-flaschen

Aquí hay una lista desplegable y contiene muchas opciones.

mceclip0.png

En primer lugar, debemos recorrer toda la lista desplegable.

0.gif

 

 

Por lo tanto, la XPath predeterminada del "Loop item" es "//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION". Como podemos ver, hay 366 elementos dentro de la lista desplegable.

1.png

 

Para satisfacer nuestras necesidades, debemos modificar el XPath para el "Loop Item":

1. Elija una opción específica por su índice

Por ejemplo, si queremos seleccionar la quinta opción que es "Ananas 8mg", la XPath correcta debería ser:

//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION[5]

Si reemplaza la lista de Variables con el nuevo XPath, verá que aparece la quinta opción.

2.png

 

 

 

2. Elija una opción específica por su texto

Por ejemplo, si queremos seleccionar solo "Banana 0mg", la XPath correcta debería ser:

//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION[text()='Banana 0mg']

3.png

 

Si queremos seleccionar todas las opciones que contienen "Banana", la XPath correcta debería ser:

//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION[contains(text(),'Banana')]

6.png

 

 

3. Elija una opción específica por su posición

Si queremos seleccionar todas las opciones excepto la primera, la XPath correcta debería ser:

//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION[position()>1]

Podríamos usar ">", "=", '<' después de "position()" para ajustar según nuestra necesidad.

 

4.png

 

Si queremos seleccionar solo la última opción, la XPath correcta es:

//DIV[@class='js--fancy-select field--select js--is--focused']/SELECT[1]/OPTION[last()]

5.png

Aproveche al máximo el XPath y se sorprenderá de lo flexible que puede ser el menú desplegable.

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse
Utilizamos cookies con el fin de mejorar tu experiencia de navegación. Lee sobre cómo utilizamos cookies y cómo puedes administrarlas mediante hacer clic en configuración de cookies. Si continúas navegando en este sitio web, significa que aceptas nuestro uso de cookies.
Aceptar Rechazar