Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Cómo puedo extraer datos con una lista de URL?

Friday, April 17, 2020

 

1. Comprender el modo de bucle de lista de URL de Octoparse


Cuando sus datos deseados abarcan varias páginas que comparten la misma estructura de página, puede ingresar las URL de estas páginas en Octoparse para configurar un bucle. Octoparse cargará la URL una por una para raspar los datos de cada página.

  

 

2. Cantidad máxima de URL permitidas para ingresar


Le sugerimos que agregue no más de 10,000 URL para una tarea. Dependiendo de la longitud de las URL, este número sería ligeramente diferente.

Recibirá un error que indica lo siguiente cuando haya excedido el límite.

 

  

 

3. Inicie una nueva tarea con una lista de URL
- Ingrese su lista de URL

Cuando se agrega más de una línea de URL al cuadro URL de extracción, Octoparse ingresará al modo de bucle Lista de URL de forma predeterminada y creará un Elemento de bucle automáticamente.

 

 

- Establecer esperar antes de la ejecución

Para evitar que las URL se carguen de forma incompleta, podemos establecer un tiempo de espera antes de que se ejecute la acción (normalmente, 2 segundos funcionarán).

Opciones avanzadas> Esperar antes de la ejecución

 

 

 

4. Edite la lista de URL que ingrese


Después de ingresar la lista de URL, aún puede modificarlas.

Opciones avanzadas> Lista de URL

 

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse