undefined

Step-by-step tutorials for you to get started with web scraping

Download Octoparse

¿Cómo puedo extraer datos con una lista de URL?

Friday, April 17, 2020

 

1. Comprender el modo de bucle de lista de URL de Octoparse


Cuando sus datos deseados abarcan varias páginas que comparten la misma estructura de página, puede ingresar las URL de estas páginas en Octoparse para configurar un bucle. Octoparse cargará la URL una por una para raspar los datos de cada página.

  

 

2. Cantidad máxima de URL permitidas para ingresar


Le sugerimos que agregue no más de 10,000 URL para una tarea. Dependiendo de la longitud de las URL, este número sería ligeramente diferente.

Recibirá un error que indica lo siguiente cuando haya excedido el límite.

 

  

 

3. Inicie una nueva tarea con una lista de URL
- Ingrese su lista de URL

Cuando se agrega más de una línea de URL al cuadro URL de extracción, Octoparse ingresará al modo de bucle Lista de URL de forma predeterminada y creará un Elemento de bucle automáticamente.

 

 

- Establecer esperar antes de la ejecución

Para evitar que las URL se carguen de forma incompleta, podemos establecer un tiempo de espera antes de que se ejecute la acción (normalmente, 2 segundos funcionarán).

Opciones avanzadas> Esperar antes de la ejecución

 

 

 

4. Edite la lista de URL que ingrese


Después de ingresar la lista de URL, aún puede modificarlas.

Opciones avanzadas> Lista de URL

 

 

Download Octoparse to start web scraping or contact us for any
question about web scraping!

Contact Us Download
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar