Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

¿Qué es la tarea principal y la tarea secundaria en Octoparse?

Wednesday, April 29, 2020

 

P: ¿Qué es una tarea principal (parent task) y una tarea secundaria (child task)?

R: En Octoparse, puede asociar más de 2 tareas (menos de 100 tareas) por el campo de "URL" en el campo extraído, lo que significa que la tarea anterior puede proporcionar URL para la siguiente tarea. La tarea que proporciona la URL se denomina "Tarea principal"(parent task), mientras que la tarea que utiliza las URL de una tarea principal se denomina "tarea secundaria"(child task).

 

 

P: ¿Cómo configurar la tarea principal?

R:

1) Si la tarea secundaria está lista, edite el "Loop Item". Este elemento de bucle no tiene que ser el primer paso, también funciona en los pasos posteriores.

mceclip6.png

 

Cuando llegue a esta página, seleccione "Input from task". Luego seleccione la tarea principal correcta y el campo URL en el menú desplegable.

mceclip5.png

Luego, ha transferido correctamente las URL de una tarea principal a una tarea secundaria.

 

 

2) Si la tarea secundaria no está lista. Ve a construir tu crawler con el modo avanzado.

mceclip7.png

Estamos en esta página nuevamente. Haga las elecciones correctas para los menús desplegables y "Guardar URL".

mceclip8.png

 

Si la tarea principal aún no tiene ningún resultado, una ventana emergente le indicará que copie algunas URL para guardar la configuración.

mceclip0.png

 

Hasta ahora, ha realizado dos tareas asociadas. Octoparse proporciona cuatro opciones de ejecución (como se muestra en la imagen a continuación) para ejecutar las tareas. Por ejemplo, si selecciona "Ejecutar tarea tan pronto como se inicie su tarea principal", una vez que Octoparse lea cualquier URL extraída en la tarea principal, transferirá automáticamente la URL a la tarea secundaria y configurará la tarea para que se ejecute.

 

 

 

¡Consejos!

1. Input URLs de otra tarea solo son compatibles con Octoparse Cloud Extraction 

2. Cuando no haya datos extraídos en la tarea principal, para comenzar a configurar la tarea secundaria, deberá pegar manualmente al menos una URL.

3. Marque Batch URL input  si desea obtener más información sobre las formas de ingresar URL.

 

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse