Tutoriales paso a paso para ayudarlo a comenzar con el web scraping

Descargar Octoparse

Lección 2: Conociendo Octoparse

Wednesday, March 11, 2020

En este tutorial, presentaremos la interfaz de usuario de Octoparse Versión 7.X. Al final de lectura, debe saber exactamente dónde comenzar una nueva tarea, dónde verificar sus datos cuando se realiza la extracción y, lo más importante, dónde obtener ayuda cuando la necesita. Es un paso esencial para que cualquiera se familiarice con la interfaz de usuario de Octoparse para prepararse para una experiencia de web scraping. ¡Hagamos un recorrido rápido por Octoparse V7.0!

 

La interfaz de usuario de Octoparse tiene dos partes principales: la barra lateral de navegación y la pantalla principal. Al hacer clic en cualquier elemento del menú de navegación de la barra lateral, accederá a una nueva pestaña en la pantalla principal.

 

 

Dashboard es la consola principal donde administrará todas sus tareas, como comenzar, detener tareas o establecer horarios para cualquier tarea. También verá el progreso de cualquier tarea en ejecución y podrá acceder fácilmente a los datos extraídos aquí.

 

 

¡Consejos!

 

1. Haga clic   en para cambiar el nombre de la tarea fácilmente.

2. Utilice la gestión de tareas de procesamiento por lotes en la parte inferior, inicio de lotes/eliminar/exportar tareas

Tools proporciona ayuda adicional con la generación XPath, expresión regular, exportación a bases de datos y API de datos.

Tutorials incluyen una gran cantidad de aprendizajes asociados con todas las funciones de Octoparse, así como muchos tutoriales paso a paso para scrape página web avanzada.

El Servicio de datos  se ocupa de sus solicitudes de eliminación de datos si está buscando ayuda adicional, como el servicio de configuración de tareas o el servicio de entrega de datos.

Póngase en contacto con el soporte para cualquier pregunta relacionada con la obtención de datos con Octoparse o cualquier otra consulta.

¡Consejos!

 

1. Para saber el estado de su cuenta y la fecha de vencimiento,desplace el ratón sobre el nombre de usuario de su cuenta.

2. Justo debajo del nombre de usuario de la cuenta, tenemos dos íconos útiles: haga clic en  para comenzar una nueva tarea o haga clic en para modificar la configuración de la cuenta.

3. Haga clic en para contraer el menú lateral.

4. Siempre puede configurar el Modo de flujo de trabajo para que sea el modo predeterminado al inicio de una nueva tarea accediendo a la configuración de la cuenta.

 Ahora, comencemos rápidamente una nueva tarea y revisemos la interfaz de configuración de la tarea. 

 

1) El Modo de selección

 

 

El Modo de Selección de Octoparse es nuevo en la versión 7.0 y está diseñado para capturar fácilmente cualquier información web con simples clics. Haga clic en el campo de datos deseado para capturar y seleccionar la acción para realizar desde el panel Acción, ya sea capturar el texto o crear una lista. Una vez que haya hecho clic en cualquier elemento de la página, Octoparse predice y detecta de manera inteligente los datos que desea capturar y le brinda todas las acciones disponibles para elegir.

¡Consejos!

1.  Haga clic en para minimizar el panel Acción.

Octoparse modo de selección le dará un comienzo fácil para cualquier trabajo de web scraping. Si desea ver cómo se configura la tarea desde el principio o verificar el paso anterior para ver si se agregó correctamente ¿Que hace? Esto se hace cambiando al modo de flujo de trabajo.

 

2.Cambie entre el modo de selección y el modo de flujo de trabajo utilizando el botón de encendido y apagado ubicado en la esquina superior derecha.

 


2) El modo de flujo de trabajo

 

El Modo de flujo de trabajo ofrece mucha más flexibilidad sobre cada paso individual en el flujo de trabajo se puede personalizar aún más para lograr la acción correspondiente, como agregar tiempo de espera, ajustar para AJAX y muchos más.

 

The Diseña de flujo de trabajo muestra explícitamente cómo se conecta una acción a la siguiente. Todas las acciones de extracción se pueden arrastrar y agregar al flujo de trabajo manualmente. Al hacer clic en cada paso del flujo de trabajo, puede ver fácilmente cómo Octoparse está interactuando con el sitio web y si los campos de datos de destino se pueden extraer como se esperaba.

 

 

Ahora ya está todo listo para comenzar a obtener algunos datos con Octoparse.

 

Lección 3: Obtención de datos - Captura texto de una página

¡Descargue Octoparse para iniciar el web scraping o contáctenos para cualquier
pregunta sobre el extracción de datos!

Contáctenos Descargarse