Todas las colecciones
Tutorial de Casos
Trabajo
Scrape la información del trabajo de Indeed
Scrape la información del trabajo de Indeed
Actualizado hace más de una semana

Indeed es uno de los sitios web de publicación de trabajos más populares. Con web scraping, puedes descubrir el valor de toneladas de información laboral. En este tutorial, te mostraremos cómo usar Octoparse para scrapear los puestos de trabajo de Indeed.com.

Antes de comenzar, necesitamos obtener la URL de la página de resultados de destino buscando una palabra clave y una ubicación.

A continuación se muestra una URL de ejemplo para demostración:

La forma más fácil de scrapear el sitio web es ir a "Plantillas de tarea" en la pantalla principal de Octoparse y comenzar directamente con la Plantilla Indeed para ahorrar tu tiempo. Simplemente ingresa la URL en la plantilla y ya puedes esperar a que salgan los datos. Para más detalles, puedes consultar: Plantillas de Tarea

1__1_.png

Si quieres saber cómo construir la tarea desde cero, puedes continuar leyendo el siguiente tutorial.

Estos son los pasos principales de este tutorial: [Descargar archivo de tareas aquí]

1) Ir a la página web - abrir la página web de destino

  • Ingresa la URL en la página de inicio y haz clic en "Iniciar"

    1.1.png

2) Detectar automáticamente la página web - crear el flujo de trabajo

  • Haz clic en "Detectar automáticamente los datos de la página web" en el panel de Tips y espera a que se complete la detección.

2.gif
  • Ve a "Vista previa de datos" para ver si estás de acuerdo con la salida actual de datos

    • Puedes eliminar los campos de datos innecesarios directamente haciendo clic en el icono

      mceclip13.png
    • También puedes modificar los nombres de los campos de datos aquí directamente haciendo clic en el icono

      mceclip14.png
2.1.png
  • Haz clic en "Crear flujo de trabajo".

2.2.png

3) Configurar el tiempo de espera para "Extraer datos" - controlar la velocidad de raspado

  • Haz clic para abrir la configuración de acción de "Extraer datos"

  • Configura el tiempo de espera como 1-2 s

3.gif

4) Iniciar extracción - ejecutar la tarea y obtener datos

  • Haz clic en "Guardar"

  • Haz clic en "Ejecutar" en la parte superior izquierda

  • Selecciona "Run task on your device" para ejecutar la tarea en tu computadora, o selecciona "Run task in the cloud" para ejecutar la tarea en la nube (solo para usuarios del plan premium)

4.png

Aquí tienes una muestra de datos.

mceclip2.png
¿Ha quedado contestada tu pregunta?