Primera parte: Extracción de datos con octoparse
Primero, necesitamos extraer datos actualizados sobre Corea de los CDC. Siéntase libre de practicar solo con el archivo del rastreador.
La extracción de datos consta de 3 pasos:
- Paso 1: Construya una tarea de scraper ingresando la URL
- Paso 2: haga clic para extraer los datos web
- Paso 3: Ejecute la tarea del raspador
¿Suena fácil verdad? ¡Pues es muy fácil!
Primero, pegue la URL web en el cuadro después de hacer clic en el "Modo Avanzado". Luego haga clic en "Guardar URL" para continuar. Cargará la página web en su navegador incorporado para que haga clic y extraiga.
A continuación, haga clic en cualquier celda de la tabla y siga la guía que aparece en el panel "Consejos de acción". Elija "Seleccionar todos los subelementos", luego haga clic en "Seleccionar todo". ¡Felicidades! Simplemente creamos un raspador con éxito. Ahora deberíamos confirmar el paso haciendo clic en "Extraer datos en el bucle".
Por último, pero no menos importante, haga clic para ejecutar el scraper.
A medida que completamos la obtención de los datos, podemos exportar a un formato de Excel y usarlo para crear una visualización de mapa. Entiendo cómo los datos pueden quedar obsoletos fácilmente con el tiempo, especialmente para los datos urgentes. En este punto, puede aprovechar su programador para poner su tarea en piloto automático.