Para continuar, es posible que desee utilizar esta URL en el tutorial:
https://finance.yahoo.com/cryptocurrencies?count=50&offset=0
https://finance.yahoo.com/cryptocurrencies?count=50&offset=50
https://finance.yahoo.com/cryptocurrencies?count=50&offset=100
Es difícil crear paginación en Yahoo Finance. Sin embargo, cuando recorremos las páginas, siempre podemos encontrar algunos patrones de esas URL de diferentes páginas y convertir el problema de paginación como un problema de entrada por lotes.
En este caso, después de agregar "?count=50&offset=0" detrás de la URL original del sitio web (https://finance.yahoo.com/cryptocurrencies), podemos abrir la página con las primeras 50 líneas de información.
Rasparemos datos como el Símbolo y el Nombre del gráfico de criptomonedas con Octoparse.
Estos son los pasos principales de este tutorial: [Descargar el archivo de tareas aquí ]
- "Ir a la página web" - para abrir la página web objetivo
- Cree un "Elemento de bucle" para extraer en bucle cada elemento en cada fila
- Extraer datos - para seleccionar los datos para la extracción
- Guardar e iniciar extracción - para ejecutar la tarea y obtener datos
1. "Ir a la página web" - para abrir la página web objetivo
- Haga clic en "+ Tarea" para comenzar una nueva tarea
- Pegue la URL en el cuadro "URL de extracción" y haga clic en "Guardar URL" para continuar
¡Consejos!
Octoparse puede generar las URL con el mismo formato automáticamente con la función
"Generar por lotes":
Consulte este tutorial para obtener más detalles: Entrada de URL de lote
2. Cree un "Elemento de bucle" para extraer en bucle cada elemento en cada fila.
- Haga clic en el nombre del "Bitcoin USD" en la primera línea.
- Haga clic en el icono
en el panel "Consejos de acción"
Octoparse seleccionará automáticamente el elemento. El elemento seleccionado se resaltará en verde mientras que otros elementos con la misma estructura se resaltarán en rojo.
Los datos presentes en forma de tabla. Por lo tanto, queremos extraer por filas en lugar de por columnas. Expandir el área nos ayudará a seleccionar las filas.
- Haga clic en "Seleccionar todos los subelementos" y luego haga clic en "Seleccionar todo" para crear una lista de bucles
Octoparse detectará todos los subelementos con estructuras similares.
- Haga clic en "Extraer datos en el bucle"
3. Extraer datos - para seleccionar los datos para la extracción
Después de hacer clic en "Extraer datos en el bucle", Octoparse extraerá todos los elementos seleccionados en la misma fila.
- Edite el nombre seleccionando el nombre de los nombres de lista predefinidos o cree por su cuenta
Edite el nombre seleccionando el nombre de los nombres de lista predefinidos o cree por su cuenta
Aquí hay una muestra de los nombres de los campos.
4. Guardar e iniciar extracción - para ejecutar la tarea y obtener datos
- Haga clic en "Iniciar extracción" en el lado superior izquierdo
- Seleccione "Extracción local" para ejecutar la tarea en su computadora, o seleccione "Extracción en la nube" para ejecutar la tarea en la nube (solo para usuarios premium)
Aquí está la salida de muestra: